發(fā)明家們一直夢(mèng)想創(chuàng)造出能思考的機(jī)器。這種渴望至少可以追溯到古希臘時(shí)期。神話人物皮格馬利翁、代達(dá)羅斯和赫菲斯托斯都可以被解讀為傳奇發(fā)明家,而伽拉忒亞、塔洛斯和潘多拉都可以被視為人工智能生命。
1842年,可編程計(jì)算機(jī)首次被Lovelace構(gòu)想時(shí),人們就想知道這種機(jī)器是否會(huì)變得智能,這時(shí)距離第一臺(tái)計(jì)算機(jī)問世還有一百多年。今天,人工智能是一個(gè)蓬勃發(fā)展的領(lǐng)域,有許多實(shí)際的應(yīng)用和活躍的研究領(lǐng)域,可以看到當(dāng)下的智能軟件來自動(dòng)化例行工作、理解語音或圖像、在醫(yī)學(xué)上做出診斷、并支持基礎(chǔ)科學(xué)研究。
在人工智能的早期,該技術(shù)迅速解決了對(duì)人類難以處理但對(duì)計(jì)算機(jī)相對(duì)簡(jiǎn)單的問題——這些問題可以用形式的數(shù)學(xué)規(guī)則來描述。人工智能的真正挑戰(zhàn)是解決對(duì)人類來說容易但難以用數(shù)學(xué)描述的任務(wù)——直覺判斷,比如識(shí)別圖像中的口語或面孔。解決方案是讓計(jì)算機(jī)從經(jīng)驗(yàn)中學(xué)習(xí),并根據(jù)概念的層次結(jié)構(gòu)來理解世界,其中的概念都通過簡(jiǎn)單的關(guān)系來定義,通過從經(jīng)驗(yàn)中收集知識(shí)。這種方法避免了人類需要準(zhǔn)確描述計(jì)算機(jī)所需的所有知識(shí)。層次結(jié)構(gòu)使計(jì)算機(jī)能夠通過將簡(jiǎn)單概念構(gòu)建成復(fù)雜概念從而學(xué)習(xí)復(fù)雜的概念。如果我們繪制一個(gè)圖表,顯示這些概念是如何相互構(gòu)建的,那么這個(gè)圖表就很深,有很多層。因此,我們將這種人工智能方法稱為深度學(xué)習(xí),這些概念我們就稱為神經(jīng)元。
在深入了解深度學(xué)習(xí)之前,我們首先需要知道以下兩個(gè)問題的答案:
(1) 深度學(xué)習(xí)(Deep Learning)是什么?
通過上面的描述,我們可以得到以下結(jié)論:深度學(xué)習(xí)是人工智能的一個(gè)分支,它是一種通過模擬人腦神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)的算法。深度學(xué)習(xí)模型由多層神經(jīng)元組成,每層神經(jīng)元通過連接學(xué)習(xí)彼此之間的關(guān)系。
(2) 神經(jīng)網(wǎng)絡(luò)(Neural Networks)是什么?
神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)系統(tǒng)的計(jì)算模型。它由大量的神經(jīng)元組成,每個(gè)神經(jīng)元可以接受來自其他神經(jīng)元的輸入,并輸出一個(gè)值(如圖1)。神經(jīng)元之間的連接可以學(xué)習(xí)權(quán)重,這些權(quán)重決定了神經(jīng)元之間的關(guān)系。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以簡(jiǎn)單地比作一個(gè)水管網(wǎng)絡(luò)。水管網(wǎng)絡(luò)由一個(gè)個(gè)的水管組成,水管可以連接在一起,形成一個(gè)復(fù)雜的網(wǎng)絡(luò)。水管的直徑和長(zhǎng)度決定了水流的速度和流量。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)也是類似的。神經(jīng)元可以連接在一起,形成一個(gè)復(fù)雜的網(wǎng)絡(luò)。神經(jīng)元的權(quán)重決定了信息在網(wǎng)絡(luò)中流動(dòng)的速度和流量。神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)大量的數(shù)據(jù),來學(xué)習(xí)數(shù)據(jù)中的模式和規(guī)律。例如,神經(jīng)網(wǎng)絡(luò)可以用于識(shí)別圖像中的物體,翻譯語言,寫出文章等。
圖1 神經(jīng)網(wǎng)絡(luò)(Neural Networks)示意圖
與傳統(tǒng)人工智能相比深度學(xué)習(xí)有什么區(qū)別?傳統(tǒng)人工智能是指基于規(guī)則和邏輯的人工智能。傳統(tǒng)人工智能系統(tǒng)需要專家提供大量的規(guī)則和數(shù)據(jù),才能進(jìn)行學(xué)習(xí)和推理,例如1997年深藍(lán)在國(guó)際象棋比賽中戰(zhàn)勝卡斯帕羅夫就是基于傳統(tǒng)人工智能的,當(dāng)然,國(guó)際象棋是一個(gè)非常簡(jiǎn)單的世界,只有六十四個(gè)位置和三十二個(gè)只能按規(guī)則移動(dòng)的棋子。制定成功的國(guó)際象棋策略是一項(xiàng)偉大的成就,但挑戰(zhàn)不在于向計(jì)算機(jī)描述棋子和規(guī)則。國(guó)際象棋可以用簡(jiǎn)短且正式的規(guī)則列表來完全描述,程序員可以輕松的用編程語言提前告知計(jì)算機(jī)。而深度學(xué)習(xí)是基于數(shù)據(jù)的人工智能,通過學(xué)習(xí)大量的數(shù)據(jù)來掌握數(shù)據(jù)中的模式和規(guī)律。深度學(xué)習(xí)不需要專家提供規(guī)則,因此可以處理更復(fù)雜的數(shù)據(jù)和任務(wù)。
如今深度學(xué)習(xí)已經(jīng)在許多領(lǐng)域取得了巨大的成果,包括:
(1) 圖像識(shí)別:深度學(xué)習(xí)可以用于識(shí)別人臉、車輛、物體等。例如,谷歌的AlphaGo在圍棋比賽中戰(zhàn)勝了人類世界冠軍,數(shù)據(jù)的入口就是深度學(xué)習(xí)的圖像識(shí)別技術(shù)。
(2) 自然語言處理:深度學(xué)習(xí)可以用于語音識(shí)別、文本生成等。例如,微軟的Cortana可以通過語音進(jìn)行交流,最新的ChatGPT甚至可以實(shí)現(xiàn)雙向語音交互。
(3) 語音識(shí)別:深度學(xué)習(xí)可以用于語音識(shí)別、語音控制等。例如,亞馬遜的Alexa可以通過語音進(jìn)行控制。
(4) 機(jī)器翻譯:深度學(xué)習(xí)可以用于機(jī)器翻譯。例如,谷歌的翻譯軟件可以將文本從一種語言翻譯成另一種語言。
(5) 醫(yī)療診斷:深度學(xué)習(xí)可以用于醫(yī)療診斷。例如,深度學(xué)習(xí)可以用于識(shí)別癌癥等疾病,在醫(yī)療影像領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用。
深度學(xué)習(xí)是人工智能領(lǐng)域最活躍的研究領(lǐng)域之一。深度學(xué)習(xí)的未來發(fā)展方向主要有以下幾個(gè)方向:
(1) 提高模型的魯棒性和泛化能力。
(2) 開發(fā)更高效的模型訓(xùn)練方法。
(3) 擴(kuò)展人工智能的應(yīng)用領(lǐng)域。 |