亚愽娱乐app

    當前位置:首頁 > 科學傳播 > 科普文章

科普文章

劉成林:從模式識別到類腦研究

  • 發表日期:2016-04-21 【 【打印】【關閉】
  •   “人工智能”(artificial intelligence)概念最早由JohnMcCarthy 等在1956 年的達特矛斯會議上提出:人工智能就是通過計算機編程使機器實現類人智能行為。在60年的發展中,人工智能取得了巨大進步,現如今,人工智能技術應用在現實生活中的方方面面。 

      在過去20多年中,互聯網搜索、視頻監控、交通調度、語音識別、人臉識別、人機交互、機器翻譯等技術應用的背后都有人工智能做支撐。雖然大數據的出現和計算能力的提高不斷推動著人工智能向前發展,但面對時下盛行的“人工智能熱”,保持頭腦的冷靜非常必要,因為人工智能雖然發展迅速,但還有巨大的進步空間,還有很多挑戰性問題有待解決。 

      我們邀請到了亚愽娱乐app研究員、模式識別國家重點實驗室主任劉成林對人工智能領域的模式識別和類腦智能研究進行全方位解讀。 

     

      模式識別:“慧眼”看世界 

      隨著20世紀40年代計算機出現,50年代人工智能興起,(計算機)模式識別在20世紀60年代初迅速發展并成為一門新學科。模式識別是指對表征物體或現象的各種形式數據(主要是感知數據,如圖像、視頻、語音等)進行處理和分析,以對物體或現象進行描述、分類和解釋的過程,是信息科學和人工智能的重要組成部分。“隨著計算機硬件的發展,模式識別的關注度不斷提高,模式識別技術發展也日臻完善,在許多領域中已有成功應用。”多年來一直從事模式識別研究的劉成林介紹稱,金融、安全、醫學、航空、互聯網、工業產品檢測等領域中都滲透著模式識別技術。 

      劉成林指出,模式識別有2個層面的含義:一是生物體(主要是人腦)感知環境的模式識別能力與機理,屬于心理學和認知科學范疇;二是面向智能模擬和應用,研究計算機實現模式識別的理論和方法,屬于信息科學和計算機科學領域的范疇。模式識別基礎理論(模式表示與分類、機器學習等)、視覺信息處理(圖像處理和計算機視覺)、語音語言信息處理(語音識別、自然語言處理、機器翻譯等)是模式識別領域的三大主要研究方向。劉成林解釋,模式識別是人工智能的一個分支領域。人工智能是通過計算使機器模擬人的智能行為,主要包括感知、思維(推理、決策)、動作、學習,而模式識別主要研究的就是感知行為。在人的5大感知行為(視覺、聽覺、嗅覺、味覺、觸覺)中,視覺、聽覺和觸覺是人工智能領域研究較多的方向。模式識別領域主要研究的是視覺和聽覺,而觸覺主要是跟機器人結合。文字識別、互聯網有害信息檢測、語音識別、生物特征識別(虹膜識別、指紋識別、掌紋識別、人臉識別等)都是目前發展較為成熟的模式識別技術。 

      模式識別和人工智能在20世紀60年代分離為不同的領域,21世紀以來出現重新融合的跡象。近年來,深度學習和大數據的出現推動了模式識別的快速發展,但劉成林認為這一領域還有巨大進步空間,一方面基礎理論研究進展不大,另一方面有很多挑戰性應用問題有待解決。談及模式識別的未來,他表示,目前以深度學習為代表的主流方法有3個明顯的不足:一是需要大量的標記樣本進行監督學習,這勢必增加模式識別系統開發中的人工成本;二是模式識別系統的自適應能力差,不像人的知識和識別能力是隨著環境不斷進化的;三是模式識別一般只進行分類,沒有對模式對象的結構解釋。 

          

      人工智能新進展:深度學習 

      機器學習是人工智能的一個重要方面,簡單來講,它是使機器通過從數據學習獲得模型和知識(也就是獲得智能)的過程。深度學習(deep learning)是機器學習的一個新的分支和一類重要方法,其主要思想是對多層人工神經網絡進行學習獲得自動特征提取和模式識別能力。在劉成林看來,深度學習快速發展和廣泛應用主要得益于3方面的基礎:一是深度學習理論和算法的提出,二是計算能力(主要是GPU并行計算)快速提高,三是大數據的出現。 

      2006 年,神經網絡領域泰斗級人物GeoffreyHinton 在《Science》上發文首次提出深度學習的概念,掀起了一股新的研究浪潮。“簡單說來,深度學習就是深度神經網絡的學習。”劉成林說,在近幾年的發展過程中,深度學習在圖像識別和語音識別領域取得了巨大的成功。通過類腦神經系統結構的神經網絡,深度學習可以解決許多實際問題。深度學習發展的10年時間中,隨著GoogleFacebookAmazon、微軟、百度等的加入更是加速了深度學習的發展,目前深度學習已經廣泛應用到網絡搜索、圖像識別、語音識別、文字識別、無人駕駛等領域并且帶給人類前所未有的體驗。深度學習在許多領域帶來機器智能水平的突破性提高,讓人覺得機器智能通過圖靈測試不是那么可望而不可及了。 

      20163月與圍棋九段李世乭進行對戰的谷歌圍棋軟件AlphaGo就是應用了深度學習的技術;在計算機視覺領域里面,最前沿的是對視頻內容的理解(人物、目標、行為的分析和理解),劉成林說,這里面也用到了深度學習的方法;語音和語言信息處理領域目前性能最好的方法也是利用了深度學習。 

     

      類腦智能研究初探 

      近年來,隨著計算機科學、神經科學和神經網絡理論的發展,面對大數據時代對智能計算的需求,以及傳統人工智能速度學習方法的不足,科學家開始將研究重點投向類腦智能,即腦啟發的智能(brain-inspired intelligence)。劉成林說,從目前研究情況來看,人類對大腦神經結構和功能的研究有了很大的進步,同時認知科學領域對人的智能行為(包括學習、記憶、注意、推理、決策等)機理有深入研究。這使得從大腦神經系統結構和認知行為機理獲得啟發,研制具有更強信息表示、處理和學習能力的智能計算模型與算法成為可能。類腦智能就是以計算建模為手段,受腦神經機理和認知行為機理啟發,并通過軟硬件協同實現的機器智能。類腦智能系統在信息處理機制上類腦,認知行為和智能水平上類人,其目標是使機器以類腦的方式實現各種人類具有的認知能力及其協同機制,最終達到或超越人類智能水平。 

      用人工神經網絡模擬大腦的智能計算功能,早在20世紀40年代就開始了研究。劉成林說,人工神經網絡可以算是類腦計算的一個模型,它是對大腦神經系統的一種粗糙的模擬,建立的分層神經網絡系統與實際大腦的結構有一定差距,但是這種粗糙的模擬在人工智能領域已經發揮了巨大的作用。現在建立的神經網絡系統層數比較多,算法與過去相比也復雜很多。20世紀80年代,隨著多層神經網絡訓練的誤差反向傳播算法(BP算法)得到推廣,人工神經網絡已經是模式識別和人工智能領域應用較為廣泛的方法,其研究和應用形成了一個熱潮。在20世紀90年代,隨著泛化能力更強的支撐向量機出現,神經網絡再次走向低潮。2006年,憑借深度學習的提出和廣泛應用,人工神經網絡再次躋身人工智能領域最前沿之列。 

      從大方向講,類腦智能研究主要有硬件和軟件2 個方面。”劉成林說,軟件研究又有2個角度,一是使智能計算模型在結構上更加類腦,另外一方面是在認知和學習行為上更加類人。2個角度的研究都會產生有益的模型和方法。比如,模擬人的少樣本和自適應學習,可以使智能系統具有更強的小樣本泛化能力和自適應性。 

      硬件方面的研究主要是研發類腦新型計算芯片,如神經網絡計算芯片,目標是相比當前的CPUGPU計算架構,提高計算效率和降低能耗。目前人工神經網絡主要在通用計算機上編程來實現,能耗比較高。例如一臺計算機的功率大概是200~300 W,一臺GPU服務器的能耗至少是2000 W,而人腦的功耗只有20 W。所以劉成林說,計算機實現大規模人工神經網絡的能耗非常高,因此研發新型的神經網絡計算芯片,降低能耗,具有重要的現實意義。 

      提到未來的類腦智能研究,劉成林認為應該在結構類腦和行為類人方面更加深入。目前不管是神經結構模擬還是學習行為模擬都是比較粗淺的。以學習為例,當前主流的監督學習是比較“粗暴”的學習方式,即一次性給予大量的類別標記數據對人工神經網絡進行訓練,而要收集大量標記數據是要付出很大代價的。人腦的學習具有很強的靈活性,從小樣本開始,不斷地隨環境自適應。這種學習靈活性應該是未來機器學習的一個主要研究目標。 

      談及目前中國即將上馬的“中國腦計劃”(“腦科學與類腦研究”),劉成林透露,中國腦計劃的基本框架是一體兩翼:一體是腦認知功能研究,從腦科學和神經科學角度研究腦神經結構和認識功能;兩翼是腦科學應用研究,一是腦疾病的診斷、預測、治療,另一方面是類腦智能研究。劉成林還展望,將來類腦智能和當前主流的基于傳統計算的人工智能方法將并行發展,相互取長補短。另外,從應用的角度,人與機器協同工作,人的智能與機器智能互補也是一個必然趨勢。 

    (本文原載《科技導報》2016年第7期)