中共中央政治局10月31日下午就人工智能發展現狀和趨勢舉行第九次集體學習。中共中央總書記在主持學習時強調,人工智能是新一輪科技革命和產業變革的重要驅動力量,加快發展新一代人工智能是事關我國能否抓住新一輪科技革命和產業變革機遇的戰略問題。要深刻認識加快發展新一代人工智能的重大意義,加強領導,做好規劃,明確任務,夯實基礎,促進其同經濟社會發展深度融合,推動我國新一代人工智能健康發展。總書記的講話在人工智能界引起了熱烈反響,給行業相關科研機構、科技企業以及從業人員帶來了極大鼓舞。業內人士熱情討論和交流,對人工智能的發展現狀及未來方向紛紛提出了看法。
“目前,人工智能技術(英文縮寫:AI)正處于從感知智能向認知智能的過渡發展階段。隨著技術和產業的深度融合,大量的人工智能產品(比如智能音箱、智能手表、智能車載設備等)被推向市場,語音交互將逐漸替代傳統的觸摸屏方式。我們迫切需要新一代技術推動AI向可理解、可解釋、可以和人類協同合作的方向發展,進而借助AI的大數據處理能力獲得新知識,實現人類的跨越式發展。”民諾科技CEO劉運興先生在談到“新一代人工智能技術”時向記者表達了如上觀點。他進一步解釋說:阿爾法狗大獲成功后,行業內掀起了深度學習的研究和應用熱潮。在這一階段,語音識別和圖像識別技術獲得極大發展,讓AI技術和產品快速落地。然而深度學習在解決推理和認知方面卻并不適應,原因是這種技術屬于“黑匣子”,它的運作機理人類無法理解,不可解釋,也無法進行知識的融合。就連DeepMind(阿爾法狗的開發團隊)的創始人哈薩比斯在《經濟學人》創新峰會上也表示,深度學習無法帶來通用人工智能。
人工智能的“昨天、今天和明天”
從技術層次上來說,人工智能大致可分為計算智能、感知智能、認知智能、超級智能四個發展階段。其中計算智能以強大算力和程序化為主要特點,“深藍”擊敗卡斯帕羅夫就是代表性事件。感知智能以機器學習技術作為支撐,主要應用在圖像識別和語音識別領域。近兩年出現的人臉識別安檢、語音指令查詢都屬于感知智能的應用場景。通俗地講,這類技術讓機器具備了“眼睛”和“耳朵”的功能。在認知智能階段,我們需要讓機器能夠理解人類語言和意識,能夠進行推理和判斷,并且機器的處理反饋可以被人類理解。比如蘋果的“SIRI”機器人、小米的“小愛同學”,以及應用在智能家居、智能可穿戴設備、智能車載設備上的各種語音助手,就是認知智能技術的一種雛形或者說初級應用。而超級智能是在認知智能技術發展成熟后,借助于機器在大數據領域的認知能力、處理速度、處理廣度等技術優勢,形成的機器全面超越人類個人能力的新階段。屆時,機器將開啟超級AI視角,就如以色列作家尤瓦爾·赫拉利在《未來簡史》中描繪的那樣“未來,人工智能從你出生那天就認識你,讀過你所有的電子郵件,聽過你所有電話錄音,知道你最愛的電影……”
當下,人工智能正處于從感知智能走向認知智能的過渡發展階段,許多國家都把發展人工智能上升為國家戰略。今年9月,美國國防部(英文縮寫:DARPA)發布了一條新聞,計劃在未來五年內投資20億美元用以推動AI在溝通理解和邏輯推理方面的研究。DARPA希望研究“機器人如何獲得像人類一樣的交流和推理能力”,核心目的是能夠更好地理解AI,打造“可解釋的AI”,并且更安全地將其推向大規模應用。因此,我國領導人同志關于“發展新一代人工智能技術”的講話具有深刻的戰略思想和行業指導意義。
新一代人工智能技術如何演變并實現破局?
關于新一代人工智能技術的發展方向目前在行業內仍然存在不同的觀點和聲音。民諾科技CEO劉運興的觀點是:縱觀人工智能技術的發展歷程,結合工程實踐當中的經驗和判斷,我們發現人工智能技術呈現出螺旋式上升的發展態勢和演變規律。
比如深度學習是當今最炙手可熱的基礎性技術,而它的前身“人工神經網絡”也曾兩次陷入低谷。然而不論是“神經網絡”還是后來的“深度學習”本質上都是由機器學習技術演變而來,無論發展到何種程度,都會存在自身的局限性(正如文章一開始所述)。在人工智能正在從感知時代向認知時代邁進的背景下,知識圖譜技術又將迎來發展的生機。
和神經網絡一樣,知識圖譜也曾經“三起三落”,從最初的本體論、語義網到后來的知識圖譜(2012由谷歌提出),這一進化過程還在持續。近幾年,國內外大公司都將重心放在了深度學習的研究和應用領域,知識圖譜技術發展相對緩慢。例如百度、搜狗早在2012年就分別推出了自己的知識圖譜技術(百度“知心”和搜狗“知立方”),然而這些年并未看到它們在該領域的創新成果和戰略布局。隨著機器認知時代的到來,我們迫切需要新一代知識圖譜技術來破局。
在介紹民諾科技的創新經驗和技術成果時劉運興談到“從2014年開始,我們就將發展新一代知識圖譜技術作為主要的技術方向和發展戰略,結合過去本體論、語義網方面的研究成果,通過創新本體模型設計,創新知識圖譜和自然語言理解的技術融合,強化機器對于自然語言的理解和推理能力,構造出以知識圖譜作為核心技術的機器閱讀系統。從本體論的角度出發,我們把整個世界看做是一個本體,然后進行數據化處理,通過知識推理和搜索引擎技術找出事物之間的聯系并推演事物之間的相互作用關系。這種技術可以很好的應用在金融、軍事、公共安全領域。民諾科技的早期成果主要在金融投資應用領域,比如在2015年我們開發的《蜂鳥數據1.0》(AI金融產品)可以實時閱讀并處理全網新聞資訊,識別金融領域中的投資風險、挖掘市場中潛在的交易機會并自動給出判斷依據,甚至可以推理新聞媒體和上市公司之間的相互關系并結合傳播路徑來判讀新聞的可靠性和真實性。因為蜂鳥數據的背后有一個強大的金融知識圖譜做支撐,它涵蓋了金融領域的各種金融機構、政策工具、產業鏈條、上市公司、產品服務、財經人物以及他們之間的各種關系,并且我們能通過這種關系來推理某一事件發生后對上市公司的影響以及辨別影響的傳導機制。我們的終極目標是構建一個有知識、會思考,能夠和人類相互理解和溝通、協同工作的通用智能系統(或者說AI超級大腦)。”