百度王海峰:百度大腦賦能(néng)各行各業 讓世界更加美好(hǎo)(hǎo)
2018-10-31 10:18:14

       人(rén)工智能(néng)改變世界正在成爲共識,但(dàn)人(rén)工智能(néng)現狀是怎樣的,如(rú)何才能(néng)真正讓人(rén)工智能(néng)改變世界?10月(yuè)(yuè)26日,在IKCEST 2018國際高端研討(tǎo)會上(shàng),百度高級副總裁、AI技術平台體系(AIG)總負責人(rén)、深度學習技術及應用國家工程實驗室主任王海峰對百度AI的核心——百度大腦進行了(le)詳細解讀,他表示,百度大腦是百度人(rén)工智能(néng)技術的集大成,不僅支撐着百度所有業務,更通過開放(fàng)賦能(néng),服務于社會各界、各行各業,助力行業變革與創新(xīn)。

   IKCEST 2018國際高端研討(tǎo)會由聯合國教科文組織和中國工程院共同主辦,圖靈獎得主Raj Reddy、中國工程院院士潘雲鶴等國内外知名學者參加。

   今年大會的主題聚焦“新(xīn)一(yī)代人(rén)工智能(néng)與知識服務”。百度是國内最早全面布局人(rén)工智能(néng)的企業,王海峰則是百度人(rén)工智能(néng)的奠基人(rén)和領導者。他認爲,“彙聚知識的人(rén)工智能(néng)可以變得更強大,實現對客觀世界的更深層認知,同時人(rén)工智能(néng)會把知識進行總結、凝練、擴展、傳承,兩者形成正循環,促進人(rén)工智能(néng)的發展。”

       百度大腦于2016年正式發布,如(rú)今發展至“多模态深度語義理(lǐ)解”的新(xīn)階段。會上(shàng),王海峰從知識、視覺、聽覺、語言等幾個方面解讀了(le)百度大腦的最新(xīn)進展,以及百度大腦全面開放(fàng)這些(xiē)能(néng)力,從深度學習框架、場景化(huà)AI能(néng)力、定制化(huà)訓練平台、到軟硬一(yī)體模組和解決方案等,助力各行各業應用人(rén)工智能(néng)。

   百度大腦構建了(le)完整的人(rén)工智能(néng)技術布局,包括語音(yīn)、視覺等感知技術和知識圖譜、自然語言處理(lǐ)等認知技術。随着人(rén)工智能(néng)技術的發展,知識成爲其進一(yī)步突破的重要基礎。王海峰表示,在多元語義知識方面,百度已經構建了(le)包含數億實體、數千億級事(shì)實的龐大知識圖譜。除了(le)由實體、屬性、關系構成的實體圖譜,百度還針對不同的應用場景和知識形态,構建了(le)關注點圖譜、事(shì)件圖譜、多媒體圖譜、行業知識圖譜等。現場,王海峰播放(fàng)了(le)一(yī)段智能(néng)客服爲用戶服務的音(yīn)頻,機器(qì)在與用戶的對話中,如(rú)人(rén)工客服一(yī)樣,聽清用戶的話、理(lǐ)解用戶的需求并推薦合理(lǐ)的服務,這背後是百度領先的語音(yīn)、自然語言理(lǐ)解技術,以及基于業務邏輯和行業知識構建的行業知識圖譜。

   讓機器(qì)像人(rén)一(yī)樣聽清并說話,從而實現自然的人(rén)機交互,首先要依賴于語音(yīn)技術。王海峰提到,百度領先的語音(yīn)技術包括融合聲學模型和語義理(lǐ)解等實現語音(yīn)語義一(yī)體化(huà)識别,構建基于深度學習的語音(yīn)合成系統,以及軟硬一(yī)體遠場語音(yīn)交互技術等。在用戶與“小度”的對話中,機器(qì)的聲音(yīn)不僅清楚流暢,還富有情感,和真人(rén)非常接近。

   視覺技術讓機器(qì)像人(rén)一(yī)樣觀察世界。王海峰介紹,百度大腦具備豐富的圖像識别體系,基于知識的視頻語義理(lǐ)解,以及由此實現的基于場景的視覺語義化(huà)技術。圖像識别是視覺技術的基礎,它讓機器(qì)能(néng)夠“看見”,視覺語義化(huà)技術則讓機器(qì)能(néng)“看懂”,并提煉出結構化(huà)語義知識。比如(rú)在零售場景中,視覺語義化(huà)技術通過識别人(rén)物、動作(zuò)、物品并關聯時間,将數字化(huà)的視頻轉化(huà)爲結構化(huà)的語義知識,既能(néng)實現顧客在無人(rén)超市(shì)購物的完整體驗,還可以幫助管理(lǐ)者分(fēn)析和優化(huà)超市(shì)的運營。

   自然語言理(lǐ)解技術緻力于讓機器(qì)更好(hǎo)(hǎo)地理(lǐ)解世界。王海峰以閱讀理(lǐ)解和對話理(lǐ)解爲例,介紹了(le)百度自然語言理(lǐ)解技術的新(xīn)進展。一(yī)方面,百度大腦基于閱讀理(lǐ)解能(néng)力,自動獲取并學習互聯網中的萬億網頁内容,汲取知識并凝練成知識圖譜,進而支持問答(dá)、推薦等應用,并在應用中積累和更新(xīn)知識,進一(yī)步提升機器(qì)閱讀理(lǐ)解能(néng)力;另一(yī)方面,百度大腦在與用戶對話交流的過程中沉澱和豐富知識,持續提升對話理(lǐ)解能(néng)力,實現與用戶之間自然流暢的交互。

   “百度大腦的各種能(néng)力,是由深度學習作(zuò)爲基礎支撐的,”王海峰介紹,百度自主研發的深度學習框架PaddlePaddle,是國内唯一(yī)一(yī)個開源開放(fàng)的深度學習框架。今年發布的PaddlePaddle3.0,除了(le)核心框架,百度還開放(fàng)AI Studio、EasyDL等平台,滿足更靈活、更廣泛的應用需求,讓開發者可以更平等便捷地獲取AI能(néng)力。

   百度大腦的技術能(néng)力在持續提升,同時面向合作(zuò)夥伴和開發者的開放(fàng)也(yě)越來越全面和深入,讓越來越多的行業和企業能(néng)夠低(dī)門檻地獲取AI能(néng)力,帶動各行各業的變革與創新(xīn)。比如(rú)醫療行業,百度大腦可以輔助醫生(shēng)更高效、便捷地篩查眼底、腫瘤等疾病;比如(rú)制造業,百度大腦幫助自動識别地闆瑕疵,提升質量檢測效果和效率,将工人(rén)從重複單一(yī)的工作(zuò)中解脫出來;語音(yīn)和自然語言處理(lǐ)等技術讓人(rén)們“動動嘴”就(jiù)能(néng)控制音(yīn)箱、電視等,豐富人(rén)們的家庭娛樂……借助AI的能(néng)力,各行各業在不斷提升效率,創造新(xīn)的價值。百度大腦也(yě)在改變普通大衆的生(shēng)活,人(rén)們動動嘴、拍張照片就(jiù)能(néng)搜索到想要的信息;百度地圖幫助用戶預測路(lù)況、規劃路(lù)線、躲避擁堵等,爲人(rén)們提供更加便捷、高效的出行服務。

   我們正在越來越清晰地感受到AI帶來的變化(huà),擁抱AI是大勢所趨。王海峰表示,“百度大腦将持續發展人(rén)工智能(néng)技術,推動知識的融合及應用,同時全方位開放(fàng),與行業深度結合,助力行業變革和社會經濟發展。”