視覺AI爲傳統産業裝上(shàng)“智慧之眼”
2018-12-27 08:53:20

       12月(yuè)(yuè)22日,素有“逃犯克星”稱号的張學友在江門市(shì)舉辦演唱會,不出意外,又有一(yī)名在逃人(rén)員在演唱會上(shàng)落網。據不完全統計,今年在張學友演唱會被抓捕的在逃人(rén)員約25名,其他犯罪嫌疑人(rén)約68名。

  這背後,是基于深度學習的人(rén)臉識别算(suàn)法“立功”。人(rén)工智能(néng)(AI)不僅可以識人(rén),還可以識物。在深圳碼隆科技展廳的無人(rén)售貨機,消費者掃碼打開櫃門、取出商(shāng)品、關上(shàng)櫃門,系統自動結算(suàn)。相比傳統的自動售貨機,不再需要把商(shāng)品“規規矩矩”擺列,消費者也(yě)不用隔着玻璃點擊購買。

  在計算(suàn)機視覺領域,先後湧現出雲從、商(shāng)湯、曠視、依圖、雲天勵飛等人(rén)工智能(néng)創業公司,它們從人(rén)臉圖像識别起步,進而在新(xīn)零售、工業、芯片、智能(néng)終端等領域走出各自差異化(huà)道路(lù),打開了(le)廣闊的應用空間和發展前景。

  搶占攝像頭入口城市(shì)大腦裝上(shàng)“智慧之眼”

  在深圳,超過2萬民(mín)警使用的警務雲終端上(shàng),一(yī)款叫做雲天“深目”的動态人(rén)像App,經過一(yī)定的權限管理(lǐ)系統,民(mín)警們可以對犯罪嫌疑人(rén)在2秒(miǎo)内,檢索他從深圳的機場到地鐵,到南(nán)山、福田、羅湖、龍崗跨區域的活動軌迹,落地他的身(shēn)份、查詢他的前科。

  這套系統在深圳上(shàng)線後,就(jiù)協助公安破獲了(le)經偵、技偵、網警、打拐、緝私等等各類案件突破1萬多件,協助找到了(le)上(shàng)百名走失的兒童和老人(rén)。

  對很多人(rén)來說,安防監控并不陌生(shēng),但(dàn)傳統的安防監控雖然實現了(le)記錄功能(néng),但(dàn)不能(néng)準确識别視頻中的人(rén)、物和場景,民(mín)警往往需要花費大量的時間精力從海量的視頻監控中獲取到需要的信息。

  雲天勵飛依托“雲+端”人(rén)像智能(néng)解決方案,前端實現人(rén)臉檢測跟蹤、抓拍采集,後端引擎通過深度學習實現人(rén)像結構化(huà)特征值提取,結合人(rén)像識别應用平台實現動态、開放(fàng)、多場景下(xià)的人(rén)像精準識别和布控。“以前20個民(mín)警看一(yī)個星期的視頻,現在隻需要幾秒(miǎo)鍾就(jiù)可以完成。”雲天勵飛戰略規劃總監張旭媚說。

  而在張學友今年以來的演唱會中,就(jiù)有廣州雲從科技、雲眼大視界等AI公司“立功”的身(shēn)影。各大AI公司都在搶占安防市(shì)場,而攝像頭正成爲智慧城市(shì)的“入口”。張旭媚說,傳統攝像頭的安裝都希望架得高、輻射面積大,但(dàn)現在更清晰的人(rén)臉采集攝像頭架設更低(dī),在實際應用中,各家的算(suàn)法不同,對攝像頭的調試、架設的角度、高度标準以及售後服務等都不一(yī)樣,一(yī)旦搶先布局了(le)攝像頭,就(jiù)有一(yī)定的排他性,未來短期内不太可能(néng)再重新(xīn)架設一(yī)套攝像系統。

  盡管人(rén)臉識别站(zhàn)上(shàng)了(le)産業風口,但(dàn)對實戰要求卻很高。據了(le)解,在深圳舉行的高交會上(shàng),安檢門同時采用了(le)2套系統,分(fēn)别負責一(yī)個入口,結果其中一(yī)個系統崩潰了(le),因爲實驗室拍照的樣本非常清晰,但(dàn)實際中經常要側臉抓拍等方式,這和以前訓練的方式不一(yī)樣,時間一(yī)長系統承受不住了(le)。

  從“刷臉”跨向“識人(rén)”AI與用戶互動還能(néng)幫助決策

  人(rén)臉識别系統不僅可以“刷臉”,還在朝着“認識人(rén)”邁進。2018年10月(yuè)(yuè)底,雲從科技宣布,在語音(yīn)識别技術上(shàng)取得重大突破,他們融合圖像識别與語音(yīn)識别的優勢,推出全新(xīn)Pyramidal-FSMN語音(yīn)識别模型。

  在技術研究的“最後一(yī)公裏”,每0.1個百分(fēn)點的進步都異常艱難。全新(xīn)Pyramidal-FSMN語音(yīn)識别模型在全球最大的開源語音(yīn)識别數據集Librispeech上(shàng)刷新(xīn)了(le)世界紀錄,準确率提升到97.03%,将Librispeech的錯詞率降低(dī)至2.97%,超過阿裏、百度、約翰霍普金(jīn)斯大學等企業及高校(xiào),大幅刷新(xīn)原先紀錄。

  讓外界有些(xiē)不解的是,以人(rén)臉識别聞名的雲從科技,怎麽就(jiù)切入到了(le)語音(yīn)市(shì)場。事(shì)實上(shàng),語音(yīn)識别技術同樣是智能(néng)感知中一(yī)個重要的部分(fēn),通過語音(yīn)識别,機器(qì)可以像人(rén)類一(yī)樣聽懂說話,進而能(néng)夠理(lǐ)解、思考與反饋。

  “雲從的技術圍繞人(rén)爲主要方向,不僅僅是認識你的臉,還要認識你這個人(rén);不僅在人(rén)臉識别上(shàng)更快(kuài),而且能(néng)看出你的神态、步态、衣着。”雲從科技高級副總裁伍楚芸說,如(rú)果單純在人(rén)臉識别上(shàng)競争,雖然一(yī)開始差距挺大,但(dàn)最後隻是99.8%和98.9%準确率的差異,這點差異在大部分(fēn)應用場景上(shàng)可以忽略,而雲從要做的是從感知、認知到決策的閉環,雲從進軍語音(yīn)識别,從而更好(hǎo)(hǎo)地進行人(rén)機交互,“除了(le)我認識你,還要與你語音(yīn)互動,能(néng)聽懂你的意思,甚至還能(néng)幫助到你”。

  如(rú)今,用戶的需求也(yě)不僅僅局限于“美顔”,對人(rén)識别的要求還發展到了(le)美體。商(shāng)湯科技應用創新(xīn)AI技術,将AR識别和繪制能(néng)力從“臉部”延伸至“全身(shēn)”,在原創的SenseAR增強現實感繪制平台上(shàng),推出了(le)全新(xīn)功能(néng)模塊——SenseAR美體塑形,不僅可以針對頭、肩、腰、臀、腿等部位及身(shēn)高比例進行調整,還可以輕松實現一(yī)鍵式全身(shēn)美體塑形。

  從“識人(rén)”向“識物”邁進開拓一(yī)個智能(néng)識别的新(xīn)興市(shì)場

  在碼隆科技的展示區裏有一(yī)個顯示屏,當用戶路(lù)過攝像頭前屏幕上(shàng)就(jiù)會出現此人(rén)所穿衣服的種類、顔色和風格;而在無人(rén)售貨機的改造上(shàng),一(yī)個簡易貨櫃架上(shàng)一(yī)個普通攝像頭,1分(fēn)鍾就(jiù)可把普通貨櫃改造成智能(néng)貨櫃,而成本僅爲此前貨櫃的一(yī)半。

  “識物”正在成爲AI公司新(xīn)藍海。今年12月(yuè)(yuè),聯發科在深圳發布了(le)主打AI性能(néng)的新(xīn)一(yī)代Helio P90系統單芯片,在這款被稱之爲“全球首款AI識物芯片”的背後,站(zhàn)着一(yī)衆人(rén)工智能(néng)視覺公司,包括商(shāng)湯科技、曠視、碼隆科技等。

  碼隆科技嵌入Helio P90芯片的物體識别技術已經集成了(le)針對服飾的識别,可以準确識别衣物的類别、款式、風格、元素等特征,将有力地支持Helio P90從本地端更好(hǎo)(hǎo)地服務于智能(néng)手機廠商(shāng)以及視頻和圖像等應用領域。“從數量來說,包括商(shāng)品在内的物品,要遠比人(rén)臉更多,想象空間也(yě)更大。”碼隆科技運營副總裁劉念說。

  商(shāng)湯科技聯合創始人(rén)、副總裁楊帆說,計算(suàn)機視覺産業可以從圖片和視頻中提取的要素通常有人(rén)臉、人(rén)體、衣物、步态、車輛等,未來,圖片和視頻将成爲最重要的信息載體,因爲其涵蓋的有效信息量最多,而通過對這些(xiē)信息的分(fēn)析,也(yě)将誕生(shēng)新(xīn)興的科技巨頭公司。

  與傳統行業結合找差異化(huà)拓寬自身(shēn)邊界

  雲從、商(shāng)湯、依圖、曠視在計算(suàn)機視覺行業,AI公司風起雲湧、攻城略地,在走過了(le)最初安防領域的應用後,各大AI公司也(yě)在不斷拓寬自身(shēn)的邊界。

  在行業縱深方面,如(rú)在銀行業,雲從科技已成爲人(rén)臉識别應用的第一(yī)大供應商(shāng),未來還将逐步深入到更多業務領域,包括銀行智慧網點的轉型、銀行風控的管理(lǐ)提升等,以人(rén)臉識别業務爲切入點,利用人(rén)工智能(néng)技術幫助銀行業務的全面優化(huà)升級。

  而在最近的高交會上(shàng),雲天勵飛攜成功流片的AI芯片亮相,計劃在明年正式商(shāng)用。未來,雲天勵飛還将探索芯片商(shāng)業模式的創新(xīn),力推“芯片+服務”的新(xīn)模式,打造芯片共享平台。

  在橫向拓展方面,AI公司紛紛布局智慧零售、智慧社區、智慧教育等,由于落點不同,相互間避開了(le)同質化(huà)競争,如(rú)在零售領域,相比擅長做硬件的友商(shāng),雲從比較着重做零售大腦,軟件或平台相關等;雲天勵飛将線下(xià)信息結構化(huà),消費者在商(shāng)店(diàn)買了(le)哪些(xiē)東西(xī),其興趣點在哪兒,以前隻能(néng)通過互聯網建模的商(shāng)業模式,現在在線下(xià)也(yě)能(néng)做;今年5月(yuè)(yuè),商(shāng)湯還聯手華東師大,推出第一(yī)本人(rén)工智能(néng)教材,入局智慧教育。

  “AI一(yī)定要與行業結合才是有生(shēng)命力的。”劉念說,傳統行業與AI結合,需要數據确定模型,但(dàn)在服裝等行業連基本的數據都沒有,也(yě)沒有IT架構,“比如(rú)客戶和我們洽談的時候非常興奮,對AI的需要很強烈,但(dàn)一(yī)談到落地就(jiù)遇到很多問題,純視覺的方案根本解決不了(le),這都需要AI公司幫助企業将數據整理(lǐ)出來”。

  楊帆則表示,新(xīn)事(shì)物層出不窮,行業風口不斷變遷,但(dàn)回歸到事(shì)情本質其實是很簡單的,整個信息産業依然是非常關鍵的五個關鍵環節,分(fēn)别是對采集、傳輸、存儲、分(fēn)析計算(suàn)和反饋的利用、整合和技術的進步。AI公司雖然一(yī)開始比拼的是信息采集環節,在采集環節實現了(le)高度自動化(huà)後,比拼的是對信息的分(fēn)析和反饋,才能(néng)建立起一(yī)個完整的閉環,“攝像頭是非常重要的采集環節,也(yě)有一(yī)些(xiē)AI能(néng)力建立在攝像頭上(shàng),但(dàn)最重要的還是在後端,分(fēn)析環節将創造巨大價值。”

  專家點評:

  廣州市(shì)社會科學院産業所副研究員 陳峰

  政府應主動推進 數據資源整合 讓企業合規利用

  我國計算(suàn)機視覺從2010年開始加快(kuài)發展,目前市(shì)場已具備一(yī)定集中度,據IDC報告,2017年計算(suàn)機視覺“四小龍”——商(shāng)湯、依圖、曠視、雲從占總體市(shì)場份額高達近七成。安防、金(jīn)融、手機是計算(suàn)機視覺技術最大的應用場景,預計未來在醫療影像、自動駕駛、機器(qì)人(rén)、智能(néng)制造等場景下(xià),計算(suàn)機視覺技術應用前景廣闊。

  政府是加速人(rén)工智能(néng)技術落地應用的重要推動力量,爲進一(yī)步推動計算(suàn)機視覺産業的快(kuài)速健康發展,在讓市(shì)場在資源配置中起決定性作(zuò)用的前提下(xià),政府應積極有爲,在數據開放(fàng)和應用場景供給方面發揮統籌、引領作(zuò)用。

  大數據對促進計算(suàn)機視覺的識别與認識能(néng)力至關重要,所有的計算(suàn)機視覺企業都需要大量的數據來訓練、叠代自己的産品。在目前計算(suàn)機識别技術各家差别不大的情況下(xià),數據是業内企業發展的一(yī)個重要競争優勢來源。我國政府、央企手中掌握着全社會最大、最核心的數據。政府應積極主動推進數據資源的整合、開放(fàng)與應用,組織界定數據采集、應用的範圍和方式,出台公共數據采集與使用規範,明确相關主體的責權和義務,爲公共數據開放(fàng)掃清障礙;引導市(shì)場主體、各企業之間合法合規開展數據資源的合作(zuò)與交易;加快(kuài)研究、制訂相關法律法規,從法律層面到執行層面确保信息安全和個人(rén)隐私得到充分(fēn)尊重,爲計算(suàn)機視覺産業健康快(kuài)速發展創造條件。

  計算(suàn)機視覺是AI最熱門的融資領域,據不同機構的數據,計算(suàn)機視覺融資占AI的比重基本都能(néng)排進前三,其中人(rén)臉識别、圖像識别、視頻識别三大方向,是資本市(shì)場炙手可熱的明星,業内頭部企業——計算(suàn)機視覺“四小龍”,融資和估值節節攀升。但(dàn)是,回到技術落地和商(shāng)業變現,行業整體情況并不樂觀,絕大多數企業依然處于前期燒錢階段。目前,安防、金(jīn)融、交通是計算(suàn)機視覺技術商(shāng)業落地的主要應用場景,業務主要來自公安、機場、邊檢、海關、火(huǒ)車站(zhàn)、銀行等,政府在行業早期市(shì)場培育方面給予了(le)極大的支持。未來,政府在應用場景供給方面仍有很大的深化(huà)、優化(huà)空間,在智慧政務、智慧校(xiào)園、智慧醫療、智慧交通等領域,會有越來越多的應用場景被挖掘出來,各級政府在推進智慧城市(shì)建設、應用示範項目建設中,可将符合條件的計算(suàn)機視覺産品(服務)納入首購應用,支持計算(suàn)機視覺技術、産品、模式的應用推廣。