從識人(rén)到識物 AI公司轉向新(xīn)戰場
2018-12-20 09:31:07

       上(shàng)周,聯發科在深圳發布了(le)主打AI性能(néng)的新(xīn)一(yī)代Helio P90系統單芯片,搭載全新(xīn)超強AI引擎APU2.0,在這款被稱之爲“全球首款AI識物芯片”的背後,站(zhàn)着一(yī)衆人(rén)工智能(néng)視覺公司,包括商(shāng)湯、曠視、碼隆科技等。

  識“物”正在成爲AI公司的新(xīn)戰場,尤其是一(yī)些(xiē)從人(rén)臉識别起家的AI公司而言,在人(rén)臉識别陷入同質化(huà)階段時,識“物”正在成爲新(xīn)的技術藍海。“從數量來說,包括商(shāng)品在内的物品,要遠比人(rén)臉更多,想象空間也(yě)更大。”碼隆科技副總裁劉念一(yī)語道破AI公司的識物“玄機”。

  人(rén)臉識别領域同質化(huà)競争加劇

  計算(suàn)機視覺領域的技術廣泛,其中人(rén)臉圖像識别是先行普及的方向,并先後湧現出雲從、商(shāng)湯、曠視、依圖、雲天勵飛等人(rén)工智能(néng)創業公司,在AI熱潮中受到追捧。

  雲從科技正是其中的典型。其以人(rén)臉識别爲核心技術入口,乘着“AI的翅膀”,在銀行、公安、民(mín)航等領域不斷快(kuài)速擴張,還通過參與公安部重大課題研發“火(huǒ)眼人(rén)臉大數據平台”等智能(néng)化(huà)系統,産品在全國大部分(fēn)省(市(shì)、區)上(shàng)線“實戰”。

  不過,在人(rén)工智能(néng)框架開源、算(suàn)法越來越成熟的情況下(xià),人(rén)臉識别領域的同質化(huà)競争更加激烈,一(yī)些(xiē)AI公司亟待拓寬“護城河(hé)”。

  “人(rén)臉識别很難保持持久的領先優勢。”雲從科技高級副總裁伍楚芸在接受南(nán)方日報記者專訪時表示,如(rú)果單純在人(rén)臉識别上(shàng)競争,雖然一(yī)開始差距挺大的,但(dàn)到最後,隻是99.8%和98.9%準确率的差異,大部分(fēn)應用場景上(shàng)這點差異率影響并不大,而雲從要做的是從感知、認知到決策的閉環,圍繞“人(rén)”這個主題,不單單隻是識别人(rén)臉,還要認識這個人(rén),從他們的神态、步态、衣着等領域進行識别,從而更好(hǎo)(hǎo)地熟悉這個人(rén)。

  AI識物成商(shāng)業化(huà)新(xīn)方向

  對不少AI公司來說,人(rén)臉識别隻是視覺AI領域中一(yī)項視覺認知技術,AI物體識别如(rú)今已廣泛應用在智能(néng)零售的商(shāng)品識别,智能(néng)冰箱的食材識别與智能(néng)汽車的道路(lù)标識、行人(rén)、車輛等識别。

  有鑒于此,AI芯片尤其是AI識物芯片受到青睐,提供支持的技術力量也(yě)風起雲湧。聯發科無線通訊事(shì)業部産品總監李彥輯在發布會上(shàng)介紹,“聯發科P90此次搭載的NeuroPilot2.0平台是更加完整開放(fàng)的EDGE AI平台,不論是和國外最前沿的谷歌(gē)、微軟合作(zuò),還是和國内最領先的商(shāng)湯、曠視、虹軟、碼隆深入共同探索,最終目的是一(yī)起實現更好(hǎo)(hǎo)的AI用戶體驗”。

  作(zuò)爲深圳一(yī)家本土(tǔ)成長起來的AI視覺公司,碼隆科技則爲這款芯片提供了(le)AI物體識别算(suàn)法,在Helio P90高性能(néng) APU下(xià)實現了(le)30毫秒(miǎo)的實時識物,解決了(le)高延遲的用戶痛點。不僅如(rú)此,通過将AI算(suàn)法在芯片中進行集成,可以最大限度地提高視覺識别的速度、穩定性、安全性和隐私性,并在應用場景上(shàng)擁有很大的擴展空間,從而推動手機等智能(néng)終端,以及終端應用實現更好(hǎo)(hǎo)的用戶體驗。

  目前,碼隆科技嵌入Helio P90芯片的物體識别技術已經集成了(le)針對服飾的識别,可以準确識别衣物的類别、款式、風格、元素等特征,将有力地支持Helio P90從本地端更好(hǎo)(hǎo)地服務于智能(néng)手機廠商(shāng)以及視頻和圖像等應用領域。

  物體識别技術,尤其是商(shāng)品識别技術,正作(zuò)爲人(rén)工智能(néng)視覺領域的重要商(shāng)業化(huà)方向,在零售、工業、芯片、智能(néng)終端等領域都有廣闊的應用空間和發展前景。

  自助結賬、智能(néng)貨櫃、無人(rén)超市(shì)……在人(rén)工智能(néng)AI應用的諸多場景中,零售行業是人(rén)們感知最爲真切的領域。在人(rén)工智能(néng)的展望場景中,零售是現階段AI視覺技術運用較爲成熟的領域,随着線上(shàng)線下(xià)業務流程的結合,零售行業也(yě)是未來5-10年内智能(néng)升級發生(shēng)的地方。

  對圖片視頻分(fēn)析将催生(shēng)新(xīn)巨頭

  AI識物技術,也(yě)讓AI公司不滿足于新(xīn)興初創公司的标簽,而有了(le)更大的挑戰“野心”。

  “我們知道在文本信息的時代,谷歌(gē)擁有最厲害的文本信息分(fēn)析技術,因此它成爲了(le)巨頭。而5G時代,圖片、視頻分(fēn)析的龐大技術需求,也(yě)肯定會催生(shēng)出大體量公司,地位不亞于現在的谷歌(gē)。”商(shāng)湯科技聯合創始人(rén)、副總裁楊帆告訴南(nán)方日報記者,目前計算(suàn)機視覺産業從視頻中提取的要素通常有人(rén)臉、人(rén)體、衣物、步态、車輛等,未來,視頻将成爲最重要的信息載體,因爲它涵蓋的有效信息量最多。

  有鑒于此,近年來商(shāng)湯已經開始在多方面進行探索,并提供了(le)一(yī)系列解決方案。例如(rú)針對傳媒行業,包括爲長視頻、影視劇或圖片提供視頻标簽、明星識别、商(shāng)标識别和服飾識别等功能(néng),推動媒體資産精細化(huà)管理(lǐ),助力客戶在理(lǐ)解圖像及視頻内容業務上(shàng)實現智能(néng)化(huà);能(néng)夠實現色情内容過濾、暴力識别、廣告過濾、敏感文字過濾等全方位審核過濾,爲視頻圖片内容審查提供高效的智能(néng)工具。

  盡管市(shì)場非常廣闊,但(dàn)難點也(yě)非常大。“對于訓練數據的收集是最大難點。”楊帆表示,個體識别不太可能(néng),也(yě)沒太大意義;品類識别的難點則在于品類太多,相當于每一(yī)個品類的物體識别做了(le)一(yī)個獨立的人(rén)臉檢測模型。

  劉念也(yě)表示,識别物也(yě)遭遇到品類繁多的挑戰,即便是同一(yī)種物還會産生(shēng)諸多變形,例如(rú)針對衣服這樣的柔性物體,可以想象一(yī)個服裝模型就(jiù)是一(yī)個時尚專家,衣服變成什(shén)麽樣它都能(néng)識别出來,這就(jiù)非常考驗AI公司與産業相結合的精細化(huà)程度。“我們一(yī)般一(yī)個大分(fēn)類的物品會單獨建模,比如(rú)服裝、家居、商(shāng)超商(shāng)品等,這個模型在不同場合可以複用。如(rú)果精确度要求特别高的還會再單獨細分(fēn)建模。AI技術一(yī)定要與産業化(huà)結合,不能(néng)玩(wán)虛的。”