從識人(rén)到識物 AI公司轉向新(xīn)戰場 - 南(nán)京電子(zǐ)商(shāng)務協會

上(shàng)周，聯發科在深圳發布了(le)主打AI性能(néng)的新(xīn)一(yī)代Helio P90系統單芯片，搭載全新(xīn)超強AI引擎APU2.0，在這款被稱之爲“全球首款AI識物芯片”的背後，站(zhàn)着一(yī)衆人(rén)工智能(néng)視覺公司，包括商(shāng)湯、曠視、碼隆科技等。

　　識“物”正在成爲AI公司的新(xīn)戰場，尤其是一(yī)些(xiē)從人(rén)臉識别起家的AI公司而言，在人(rén)臉識别陷入同質化(huà)階段時，識“物”正在成爲新(xīn)的技術藍海。“從數量來說，包括商(shāng)品在内的物品，要遠比人(rén)臉更多，想象空間也(yě)更大。”碼隆科技副總裁劉念一(yī)語道破AI公司的識物“玄機”。

　　人(rén)臉識别領域同質化(huà)競争加劇

　　計算(suàn)機視覺領域的技術廣泛，其中人(rén)臉圖像識别是先行普及的方向，并先後湧現出雲從、商(shāng)湯、曠視、依圖、雲天勵飛等人(rén)工智能(néng)創業公司,在AI熱潮中受到追捧。

　　雲從科技正是其中的典型。其以人(rén)臉識别爲核心技術入口，乘着“AI的翅膀”，在銀行、公安、民(mín)航等領域不斷快(kuài)速擴張，還通過參與公安部重大課題研發“火(huǒ)眼人(rén)臉大數據平台”等智能(néng)化(huà)系統，産品在全國大部分(fēn)省（市(shì)、區）上(shàng)線“實戰”。

　　不過，在人(rén)工智能(néng)框架開源、算(suàn)法越來越成熟的情況下(xià)，人(rén)臉識别領域的同質化(huà)競争更加激烈，一(yī)些(xiē)AI公司亟待拓寬“護城河(hé)”。

　　“人(rén)臉識别很難保持持久的領先優勢。”雲從科技高級副總裁伍楚芸在接受南(nán)方日報記者專訪時表示，如(rú)果單純在人(rén)臉識别上(shàng)競争，雖然一(yī)開始差距挺大的，但(dàn)到最後，隻是99.8%和98.9%準确率的差異，大部分(fēn)應用場景上(shàng)這點差異率影響并不大，而雲從要做的是從感知、認知到決策的閉環，圍繞“人(rén)”這個主題，不單單隻是識别人(rén)臉，還要認識這個人(rén)，從他們的神态、步态、衣着等領域進行識别，從而更好(hǎo)(hǎo)地熟悉這個人(rén)。

　　AI識物成商(shāng)業化(huà)新(xīn)方向

　　對不少AI公司來說，人(rén)臉識别隻是視覺AI領域中一(yī)項視覺認知技術，AI物體識别如(rú)今已廣泛應用在智能(néng)零售的商(shāng)品識别，智能(néng)冰箱的食材識别與智能(néng)汽車的道路(lù)标識、行人(rén)、車輛等識别。

　　有鑒于此，AI芯片尤其是AI識物芯片受到青睐，提供支持的技術力量也(yě)風起雲湧。聯發科無線通訊事(shì)業部産品總監李彥輯在發布會上(shàng)介紹，“聯發科P90此次搭載的NeuroPilot2.0平台是更加完整開放(fàng)的EDGE AI平台，不論是和國外最前沿的谷歌(gē)、微軟合作(zuò)，還是和國内最領先的商(shāng)湯、曠視、虹軟、碼隆深入共同探索，最終目的是一(yī)起實現更好(hǎo)(hǎo)的AI用戶體驗”。

　　作(zuò)爲深圳一(yī)家本土(tǔ)成長起來的AI視覺公司，碼隆科技則爲這款芯片提供了(le)AI物體識别算(suàn)法，在Helio P90高性能(néng) APU下(xià)實現了(le)30毫秒(miǎo)的實時識物，解決了(le)高延遲的用戶痛點。不僅如(rú)此，通過将AI算(suàn)法在芯片中進行集成，可以最大限度地提高視覺識别的速度、穩定性、安全性和隐私性，并在應用場景上(shàng)擁有很大的擴展空間，從而推動手機等智能(néng)終端，以及終端應用實現更好(hǎo)(hǎo)的用戶體驗。

　　目前，碼隆科技嵌入Helio P90芯片的物體識别技術已經集成了(le)針對服飾的識别，可以準确識别衣物的類别、款式、風格、元素等特征，将有力地支持Helio P90從本地端更好(hǎo)(hǎo)地服務于智能(néng)手機廠商(shāng)以及視頻和圖像等應用領域。

　　物體識别技術，尤其是商(shāng)品識别技術，正作(zuò)爲人(rén)工智能(néng)視覺領域的重要商(shāng)業化(huà)方向，在零售、工業、芯片、智能(néng)終端等領域都有廣闊的應用空間和發展前景。

　　自助結賬、智能(néng)貨櫃、無人(rén)超市(shì)……在人(rén)工智能(néng)AI應用的諸多場景中，零售行業是人(rén)們感知最爲真切的領域。在人(rén)工智能(néng)的展望場景中，零售是現階段AI視覺技術運用較爲成熟的領域，随着線上(shàng)線下(xià)業務流程的結合，零售行業也(yě)是未來5-10年内智能(néng)升級發生(shēng)的地方。

　　對圖片視頻分(fēn)析将催生(shēng)新(xīn)巨頭

　　AI識物技術，也(yě)讓AI公司不滿足于新(xīn)興初創公司的标簽，而有了(le)更大的挑戰“野心”。

　　“我們知道在文本信息的時代，谷歌(gē)擁有最厲害的文本信息分(fēn)析技術，因此它成爲了(le)巨頭。而5G時代，圖片、視頻分(fēn)析的龐大技術需求，也(yě)肯定會催生(shēng)出大體量公司，地位不亞于現在的谷歌(gē)。”商(shāng)湯科技聯合創始人(rén)、副總裁楊帆告訴南(nán)方日報記者，目前計算(suàn)機視覺産業從視頻中提取的要素通常有人(rén)臉、人(rén)體、衣物、步态、車輛等，未來，視頻将成爲最重要的信息載體，因爲它涵蓋的有效信息量最多。

　　有鑒于此，近年來商(shāng)湯已經開始在多方面進行探索，并提供了(le)一(yī)系列解決方案。例如(rú)針對傳媒行業，包括爲長視頻、影視劇或圖片提供視頻标簽、明星識别、商(shāng)标識别和服飾識别等功能(néng)，推動媒體資産精細化(huà)管理(lǐ)，助力客戶在理(lǐ)解圖像及視頻内容業務上(shàng)實現智能(néng)化(huà)；能(néng)夠實現色情内容過濾、暴力識别、廣告過濾、敏感文字過濾等全方位審核過濾，爲視頻圖片内容審查提供高效的智能(néng)工具。

　　盡管市(shì)場非常廣闊，但(dàn)難點也(yě)非常大。“對于訓練數據的收集是最大難點。”楊帆表示，個體識别不太可能(néng)，也(yě)沒太大意義；品類識别的難點則在于品類太多，相當于每一(yī)個品類的物體識别做了(le)一(yī)個獨立的人(rén)臉檢測模型。

　　劉念也(yě)表示，識别物也(yě)遭遇到品類繁多的挑戰，即便是同一(yī)種物還會産生(shēng)諸多變形，例如(rú)針對衣服這樣的柔性物體，可以想象一(yī)個服裝模型就(jiù)是一(yī)個時尚專家，衣服變成什(shén)麽樣它都能(néng)識别出來，這就(jiù)非常考驗AI公司與産業相結合的精細化(huà)程度。“我們一(yī)般一(yī)個大分(fēn)類的物品會單獨建模，比如(rú)服裝、家居、商(shāng)超商(shāng)品等，這個模型在不同場合可以複用。如(rú)果精确度要求特别高的還會再單獨細分(fēn)建模。AI技術一(yī)定要與産業化(huà)結合，不能(néng)玩(wán)虛的。”