阿里云ET城市大腦所要解決的世界級(jí)難題,正在催生出一系列世界級(jí)的技術(shù)。1月8日,全球權(quán)威機(jī)器視覺算法排行榜KITTI刷新了排名,阿里巴巴人工智能研究機(jī)構(gòu)iDST奪得行人檢測單項(xiàng)冠軍。于此同時(shí),在知名的行人再識(shí)別數(shù)據(jù)集Market1501中,他們也取得重大突破,首位命中率提升至96.17%,位居世界第一。
行人檢測、行人再識(shí)別是交通管理、城市平安、無人駕駛等領(lǐng)域的兩項(xiàng)核心基礎(chǔ)技術(shù)。
行人檢測要求機(jī)器能夠從圖像或者視頻中判斷是否有行人,行人在哪里;行人再識(shí)別則要求機(jī)器能夠識(shí)別出特定人員在不同攝像頭下出現(xiàn)的所有圖像。在景區(qū)商場人流預(yù)測、人群個(gè)性化分析、行人交通安全、無人駕駛、尋找丟失老人兒童等應(yīng)用上,這兩項(xiàng)技術(shù)可以發(fā)揮巨大的作用。
這并非簡單的人臉識(shí)別。阿里巴巴iDST副院長、IEEE Fellow華先勝說,在實(shí)際的城市場景下,大多數(shù)攝像頭拍攝到的圖像看不清人臉,但通過行人的整體和局部特征則可實(shí)現(xiàn)人員的識(shí)別。然而,實(shí)際場景中遮擋、光照、拍攝角度、拍攝距離、人物姿態(tài)等因素的變化,以及攝像頭設(shè)備的不同,對(duì)行人檢測和行人再識(shí)別的準(zhǔn)確性提出了極大的挑戰(zhàn)。
為了解決這一難題,華先勝領(lǐng)導(dǎo)的機(jī)器視覺團(tuán)隊(duì)采用了多項(xiàng)技術(shù)創(chuàng)新:
在行人檢測技術(shù)方面,他們提出了基于目標(biāo)尺寸分級(jí)的級(jí)聯(lián)網(wǎng)絡(luò),并充分發(fā)揮感興趣區(qū)域的上下文信息,提升網(wǎng)絡(luò)特征提取的能力,以解決行人檢測問題中存在的目標(biāo)尺寸浮動(dòng)大、遮擋、形變且定位不準(zhǔn)等問題;與此同時(shí)在目標(biāo)定位方面采用交叉熵正則約束來優(yōu)化邊框定位準(zhǔn)確度。
在行人再識(shí)別方面,他們不僅利用最新的深度學(xué)習(xí)技術(shù)提取行人的全局特征,還提出了超分辨率模塊和深度注意力網(wǎng)絡(luò)來獲得頭部、軀干、四肢、攜帶物等局部細(xì)節(jié)特征,并提出了融合粗粒度全局特征和細(xì)粒度局部特征的新方法,進(jìn)一步提高了跨攝像頭場景下行人表征的一致性和行人再識(shí)別的準(zhǔn)確性。
除了行人檢測、行人識(shí)別之外,iDST還長期占據(jù)著KITTI的車輛檢測世界冠軍,他們?cè)谟?jì)算機(jī)視覺國際頂級(jí)期刊和會(huì)議TIP、ACM MM等發(fā)表多篇論文,與世界分享中國技術(shù)。
目前,這些技術(shù)已經(jīng)全部集成到阿里云ET城市大腦當(dāng)中,并在多地落地使用。華先勝說,“正如60年代的登月計(jì)劃帶來了通訊技術(shù)、生物工程技術(shù)大爆發(fā)一樣,城市大腦已經(jīng)成為世界頂尖的科技創(chuàng)新的平臺(tái),前所未有的難題倒逼科學(xué)家們創(chuàng)造前所未有的技術(shù)”。不久前,城市大腦正式成為國家四大人工智能開放創(chuàng)新平臺(tái)之一,未來將吸引全球頂尖的研究機(jī)構(gòu)共同參與創(chuàng)新。
據(jù)了解,阿里云ET城市大腦已經(jīng)在杭州、蘇州、衢州、烏鎮(zhèn)等地落地。得益于精良的機(jī)器視覺算法,杭州城市大腦可以做到準(zhǔn)確偵測、發(fā)現(xiàn)交通事故,日均事件報(bào)警500次以上,準(zhǔn)確率達(dá)92%。
掃一掃在手機(jī)上閱讀本文章