面向世界科技前沿,面向國家重大需求,面向國民經濟主戰場,率先實現科學技術跨越發展,率先建成國家創新人才高地,率先建成國家高水平科技智庫,率先建設國際一流科研機構。

——中國科學院辦院方針

首頁 > 科研進展

軟件所在智能理論研究中取得進展

2020-08-26 軟件研究所
【字體:

語音播報

  近日,中國科學院軟件研究所智能軟件研究中心在人工智能基礎理論方面取得進展,在樹形神經網絡、風格遷移模型、小目標計數具體問題上提出新的解決方案。研究成果發表在人工智能領域會議CVPR 2020、ECCV 2020、ACM MM2020,并受邀完成線上學術報告,相關代碼已經開源。相關研究包括:

  注意力卷積二叉神經樹 

  細粒度分類的目的是對粗粒度的大類別進行更加細致的子類劃分。通常情況下,細粒度數據集中預先給定的標注往往依賴于專業人工標注,需專業的領域知識,所以標注的數量很少并且很難獲得。關鍵的判別力區域散布在細小區域,需要網絡進行定位的工作,而現有大多數的網絡將定位的工作與識別整合在一起,網絡缺乏捕獲判別力區域的能力。因此,亟待尋求能夠學習有效特征和區分難易特征的方法。

  針對這一問題,軟件所團隊將卷積神經網絡與軟決策樹策略相結合,提出一種二分類深度神經樹的細粒度圖像識別模型,該模型包括主干模型(backbone)、路由(router)、轉換(transformer)、預測(predictor)四種模塊構成。在特征提取的主干網絡上,選取VGG-16作為團隊的特征提取器,這一部分包括VGG-16的conv1-conv5的部分卷積層。在淺層利用路由進行二分類的預測輸出,將圖像預先做粗粒度分類,隨著樹的深度增加,類別的區分范圍不斷縮小,并在葉子節點處進行最終類別的輸出。借助這種由粗分逐漸到細分的方法,團隊在神經樹的邊上構造了由卷積算子構成的變換模塊,在不同的分支上利用卷積網絡進行特征學習,定位出具有判別力的區域特征,使每個葉子節點上的預測器測重關注圖像不同的區域。為加強不同分支對圖像多尺度特征的提取,團隊采取非對稱策略來安排轉換模塊在不同分支上的數量,而不同的分支之間起到了相互補充與促進特征學習的作用。在預測階段,團隊利用路由模塊預測值的累積作為該路徑被選擇的概率,相應的葉子節點的輸出則是該類別的預測概率分布。

  實驗結果顯示,在CUB-200-2011、Stanford Cars和Aircraft數據集上,基于深度神經樹的細粒度識別模型顯著優于當前其他的弱監督細粒度方法。相關成果以Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization為題,被CVPR 2020收錄。(代碼鏈接

  語義神經樹 

  現有的人體解析方法往往忽略人體結構中各部位之間固有的語義關系,把這種細粒度的分割任務看作常規的語義分割,這樣的操作易引起細小部位分割錯誤。此外,人體部位之間的尺度也存在相當大的差異,如人的雙腳、襪子等一般在圖像中占有很小比例甚至在圖像中不出現。

  針對這一問題,軟件所團隊提出一種基于深度神經樹來學習語義特征。多叉深度神經解析樹采用了一種層次關系,在淺層中,團隊先把圖像中的前景與背景進行識別,利用產生的掩碼信息作用在輸入數據上,產生新的前景信息將輸送到下一層模塊處理,在不同的層級上,團隊會將相應的部位識別并分割出來。此外,團隊還構造了融合模塊用來收集在不同的層級產生的結果,并將結果進一步優化調整,產生最終的分割預測結果。

  多叉神經語義解析樹利用隨機梯度下降(SGD)方法以端到端的方式進行訓練整個模型,具有收斂速度快,性能穩定的特點。在LIP、PASCAL-Person-Part、CIHP和MHPv2四個數據集上進行的單人和多人解析實驗,均證明了該方法的有效性。相關成果以Learning Semantic Neural Tree for Human Parsing為題,被ECCV 2020收錄。(代碼鏈接

  無監督域適應的空間注意金字塔網絡 

  域適應是解決目標域和源域數據分部有顯著差異的問題。巧妙進行遷移轉化,能夠顯著改善在目標域的實際使用效果。

  針對這一問題,軟件所團隊提出空間注意力金字塔機制,將域轉換的注意力集中在與任務相關的特定區域。此方法將特征圖用不同大小的窗口來提取均值特征,獲得特征金字塔,然后用軟注意力機制在不同金字塔特征之間的動態選擇,來指導最終的域轉換。

  實驗結果顯示,提出的方法在多個任務(目標檢測、實例分割、語義分割)中均取得領先的效果。相關成果以Spatial Attention Pyramid Network for Unsupervised Domain Adaptation為題,被ECCV 2020收錄。(代碼鏈接

  用于無人機目標檢測和計數的引導注意力網絡 

  檢測和計數是人工智能的基礎問題。在無人機場景中,受目標小、背景雜亂等復雜因素影響,通過無人機采集視頻進行目標檢測和計數具有極大的挑戰。

  針對復雜場景的小目標檢測和計數問題,軟件所團隊設計了一種新的基于特征金字塔的注意力網絡來處理目標檢測和計數任務。與以往依賴于無監督注意模塊的方法不同,團隊充分利用了背景和目標之間的弱監督信息,融合不同尺度的特征圖,獲得更語義化的特征表示。同時,前景模塊考慮了全局和局部外觀的目標,以方便準確定位。

  團隊設計了新的數據增強策略,用于在各種復雜場景下訓練魯棒模型,在UAVDT、CARPK和PUCPR+三個數據集上顯示了算法先進的檢測和計數性能。相關成果以Guided Attention Network for Object Detection and Counting on Drones為題,被ACM MM 2020收錄。(代碼鏈接

  以上成果論文通訊作者為軟件所副研究員張立波。相關研究得到中科院青年創新促進會、軟件所優秀青年科技人才計劃支持。

  卷積二叉神經樹模型

  基于語義神經樹的人體解析模型 

空間注意金字塔網絡

基于引導注意力機制的無人機檢測和計數模型

打印 責任編輯:程博

掃一掃在手機打開當前頁

© 1996 - 中國科學院 版權所有 京ICP備05002857號 京公網安備110402500047號

地址:北京市三里河路52號 郵編:100864

電話: 86 10 68597114(總機) 86 10 68597289(值班室)

編輯部郵箱:[email protected]

  • 久久电玩城官网下载 广西快三官网 疯狂飞艇靠谱吗 贵州茅台股票分析宏观经济分析 河南体彩11远5开奖结果 st股票涨跌幅限制 快乐十分规则奖金 pk10计划人工在线计划 股票配资怎么辨别实盘虚拟盘(假盘) 体彩大乐透中奖规则 胆码追踪双码 股票技术论坛 吉林体彩十一选五投注技巧 云南快乐十分开前三组遗漏 江苏十一选五一定牛手 平码固定规律 云南快乐十分开奖直播