CVPR2020 | 深蘭科技斬獲4項競賽冠軍、總共12個獎項
2020-06-222020年6月19日,全球計算機視覺頂級會議CVPR2020圓滿落幕,深蘭科技北京AI研發(fā)中心的DeepBlueAI團隊斬獲了NightOwls Detetection Challenge 2020 (Track 1:Pedestrian Detection from a Single Frame, Track 2:Pedestrian Detection from a Multiple Frames兩個賽道)、圖片+ (Track 1 -- task 1賽題)、NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge (PSNR 評價指標)共4個冠軍,還在CVPR2020其他賽題中獲得了4項亞軍、4項季軍,一共斬獲12項冠亞季軍。
其中,NightOwls夜間行人檢測的測試成果可與白天行人檢測結合,打造適用于不同天氣條件的全天候的行人檢測系統(tǒng),可提升深蘭目前的各類戶外防疫監(jiān)測產品的識別性能;圖片+ 挑戰(zhàn)賽的霧天條件下的物體檢測成果可用于智能熊貓公交車、掃路機的安全監(jiān)控、室外環(huán)境感知、輔助駕駛;NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge圖像恢復與增強挑戰(zhàn)中的超分辨率感知測試成果可以應用于圖像復原等領域。另外,還有多個競賽的解決方案可以應用在服裝行業(yè)、農業(yè)病蟲害防護等領域。
國際計算機視覺和模式識別大會(CVPR)一直有計算機視覺領域的「奧斯卡」之稱,憑借著嚴苛的競賽標準,成為全球AI領域團隊檢驗自身基礎研究成果的試金石。今年,受全球疫情影響,該賽事于6月14日-19日在線上舉辦,以深蘭科技等領軍的中國AI企業(yè)在比賽中大放異彩,向全球展示了中國AI的雄厚實力。
深蘭科技看重CVPR的比賽嚴謹和評比權威性,已連續(xù)多年出征CVPR,以此來檢驗自身的算法實力。今年,深蘭科技共參與了10個競賽項目,斬獲4項冠軍,總共12項冠亞季軍,較去年取得了更為驕人的成績。在全球經(jīng)濟跨入以AI為引領的第四次工業(yè)革命時代、中國聚焦AI「新基建」時,深蘭科技已做好了充分準備,獲得不俗成績的同時,也將秉持開放共享的態(tài)度,為中國AI行業(yè)輸出更多的新鮮血液,推動AI「新基建」發(fā)展。
下面,讓我們看看深蘭科技參加的10個賽道比拼,究竟有哪些挑戰(zhàn)難點及應用場景。
1
NightOwls Detetection Challenge 2020
2個冠軍、1個亞軍
夜間行人檢測,該比賽分為三個賽道:
賽道一:檢測夜間場景下單幀圖片中的行人
賽道二:借助當前幀及之前所有幀共同輔助檢測當前幀的行人
賽道三:檢測夜間場景下的行人、自行車、摩托車
難點:
1)所有數(shù)據(jù)集都是在車輛運動過程中采集的,當車速較快或者車輛與相機之間有相對運動時會產生運動模糊。同時又由于圖片場景都是光線較弱的夜間場景,因此圖片質量也相對較差。
2)夜間場景圖片色彩信息少。
3)圖片采集涵蓋了不同的城市和天氣條件,同以往用常用來訓練預訓練模型的數(shù)據(jù)集差異較大。
應用場景:24小時的行人監(jiān)測系統(tǒng)
2
圖片+ PRIZE CHALLENGE 第一賽道 任務1霧天條件下的物體檢測
冠軍
難點:
在特定條件,如惡劣的天氣或者光照條件等,可見性較差的環(huán)境中的魯棒性。即使是政府采用的商業(yè)化攝像機在惡劣的天氣條件下也顯得很脆弱。因此,迫切需要研究在何種程度上,在某種意義上可以應對這種具有挑戰(zhàn)性的視覺條件。
應用場景:安全監(jiān)控、室外環(huán)境感知、輔助駕駛
3
NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge
PSNR冠軍
圖像超分辨率是一項關鍵的計算機視覺任務,其目的是恢復低分辨的圖像內容,填充丟失的信息,以實現(xiàn)獲得一張高清的大分辨率圖像。團隊主要關注PSNR指標,在PSNR指標上,團隊取得第一名的成績,并且超越了去年的冠軍方案。
難點:
本次賽題對單張圖像以及極端超分辨率提出了挑戰(zhàn),即基于一組的低分辨率和相應的高分辨率圖像,以x16的放大因子對輸入圖像進行超分辨率(提高分辨率)。
應用場景:圖像復原
4
Plant Pathology 2020 - FGVC7
亞軍
本賽題旨在通過計算機視覺的方法,解決以下問題:
1)準確地判斷葉片是否健康
2)對于不健康的葉片,判斷其疾病的類別,有時一個葉片可能有多種疾病
難點:
1)數(shù)據(jù)集中涵蓋了不同的葉片的角度、光照、形狀、葉片年齡,數(shù)據(jù)相對復雜,對模型效果影響較大;
2)數(shù)據(jù)集中的疾病包含一些罕見的疾病,和一些新的癥狀,對模型提出新的挑戰(zhàn)。
應用場景:農業(yè)病蟲害分類
5
iMet Collection 2020 - FGVC7
亞軍
本賽題需要將紐約大都會藝術博物館中超過20萬件藏品的數(shù)字化圖像進行細粒度分類。
難點:
1)數(shù)據(jù)集總類別數(shù)比較多,超過3000個類別
2)圖片尺度分布差異比較大
應用場景:博物館、圖書館等館藏分類及搜索
6
BDD100K Multiple Object Tracking Challenge
亞軍
BDD100K是CVPR2020 Autonomous Driving WorkShop的一部分,是在最多樣化的駕駛條件下的大規(guī)模跟蹤挑戰(zhàn)任務。
難點:
需要參賽者預測出視頻中物體在時間維度上的關聯(lián),主辦方提供了2000個40秒在一天中的不同天氣條件下的完整注釋序列,數(shù)據(jù)集提供了具有復雜遮擋和消失物體重新出現(xiàn)的多種駕駛場景,需要為開發(fā)的MOT算法在真實場景中的可靠性提供了一個很好的測試場景。
應用場景:自動駕駛,Domain Adaption方向
7
Pixel SkelNetOn
季軍
像素骨架提取分析能對不同目標的二值化掩碼進行細化,克服傳統(tǒng)方法人工設置參數(shù)的不便。
難點:
如何從少量樣本中準確提取不同形狀的的骨架,存在一定的挑戰(zhàn)性。
應用場景:圖像細化
8
DeepFashion2 -- Track 2 Clothes Retrieval
季軍
由于在產業(yè)中的巨大潛力,時尚圖像檢索成為了活躍的研究課題。
難點:
DeepFashion2數(shù)據(jù)集包含 49.1 萬張圖像,13 種流行的服飾類別,擁有最豐富的任務定義和最大數(shù)量的標簽,由于巨大的變形、遮擋,以及消費者和商業(yè)圖像之間存在的服裝域的差異,如何進行準確的服裝搜索是一個大的挑戰(zhàn)。
應用場景:電商平臺服飾檢索功能
9
LIP--Track 3 Image-based Multi-pose Virtual Try-on Challenge
季軍
此任務針對基于圖像的多姿勢虛擬試穿。要求給定輸入的人圖像,以及期望的服裝圖像和人體姿態(tài),要求參與者設計算法以將期望的服裝轉移到人圖像并操縱人的姿勢。
難點:
1)多姿態(tài)虛擬試穿,以往會有相關算法要求固定輸入圖片的姿勢,而此賽道姿勢各異,不僅要考慮到服裝因素,還需考慮姿態(tài)因素。
2)生成算法較難收斂,容易導致loss爆炸。
應用場景:服飾行業(yè)的虛擬試穿
10
iMaterialist (Fashion) 2020 at FGVC7
季軍
本賽題通過時裝界和計算機視覺界的聯(lián)合,引入一個新的細粒度分割任務。提出的任務將服裝屬性的分類和服裝部件分割統(tǒng)一起來,這是邁向實際應用的重要一步。
難點:
服裝視覺分析需要能夠從圖片中識別服裝產品及其相關屬性,讓設計師了解人們喜歡什么樣的產品及服裝搭配,提高時尚專業(yè)人士的工作效率,進一步可以增強消費者的購物體驗。
應用場景:服裝輔助設計領域
-
8項冠亞季軍收官ECCV2020,深蘭獲三大視覺頂會挑戰(zhàn)賽大滿貫
計算機視覺 -
與騰訊、哈工大同臺競技,深蘭獲自然語言處理領域國際頂會NAACL2021冠軍
計算機視覺 -
捷報 | 深蘭科技“雙隊”出征CVPR2021 斬獲五冠共獲14項大獎
計算機視覺 -
2022CVPR傳捷報丨深蘭科技再度折桂,連續(xù)4屆獲得CVPR挑戰(zhàn)賽冠軍
計算機視覺 -
深蘭科技奪冠CCKS2022“帶條件的分層級多答案問答”評測任務競賽
自然語言處理 -
PK 656 個對手!深蘭科技在全球頂級AI賽事kaggle競賽中再次奪冠
計算機視覺 -
一冠三亞二季!深蘭科技在EMNLP2022國際頂級賽事再創(chuàng)佳績
數(shù)據(jù)挖掘 -
6個獎項!深蘭科技在CVPR 2023挑戰(zhàn)賽中再獲佳績
計算機視覺 -
6冠3亞2季!深蘭科技在RANLP2023國際賽事上斬獲11項大獎
計算機視覺