参加ICCV17会议感想
智能科学与技术专业2015级本科生 肖特特
今年四月至九月份,我参加了ICCV17MSCOCO & Places Joint Workshop中共四项比赛,并有幸在学院的支持下,于十月份赴意大利威尼斯参加会议。
MS COCO (Microsoft Common Objects in Context,常见物体图像识别) Challenge 是继 ImageNet(现已停办)之后,计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆。这次比赛也难得一见地汇集了 Google、Microsoft、Facebook 三巨头,国内外顶尖高校以及新老企业共同参与的大赛。不同于仅关注ImageNet 图像分类任务,COCO 中的物体检测任务更关注的是图像中出现的每个物体的个体(比如各种小物体,各种遮挡物体),因此要求算法对图像细节有更好的理解。这个比赛也代表了继 ImageNet 后的图像识别的最高水平。而 Places 是由 MIT 和 CMU 等高校牵头,在今年新设立的一项旨在深度理解图像场景的计算机视觉类竞赛,今年与 COCO 联合举行。
我们参加了COCO2017比赛中Object Detection, Instance Segmentation, KeypointChallenge, 三个任务,以及Places 2017的Instance Segmentation,取得了三项第一、一项第二的好成绩。首先,我们提出并实现了同一大规模集群中,不同服务器之间计算和同步Batch Normalization的算法,通过多机同步训练,改进了过去深度学习中由于单GPU显存不够,不能使用大的mini-batch size训练detection network的困难,并获得了可观的效果提升。同时,我们独立提出了Mask RCNN中关键操作RoI Align的改良版Precise RoI Pooling, 并提出了所对应的Inverse Pooling来提升Instance Segmentation的精度,在原论文的基础上提升很大。其他各种改进也带给我们许多新的提升。
这是我第一次在国际会议做口头报告。尽管workshop在会议的最后一天,仍然吸引了国内外不少同行至现场参加讨论。我们也听取了其他队伍的报告,学习和借鉴他人的方法,收获颇丰。我的报告得到了许多同行们的好评,其中不乏国内外知名学者,诚惶诚恐,倍感荣幸。在这次ICCV的旅程中,我也结识了许多学生和老师,与他们中的许多人成为朋友,在未来研究的道路上继续互相支持和帮助。
威尼斯是一座有趣的城市。作为昔日威尼斯共和国的中心,这里曾经是欧洲海上贸易最繁华的地方,其圣马可广场曾被拿破仑誉为“欧洲的客厅”。整座城市被不同的水道和运河划分,建筑也多有几百年的历史。这里也是艺术的殿堂,威尼斯画派的故乡,印象主义的摇篮。其间我拜访了多座博物馆,欣赏到了许多曾经只在教科书中出现过的画作和雕塑,令人激动不已。
最后,感谢北大2003网站太阳集团首页欢迎您对我的大力支持。希望自己不忘初心,继续前行。