智谱华章-AI发掘科技创新原动力

您的位置:智谱华章官网 > 公司新闻 > 新闻报道 > CVPR 2020开幕,华人斩获最佳论文一作

CVPR 2020开幕,华人斩获最佳论文一作

发布日期:2020-06-18 14:50浏览次数:
计算机视觉领域内最负盛名的学术会议CVPR 2020开幕。

 

太平洋夏季时间6月16日上午8:30,计算机视觉领域内最负盛名的学术会议CVPR 2020开幕。

不同于往届,这次会议全程线上召开,大会官方也没有“因注册人数太多”提前截止注册,不过CVPR官方网站却因为登录人数过多,一直处于转“圈圈”状态。另外,考虑到线上会议的优势,这届CVPR所有的论文报告视频,都会放映两次以照顾时差党。

在正会开始之前,官网就发布通告说,在太平洋夏季时间8:30 AM(北京时间11:30)之前,绝对会给大家个惊喜,8:30 AM一到,官网页面给出了直播的YouTube链接。

链接:https://www.youtube.com/watch?v=aHUYXtbwl_8

在正会一开始,大会主席Gerard Medioni致了欢迎词之后,就介绍到今年的大会组委会,他说组委会有3位大会主席,四位程序主席,还有很多科技主席、workshop主席等等为线上的CVPR做了许多的贡献。在决定将会议搬到线上之前,组委会成员有过很多讨论,也做出了非常重要的决定。多亏了Terry Boult的最后努力,才确保CVPR20决定线上会议。

Gerard Medioni说,因为新冠,西雅图3月11号已经禁止大规模会议,但组委会仍在讨论以一种线下和线上混合举办的方式进行,直到5月6日最终决定改为全线上。

紧接着Gerard Medioni再次回顾了举办线上CVPR所遇到的挑战,以及一系列的赞助者,并重点提了两个工业界的嘉宾Keynote。分别是微软CEO Staya Nadella(炉边对话,主持人沈向洋)和AMAzon AWS的SVP Charlie Bell(炉边谈话,主持人Jitendra Mailk)都是非常棒的看点。

在介绍完整体会务情况之后,大会主席Ramin Zabih宣布了有着经典论文之称的PAMI Longuet-Higgins 奖以及青年研究者大奖两个奖项。

获得PAMI Longuet-Higgins 奖项的是发表在CVPR 2020 上的《Secrets of Optical Flow Estimation and Their Principles》,作者有三位分别是Deqing Sun、Stefan Roth以及Michael J.Black。

除此之外,还有发表在2007年的CVPR上的经典论文《Accurate, Dense, and Robust Multi-view Stereopsis》获得了此奖项,作者分别是Yasutaka furukawa和Jean ponce。其中Yasutaka furukawa在伊利诺伊大学香槟分校计算机科学博士学位。Jean ponce是Inria的研究总负责人。

Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的计算机视觉基础贡献奖,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。该奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。

Ramin Zabih表示,CVPR2020将此奖项颁给这两篇文章,也是表彰其对计算机视觉研究产生了重大影响,推进了计算机视觉研究的进步。

CVPR 线上开幕式公布的另一个奖项是青年研究者大奖,此奖项目的在于表彰年轻的科学家,鼓励继续做出开创性的工作。另外,此奖项的评选标准是研究者必须获得博士学位的年限少于7年。

今年的青年研究者大奖落在了Jon Barron和Deqing Sun身上,前者是谷歌研究院的研究员,后者曾是英伟达高级研究科学家,现为谷歌高级研究员,其在计算机视觉、机器学习、计算摄影学,尤其是光流估计和视频处理应用方面有着深厚的研究兴趣,可以看到经典论文大奖也是对其在光流估计和视频处理应用方面工作的认可。

缅怀黄煦涛,成立Thomas S. Huang纪念奖

紧接着,Ramin Zabih对计算机视觉先驱Thomas S.Huang进行缅怀,也对其在计算机视觉领域做出的贡献给予了承认。

Thomas S.Huang是华人计算机视觉史上的关键人物,首位担任CVPR程序主席(1992)的华人。

Ramin Zabih然后表示CVPR 会设立Thomas S.Huang纪念奖,从CVPR 2021年开始,每年颁发一次。获奖者将由PAMITC奖项委员会选出,此奖项类似于罗森菲尔德奖和杰出研究员奖。获得博士学位10年以上的研究员有机会获得此奖项。

然后,CVPR官方网站播发了时长为1分多钟的视频,纪念Thomas S.Huang,并对其生平功绩做了梳理。

CVPR 投稿一览:中国学者论文数量占四成,清华打败谷歌占据第一

在介绍完如何参加CVPR 线上会议之后,程序主席刘策(谷歌 & MIT)介绍了本届CVPR的论文投稿情况。

从2006开始到2014年CVPR投稿量一直处于“稳定”状态,2014年到2019年之前则处于“线性”增长状态,但是在2020年7000篇左右的投稿量是似乎又将数量拉到了2018年的水平,是否2021年会继续下降,还需继续观察。

在CVPR 2020中,16955位作者写了5865篇有效提交的论文,这个数量分别比2019年增长了20%和29%。另外,在评审方面,审稿人也有所提高3664位审稿人比2019年的2900提高了26%,一共产生了18207份审稿意见,平均三位以上的审稿人审查一篇有效提交的论文。平均的算下来,每位审稿人审了5篇论文。 领域主席数量也有增加,CVPR 2020的领域主席有198位,这一数字比2019年增加了50%。刘策表示,为了提高CVPR的稿件质量,平均每篇文章的录用至少有三位领域主席做决定,平均每位领域主席审稿30篇左右。

在6424篇论文中,最终接收了 1467 篇,如果只考虑有效投稿数量,那么接收率约为 25%,这比例和2019年打平。另外,在这1467篇论文中,Oral论文有335篇,比例为5.7%。刘策表示和往届CVPR一样,论文被选为口头报告和海报,纯粹是基于质量,在是否接收的决策过程中没有设置上限。

作者分布是什么样的呢?从国家来分,中国最多,占比39.2%,美国第二有22.7%,Unspecified排名第三有6.2%的比例。

从机构角度来看,清华大学的340篇数量超过了谷歌的308篇数量,上海交通大学、北京大学、浙江大学分别名列前五。

审稿的情况,也进行了可视化展示,评审意见的平均字数为482,平均打分为2.12。

领域主席的分布,刘策特别点出了本届领域主席有35位女士,亚洲领域主席的数量在不断上升。从比例来看,美国仍然是大头,占比43.1%,中国排名在Unspecified之后为第三。从机构来看,谷歌14位的数量稳居老大,Facebook、Adobe、微软都在前五之列。

介绍完了这些之后,斯坦福大学的SiMo Savarese,也是本届的程序主席,他介绍了现代的研究领域,共有30多个,包括了机器学习架构和可扩展AI等。

比较流行的领域,SiMo Savarese特别点出了机器人和迁移学习。

华人包揽最佳论文和最佳学生论文

在开幕式的最后,大会的程序主席Greg Mori介绍了重磅内容,即本届CVPR的获奖论文。他先介绍到,这届CVPR有很多杰出的审稿人,非常感谢他们的努力。同时,获得提名的论文有很多,这些论文也做了非常棒的工作。

论文链接:http://arxiv.org/abs/1911.06971

代码地址:https://github.com/czq142857/BSP-NET-original

获得最佳学生论文的是《BSP-Net:Generating Compact Meshes via Binary Space Partitioning》,中文翻译过来是《BSP-Net:通过二叉空间分割生成紧凑网络》,这篇论文从多边形网格入手,基于计算机图形学的经典空间数据结构Binary Space Partitioning(BSP)来设计了一个BSP-Net。 整个论文由三位学生完成,其中两位是来自西蒙弗雷泽大学的华人,名字为zhiqin Chen、Hao Zhang,还有一位是谷歌的Andrea Tagliasacchi。 第一作者西蒙弗雷泽大学博士一年级学生,从事计算机图形学相关的研究,主要研究方向是几何建模和机器学习。

最佳学生论文荣誉提名的是《Deep Cap:Monocular Human Performance Capture Using Weak Supervision》论文作者有五位之多,其中有一位是华人面孔。

论文链接:https://arxiv.org/abs/1911.11130

开源地址:https://elliottwu.com/projects/unsup3d/

最佳论文是由牛津大学的三位研究员的《Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild》论文获得,其提出了一种无需外部监督即可从原始单视图图像中学习3D变形对象的方法。

其中第一作者Shangzhe Wu是牛津大学视觉几何组的二年级学生。其曾于2017年11月到2018年2月,在腾讯优图实验室做机器学习实习生。在香港科技大学读本科期间,研究领域为图像翻译、生成,而现在主要的研究方向为无监督、自监督的3D 理解。