8月24日,第24届国际模式识别大会(24th international conference on pattern recognition, icpr 2018)在为期5天的大会议程之后,在国家会议中心大会堂举行闭幕式,为本次大会画上了圆满的句号。
模式识别是人工智能的关键技术之一,使机器通过视觉信息识别文字、图片和周围的环境,通过听觉信息识别与理解语言。在大数据时代,传感、通讯、数字化技术等手段使得信息内容的智能识别与理解成为信息科技发展的新的重大契机。
本届会议由国际模式识别联合会、中国自动化学会、中国科学院自动化研究所联合主办,对于我国在国际人工智能学术领域而言,具有重要的历史意义,不仅是其创办40多年来第一次在中国内地召开,同时我国高校和企业的入选论文占了总入选论文的半壁江山,凸显出我国在该领域日益崛起的重要学术地位。
2018年的icpr分为6个主题,包括模式识别和机器学习、计算机视觉、语音图像视频和多媒体、生物识别技术和人机交互、文档分析和识别以及生物医学成像和生物信息学。除了口头报告和海报展示,大会还邀请到6位该领域的顶尖学者做特邀报告,展示该领域最新研究成果。
大会主席谭铁牛院士致辞
程序委员会主席刘成林研究员致辞
大会的开幕式上,大会主席谭铁牛院士和程序委员会主席刘成林分别致辞。在持续4天的主会中,共举行了9场全体会议,包括3场颁奖演讲及6场特邀嘉宾报告。其中,来自芬兰奥卢大学的matti pietikäinen教授、德克萨斯大学奥斯汀分校kristen grauman教授、意大利摩纳德大学rita cucchiara教授分别荣获由国际模式识别联合会颁发的king sun fu奖、j.k. aggarwal奖以及maria petrou奖,并就各自研究领域作精彩的大会报告。
matti pietikäinen教授
kristen grauman教授
rita cucchiara教授
其中模式识别领域的最高奖项king sun fu奖得主matti pietikainen教授在颁奖演讲中分享了其研究团队在人脸分析与情感ai方面的一系列研究成果,包括情感与动态人脸表情识别、基于局部二进制(lbp)算法的图像和视频描述、心率测量、可视语音识别和多模态情感分析等内容,以及面部表情分析可以应用于情绪识别、情感机器人、顾客体验分析、在线教育、疼痛强度预估、审讯、价格谈判、心房颤动等多个行业场景。matti pietikainen表示,目前情感ai领域的研究仍然处于初级阶段,未来挑战的研究方向有卷积神经网络二值化(binarized cnns)、常规算法和卷积神经网络混合等。
香港科技大学权龙教授
权龙教授是香港科技大学计算机科学与工程系的终身正教授,同时也是中国科学院自动化研究所——香港科技大学智能识别联合实验室共同主任。他在题为“the challenges of 3d reconstruction with deep learning”的演讲中,回顾了以往计算机视觉和视觉学习的发展历程,并重点介绍他近期的深度视觉学习工作和计算机视觉的3d重建突破等工作。
美国福特汽车公司高级技术主管k. venkatesh prasad
美国福特汽车公司高级技术主管k. venkatesh prasad是福特移动出行领域的高级技术负责人,也是福特全球技术顾问委员会成员,曾任福特的全球创新执行主管。在题为“automobiles and mobility solutions”的报告中,k. venkatesh prasad概述了机器智能在应用程序中的一些关键应用领域。
微软公司全球副总裁毛建昌
微软公司全球副总裁毛建昌在题为“achieving human parity performance in pattern recognition and language understanding by machines”的演讲中,简要介绍了微软在图像识别、语言理解、机器翻译等任务上实现人类平等的历程和实现突破的技术。同时,他还将介绍深度学习的一些应用,比如ocr(光学字符识别)在无约束环境和广告中的应用。
谷歌研究科学家ashok c. popat
谷歌研究科学家ashok c. popat在题为“advice to a promising ocr researcher”的演讲中,介绍了谷歌开发ocr系统中关于文档分析和识别方面的想法。
南京大学周志华教授
南京大学人工智能学院院长周志华教授在题为“an exploration to non-nn style deep learning”的报告中,讨论深入学习的要点,并证明它不一定是由神经网络实现的。并对非nn风格的深度学习进行探索,说明其中构建模块是不可微分的模块,训练过程不依赖于反向传播。
英国牛津大学alison noble教授
英国牛津大学教授alison noble在题为“human intelligence, artificial intelligence and how they are changing ultrasound image analysis”演讲中,介绍了其带领的团队在机器学习应用于超声图像分析方面的最新进展,以及针对这个应用领域的一些有趣的挑战和新兴的研究热点。
除了精彩的颁奖演讲及特邀嘉宾报告,本届大会还进行了29场共计125份口头报告以及4场共计527份海报论文展示,并为12篇论文分别颁发icpr2018最佳论文奖和最佳学生论文奖。
海报论文
作为模式识别领域的旗舰学术会议,国际模式识别大会自1972年起,每两年召开一次。在2014年国际模式识别大会的理事会全体会议上,中国和澳大利亚围绕2018年国际模式识别大会举办权展开了激烈角逐。
中国科学院自动化所模式识别国家重点实验室学术委员会主任、中科院院士谭铁牛和实验室主任刘成林代表中国作申办报告并回答了理事会的质询,最终赢得理事会青睐。这折射了我国改革开放40年来在模式识别这一人工智能重要领域的快速进展,代表了国际学术界对于主办方模式识别国际重点实验室学术能力的充分认可。
icpr2018最佳论文best paper
track 1: zhang, zhihong; zhou, da; xu, chuanyu; wang, beizhan; wang, dong; ren, guijun; hancock, edwin. depth-based subgraph convolutional neural networks.
track 2: zhang, jiyuan; zeng, gang; zha, hongbin. scalable monocular slam by fusing and connecting line segments with inverse depth filter.
track 3: hao, jiedong; dong, jing; wang, wei; tan, tieniu. deep firearm: learning discriminative feature representation for fine-grained firearm retrieval.
track 4: xu, qin; sun, yifan; li, yali; wang, shengjin. attend and align: improving deep representations with feature alignment layer for person retrieval.
track 5: riba, pau; fischer, andreas; llados, josep; fornés, alicia. learning graph distances with message passing neural networks.
track 6: dhara, ashis kumar; arvids, erik; fahlström, markus; wikström, johan; larsson, elna-marie; strand, robin. interactive segmentation of glioblastoma for post-surgical treatment follow-up.
icpr2018最佳学生论文best student paper
track 1: xu, shan; zhang, xiao; liao, shizhong. a linear incremental nystrom method for online kernel learning.
track 2: antensteiner, doris; štolc, svorad; pock, thomas. variational fusion of light field and photometric stereo for precise 3d sensing within a multi-line scan framework.
track 3: perera, pramuditha; mahdi, abavisani; patel, vishal. in2i: unsupervised multi-image-to-image translation using generative adversial networks.
track 4: sindagi, vishwanath; patel, vishal; di, xing. gp-gan: gender preserving gan for synthesizing facesfrom landmarks.
track 5: jolly, shailza; iwana, brian kenji; kuroki, ryohei; uchida, seiichi. how do convolutional neural networks learn design?
track 6: lopez-martinez, daniel; peng, ke; steele, sarah; lee, arielle, arielle; borsook, david; picard, rosalind. multitask multiple kernel machines for personalized pain recognition from functional near-infrared spectro scopy brain signals.
|