(2024年更新)
我从2005年1月开始在中科院自动化所模式识别国家重点实验室(现为多模态人工智能系统全国重点实验室)任研究员,当年夏天开始招收、指导研究生。以来近20年过去,研究组已毕业了40多名博士生、30多名硕士生。为了使今后的研究生更好地了解本研究组的工作目标,在学习和研究中与研究组共同成长,我把我对研究生的一些要求和建议总结如下。
凡是有志来本研究组读研的同学,请仔细阅读本文。在认可和接受研究组的科研理念与要求的基础上,再跟我们联系。
“模式分析与学习”(pattern analysis and learning, pal)研究组成立于2005年,依托模式识别国家重点实验室(2023年重组为多模态人工智能系统全国重点实验室)。主要研究方向包括:(1)模式识别理论与方法;(2)文档分析与理解(文档智能)。模式识别理论与方法包括模式分类、机器学习、结构模式识别、神经网络与深度学习、多模态学习与推理等,是解决不同场景多模态模式识别问题的基本方法。文档分析与理解研究内容包括文档图像处理、版面分析、文本检测与识别、公式识别、图形符号识别、文档信息抽取、文档问答、数学推理和解题等,背后依赖多模态学习和推理方法的创新。近年来,随着人工智能领域深度学习、多模态融合、大模型等技术演化,本研究组在不同方向、不同课题研究中的方案路线也越来越趋于融合统一。
最近几年,研究组承担的项目包括重点研发项目和科技创新2030“人工智能重大项目”、国家自然科学基金创新群体、重点和面上项目、中科院战略先导科技专项课题、国际合作项目、企业合作项目等。过去五年,研究组发表国内外期刊和会议论文150多篇。文档图像分析和识别算法多次在国际学术竞赛中获得优胜,在一些商业系统中成功应用,并孵化成立了中科阅深科技有限公司。这些成果都是以研究生为主取得的。毕业的博士生有获得中科院院长特别奖和优秀奖、中国科学院和中国计算机学会优博论文,入选华为天才少年等。
研究组现有研究员3名、副研究员5名、助理研究员1名。每年招收博士生3~4名(包括直博生和硕士转博生),硕士生3~4名(包括全日制和非全日制研究生)。申请加入本组的研究生除了参加研究所统一组织的笔试和面试,还要参加本组的面试。录取后,研究组统一协调每个学生的研究方向和课题,并指派一名老师重点指导。研究课题瞄准前沿科学技术问题或应用需求,并与研究组承担的项目任务相关。
科研的目标是解决科学技术问题,产生理论或应用价值。理论成果要有原创性并有广泛的参考价值,能引领启发更多人的研究。应用研究成果同样具有创新性,在解决关键技术问题、形成系统原型的基础上,能够转化为实用。这就是所谓“顶天立地”。
正是面向“顶天立地的”科研目标,本研究组的研究工作分为基础研究和应用基础研究两大方向。需要强调的是,这两个方向不是相互独立的,而是紧密结合。当前人工智能领域的绝大多数研究成果其实都是应用驱动的。瞄准实际应用需求,可以不断发现研究问题或拓展问题边界与深度,比如文档图像质量、版面结构、图文内容非常多样化,目前文档分析、识别与理解仍有很多问题没有解决,需要模式识别、机器学习模型与方法的不断创新。
发表论文是体现团队或个人研究水平的一个重要方面,但不是科研的目的,更不是科研的全部。不管是基础研究还是应用基础研究,如果成果有理论价值或应用价值,发表高水平论文是顺其自然的结果。反之,片面追求论文,而不解决科学技术问题,也难以发表高水平论文。
我们的科研理念是“面向问题,精益求精,力争领先”,“面向问题”是目标:解决科学技术问题,产生价值。“精益求精”是过程,不管是看文献、思考、设计方案,还是实验评价和总结,都要深入全面、精益求精。“力争领先”是结果,基础研究和应用基础研究都要在同领域领先或至少处于前沿,理论方法被人参考引用,应用技术产生领先的性能并能实用。
经常有保研或考研学生来信问我对研究生的素质和基础有什么要求。对于科研来说,专业知识和动手能力等基础很重要,而对科研的认识和态度更重要。基础好的学生很多,但只有真正喜欢科研、自觉钻研、不怕吃苦的学生才能走得比较远。读研不能单纯以取得学位为目标,否则读研期间在学习和科研工作中就不可能全力投入,获得的知识、技能和成果有限,结果可能连学位也拿不到。
科研要花很多时间学习专业知识、调研前沿进展、思考研究方案、分析实验结果、反复优化改进,一定要付出比常人更多的努力才能取得成功。一般来说,研究生一周至少要花60小时在学习和工作上,只有真正喜欢科研的人才会乐于接受这种寂寞单调的生活,并瞄准长远目标。
科研的过程有几个主要步骤:寻找问题—制定计划—思考方法—动手验证—分析总结。“方法思考-验证-分析”过程可能需要多次反复。寻找问题和设定目标非常重要,目标的高低决定了研究成果水平的上限。低水平目标不可能产出高水平成果,比如跟踪性研究不可能产出原创性、引领性成果。低水平目标甚至会使科研陷入被动,因为看得不远,等你取得一点进展时,别人已经走到前面去了。
研究生的科研过程是独立为主,导师为辅,即所谓“师傅引进门,修行在个人”。导师的主要职责是提供科研条件和寻找科研方向、申请科研项目,只在学生入门过程中指导得细一点,入门后主要对研究方法进行宏观指导,对研究进展和成果价值进行评估反馈。因此,研究生要有独立做研究、独立解决问题的准备,研究过程中主动汇报、提问,同时积极与周边同学讨论交流。
为达到以上目标,我们期望研究生具备以下素质:
(1) 喜欢科研,志存高远。理解科研的意义,以解决科学技术问题、追求完美为目标,这样才能做到勤奋刻苦、甘于付出、坚忍不拔。对科研要时刻保持好奇心、对知识的渴求、对现状的质疑。
(2) 学风严谨,讲究诚信。科学技术研究容不得半点造假。伪造或修改实验数据、抄袭论文、窃取思想等学术不端行为迟早会被人发现,将会断送一个人的学术生涯并严重影响团队的学术声誉。
(3) 基础扎实,勤于动手。扎实的数学、英语和计算机编程基础是人工智能领域开展研究的基本要求。研究生要深入学习核心专业课,大量阅读文献,勤于思考,边想边做,通过实验验证和分析思考不断深化。
(4) 脚踏实地,锲而不舍。科研要解决的问题一定是难题,否则早就被人解决了。科研中经常会有失败和挫折,但锲而不舍终会有收获。问题的解决没有时间保证,因此研究生(尤其是博士生)要有延期毕业的思想准备。
(5) 团结协作,任劳任怨。解决复杂的科学技术问题需要团队分工协作。协作中要有沟通,也要有善于妥协、甘于牺牲的精神。不要把付出当吃亏,付出总有收获,所有的付出都是为自己未来发展铺路。
(6) 充满自信,精力充沛。时间精力和勇气是年轻人最大的资本。做研究要有敢于挑战的勇气、敢想敢做的行动力、必定成功的信心。同时注意方法和节奏,规律作息,锻炼身体,保持精力充沛。
研究生通过学习和科研,直接的收获是知识、技能和成果。知识包括基础知识和专业知识、领域前沿动态和趋势;技能包括动手实践能力、科研方法和思路、分析问题解决问题的能力、写作能力和交流能力;成果包括解决问题的理论方法、技术、系统、论文、专利等。这些将为你的求职和事业发展奠定重要的基础。
做科研的过程同时也是学习做人、处事的过程。为人处事的方式方法也是重要的收获,是将来事业发展必不可少的职业素质。这些包括:待人接物的方式、与人分工协作的方式、总结表达、沟通能力等。
人在社会上生存发展都需要人脉。研究生期间认识的老师、同学、同事都将成为你重要的人脉资源。要动用人脉资源,必须先付出,做事负责任:主动、认真、任劳任怨、把集体和他人的事当自己的事。做一个靠谱的人,在需要帮助时才会得到别人的诚意支持。
所有这些收获都是你的努力付出换回来的,付出越多必定收获越多,定位高远才会行以致远。
刘成林
2024年7月
haidian | beijing | china
phone : ( 86-10)8254-4797
fax : ( 86-10) 8254-4594
email:liucl@nlpr.ia.ac.cn
website:www.nlpr.ia.ac.cn/pal/