汇聚青年科技工作者的科创力量,展现科技创新成果背后的科研历程,讲述首都青年科技工作者的创新故事。新一季《小家大事》向“新”而行,乘风启航。
《小家大事》栏目由北京市科学技术协会和新华网联合出品,本期将走近2023年北京市科协“卓越工程师”成长计划项目入选人、抖音有限公司资深技术专家张文鹏,讲述他“点亮”智能算法的故事。
张文鹏,2023年北京市科协“卓越工程师”成长计划项目入选人、抖音有限公司资深技术专家,从事信息流推荐算法研发工作,在多目标机器学习领域开展系统研究,进行基础理论创新,成功将研发成果在实际场景落地。
独特的思考
技术的力量。从小对数学感兴趣的张文鹏,进入大学后才真正接触计算机。通过学习专业课程,在数理逻辑世界探索,智能化的研究内容对他有很强的吸引力。“当时觉得做这项研究能预测未来,很有‘力量’。我被这种技术的力和美吸引,开始向智能化方向探索。”张文鹏说。
原创性研究。智能化研究细分成千万条道路,张文鹏从独特的角度思考信息流推荐方向。“我追求研究的原创性,希望研究背后能体现自己的思想,在这个领域有独特贡献。”随着在信息流推荐领域研究不断深入,业务侧需求推动着张文鹏开启了对多目标机器学习的探索。“我们从关注视频点击率或者停留时长等单一指标,转向对多个指标进行综合分析。”张文鹏将多目标机器学习比喻成考试,通过设计模型提高每科成绩,理想情况下所有科成绩均能提高,其次是某一科成绩显著提高,其他科持平,通过一次次优化算法,综合性地改进。
点亮算法的世界
模型设计冲突。在多目标机器学习领域,模型结构设计和多目标优化器是两大难题。在模型设计方面,张文鹏印象最深刻的是发现多任务模型ESMM中存在的完全冲突梯度问题,通过优化此问题,模型性能得到提升,成果在10余个互联网场景落地。“当时,我们感觉解决了模型侧本质的一个问题,新的解决方法具有普适性,这让我更加认同此研究方向的价值,能给工作提升带来实际效果。”
再寻破题之路。多目标优化器是张文鹏遇到的又一个难题。“为了对多目标优化器进行算法设计,我们从零开始研发一套理论分析框架。”发现算法缺陷、集中研讨、系统论证、寻找本质原因、设计算法、测试、打印收敛轨迹…从实际案例出发,张文鹏和团队经历一年左右的时间找到一条新的破题之路。张文鹏在经验分享时说:“知识的积累和系统的方法是解决技术难题时‘灵感’的重要来源”。
做有影响力的工作
基于互联网信息流推荐领域需求开展的研究,在航天、材料、生化等不同领域有更广泛的应用。“在生物制药领域,我们用多目标机器学习算法进行药物筛选,兼顾疏水性、无害性等不同目标。”在张文鹏看来,工业界对多目标机器学习技术有非常广泛的需求,但这项技术在学术界的关注度却并不高。他提到,希望自己开展的工作能够成为“助推器”,让此领域的“小火苗”燃烧的更加旺盛。
培养方式的传承。如今,张文鹏在技术创新上已形成一套自己的思考方式和探索路径。他回忆到,大学期间导师对他独立思考和自主创新能力的培养对现在的研究大有裨益。“我的导师使用的是‘游泳’的培养思维,在我不会游的时候他会让我先跳入水里。”这种方式也被张文鹏沿用到对团队青年人才培养上。他还特别关注对团队成员的启发。“我想让他们知道从事这项研究是有意义、有价值的事情。”
工程师是推动工程科技造福人类、创造未来的重要力量。北京市科协“卓越工程师”成长计划重点培育面向北京国际科技创新中心建设的关键领域和重点产业急需紧缺的卓越工程师人才,为工程师提供交流发展的平台,助力首都工程师成长成才。