2025-02-17 企业动态 0
随着深度学习技术的飞速发展,神经网络在各个领域的应用日益广泛,但模型参数量和计算量的急剧增加也引发了诸多挑战。为了应对这一问题,模型量化技术成为了解决方案之一,它通过将浮点计算转换为低比特定点计算来降低模型的计算强度、参数大小以及内存消耗。然而,当我们谈及极低比特网络(<4bit)和二值网络(1bit)的训练时,这种精度损失就变得尤为突出。
本次直播,我们荣幸地邀请到商汤科技研究院——链接与编译团队中的两位顶尖研究员,他们将分享自己在模型量化方面取得的一系列重要进展。这包括他们与北航刘祥龙老师团队合作,在CVPR 2020、ICCV 2019等顶级会议上发表的一系列论文成果。
一、课程详情
主题:探索模型量化之旅:如何训练极致优化的极低比特网络
时间:4月9日(周四)20:00-21:00
观看链接:↓↓↓
http://www.mooc.ai/open/course/786?from=leiphonecolumn_mooc0408
二、演讲大纲
极限挑战:如何高效训练超精细化<4bit>神经网络?
二值决策:高效训练二值神经网络的艺术与技巧。
加速魔法:如何利用量化技术提升深度学习模型训练速度。
实践落地:如何将模型量化技术成功应用于实际项目中?
结合创新:探索机器学习与自动结构搜索相结合的前沿思路。
三、嘉宾简介:
余锋伟教授,
商汤科技研究院高级研究员,
链接与编译组负责人。
余锋伟博士毕业于北京航空航天大学计算机学院,他曾获得MOT16视频多目标跟踪冠军,以及ASC世界大学生超级计算机竞赛一等奖,并荣获华为奖学金和国家奖学金。他现任内部开源技术中台架构师,负责开发包括但不限于深度学习加速、中间件自动部署、神经编程语言设计等关键技术。在ECCV, ICCV, CVPR, ICLR上共有五篇论文发表,其中包含一篇第一作者、一篇共同第一作者及四篇第二作者文章。
龚睿昊同学,
商汤科技研究院见习研究员,
链接与编译组成员。
龚睿昊在校期间曾获得多项荣誉,如商汤科技未来之星、新希望基金会优秀学生奖等。此外,他还被评选为北京市三好学生,并获得国家奖学金支持。他目前主要从事深度学习领域相关工作,以ICCV, CVPR, ICLR期刊会议上的六篇论文闻名,其中包含一篇独立完成、一篇共同完成四篇且担任协作者角色,其余皆是协作完成。这些作品涉及了他对于具有创新性的深度学习框架设计以及其推广至实际业务场景中的贡献,为该领域做出了显著贡献。
四、本次直播报名流程:
扫描下方QR码添加AI研习社微信公众号“AIyanxishe2”,并备注“论文解读+量化”以便进入特别设置的小群体获取详细资料及直播间地址。