11月7日:多臂老虎机简介:模型、算法与应用
发布时间:2024-11-04 浏览量:10



报告:多臂老虎机简介:模型、算法与应用 (黄增峰)

报告时间:2024年11月7日10:30-11:30

报告地点:数学馆310室


讲者简介:

复旦大学教授,博导,入选国家级青年人才计划。在国际期刊和会议上(ICML,NeurIPS, JMLR, FOCS, TIT等)发飙高水平论文五十余篇,荣获了多项国际奖项,包括ICML 2018最佳论文亚军奖(bset paper runner uo award),两次世界人工智能大会青年优秀论文提名奖(2020, 2023), 以及ACM PODS 2022时间检验奖。


报告摘要:

多臂老虎机问题及其推广是在线学习中的经典模型,在人工智能和运筹优化等领域都受到了大量关注,在临床试验、广告投放和推荐系统等也有着广泛的实际应用。在本次报告中,我将简要回顾该问题的标准设置和经典算法。然后,讨论近年来受到实际应用启发并得到广泛研究的非传统模型,例如批量反馈MAB、Lipschitz老虎机以及带有反馈图的MAB等。最后,还将探讨MAB算法在其他AI和运筹问题上的应用。


华东师范大学软件工程学院
学院地址:上海中山北路3663号理科大楼

                上海市浦东新区楠木路111号
院长信箱:yuanzhang@sei.ecnu.edu.cn | 办公邮箱:office@sei.ecnu.edu.cn | 院办电话:021-62232550
www.sei.ecnu.edu.cn Copyright Software Engineering Institute