北京大学歌剧研究院,北京大学歌剧研究院2023年招生简章
本期为TechBeat人工智能社区第441期线上Talk。
北京时间9月21日(周三)20:00,北京大学人工智能研究院研究员——杨耀东的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “一个合作博弈的通用求解框架”, 届时将介绍 一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
Talk·信息
主题:一个合作博弈的通用求解框架
嘉宾: 北京大学人工智能研究院研究员 杨耀东
时间:北京时间9月21日 (周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
Talk·介绍
通过强化学习方法求解多智能体博弈合作问题具有众多的现实应用,例如灵巧双手操纵、无人机群编队等。在本次分享中,我将会介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
HAML提供了一个通用的算法设计范式,它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等,并且HAML算法框架中的成员都天然具有严格的单调递增性的保证。此外,HAML框架还提供了一系列新的多智能体算法,例如HADDPG, HADQN, HAA3C。在一系列合作博弈场景,例如星际争霸,灵巧双手操作上,他们都达到了SOTA水平。
Talk·提问交流
通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题,或扫描下方二维码提问!
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
快来提问啦!
Talk·嘉宾介绍
杨耀东
北京大学人工智能研究院研究员
杨耀东,北京大学人工智能研究院研究员、博导,伦敦国王大学客座助理教授。科研领域包括强化学习、博弈论和多智能体系统,重点关注基于强化学习技术的群体智能涌现。在加入北京大学以前,他曾任伦敦国王大学助理教授,华为英国研究所主任研究员,美国国际集团科学部高级经理。杨耀东本科毕业于于中国科学技术大学,硕士毕业于英国帝国理工大学,博士毕业于英国伦敦大学。
个人主页:
www.yangyaodong.com
-The End-
如果你也想成为讲者
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
⤵一键送你进入Talk页面
北京大学歌剧研究院(北京大学歌剧研究院2023年招生简章)