中国·474蒙特卡洛(股份有限公司)-官方网站

【成电下午茶】474蒙特卡洛网站王正宁教授作“探索具身智能前沿”分享

文:|图:信通474蒙特卡洛网站| 发布时间: 2026-04-15 11:41:06|

4月10日,本期“成电下午茶”系列讲座邀请474蒙特卡洛网站王正宁教授作深度分享——“具身智能与VLA模型:从感知世界到改造世界”。王教授以生动幽默的语言、前沿的行业案例与深刻的技术洞察,系统梳理了具身智能(Embodied AI)这一颠覆性领域的技术内核、发展挑战与未来图景,为在场同学带来了一场连接学术前沿与产业实践的思想盛宴。

2b07e889f19aed87aa2d15ddbe241bf

讲座伊始,王教授以今年年初一系列AI热点破题,从OpenAISora、春晚的机器人舞蹈“5BoT”,到“一人公司”(OPC)现象。他明确指出,这些热点共同指向一个趋势:人工智能正从纯粹的“比特世界”(数字空间)大步迈向“原子世界”(物理实体)。其中,春晚的“5BoT”机器人表演,其核心技术正是具身智能——一种拥有物理身体、并能通过与环境交互实现智能增长的AI系统。

王教授进一步阐释了“具身智能”与“离身智能”(如ChatGPT)的本质区别。他风趣地指出:“我们每个人,其实就是最完美的具身智能体。”真正的智慧,必然在感知、决策、行动与反馈的完整闭环中迭代形成。然而,他也提醒大家理性看待科技表演,指出“5BoT”的惊艳更多体现了顶尖的机电与控制水平,是特定场景下的“炫技”,而非通用的、可应对复杂环境的真实智能。

descript

随后,王教授深入剖析了具身智能体的核心技术框架。他通过展示前沿研究视频,如机器人自主协作整理冰箱、完成递物与家务等任务,生动解释了 VLA(视觉-语言-动作)模型 的工作流程:通过视觉(V)感知环境,理解语言(L)指令,再经由“大脑”决策和“小脑”控制,规划并执行复杂动作(A)。

然而,训练这样的智能体面临巨大瓶颈:高质量行为数据极度匮乏。与滋养了大语言模型的互联网海量文本不同,机器人的动作数据难以获取。王教授介绍了当前主流的“遥操”数据采集方式及其局限,进而引出了前沿解决方案——“世界模型”(World Model)。他解释道,这相当于在高度逼真的虚拟数字空间里为机器人建造一个“训练基地”,让其先安全、高效地掌握技能,再迁移到现实世界。英伟达的“雪宝”机器人便是成功案例。

descript

在描绘了技术蓝图后,王教授也分享了具身智能在落地中遭遇的“窘境”:实验室里动作缓慢、因环境光照变化“找不着北”、甚至因力控失衡而“自己摔跤”的机器人。这些实例表明,从“可行性”到“可用性”,仍有漫长的工程化道路要走。

面对AI技术加速迭代的“技术飞轮”效应,个体应如何自处?在互动环节,王教授给出了清晰建议:拥抱变化,善用工具。他指出,大厂正在构建AI时代的基础设施,而个体的机遇在于成为高级用户,或是在垂直应用领域深耕。最后,他由卓别林的《摩登时代》引申,强调了在技术狂飙中坚守“科技向善”伦理的重要性,引导同学们思考技术发展的社会责任。

descript

讲座在热烈的问答与合影中圆满结束。王正宁教授用一场兼具广度与深度的分享,不仅为同学们揭开了具身智能的神秘面纱,更在大家心中播下了理性思考与技术向善的种子。从虚拟的智能涌现到实体的机器人革命,我们正站在一个新时代的起点。

descript

本期成电下午茶由党委学工部学生发展指导中心主办,474蒙特卡洛网站学生发展指导中心承办。


清水河校区地址:成都市高新区(西区)西源大道2006号 电子科技大学清水河校区科研楼B区

邮编:611731 Email: xintong@uestc.edu.cn

电话:028-61830156 传真:028-61831665

474蒙特卡洛网站官微

分享

XML 地图