出发,AI算法已经从构筑表达与生成能力的监督学习阶段,演进到引入因果与执行的强化学习阶段。
智能载体维度出发,当下的关注点已从语言和多模态模型,转向世界模型与具身模型。
过去70年,人机交互经历了命令行、图形界面、搜索、推荐到自然交互的多次范式迁移,每一次迁移背后都对应着底层技术浪潮的变化。
“今天的产品开发者必须看懂智能特性带来的交互机会。”他同时提到,自然交互内部也在分层:
被动响应——交互式执行——具备提议能力的主动模式,交互方式从文本扩展到语音、手势乃至未来的脑机接口。
计算架构维度已然浮现从通用走向专用、从单一走向多元的趋势。GPU刺激了深度学习的第一波爆发,但能耗与成本也不断攀升。
于是,性能、成本与能效成了大家追逐的新的平衡点,推理、端侧、强化学习等匹配不同应用任务的专用芯片纷纷涌现。
最后关于数据——在模拟世界阶段,数据是静态教材;在探索世界阶段,数据是动态反馈;在归纳世界阶段,数据是验证假设的证据。
从人类数据枯竭到合成数据兴起,再到AI主动探索并获取实验数据,这背后体现出数据从限制模型能力的约束,逐步转变为推动AI主动学习的工具。
当个体的能力被AI放大,许多原本需要多环节协作的任务,可以由单个个体端到端完成。
此次大会上,IDEA研究院还宣布了国际先进技术应用推进中心(深圳)与深港高等研究交流中心(SHARE)两个创新平台,以及一系列创新项目。
2025 IDEA大会上,IDEA研究院计算机视觉与机器人研究中心负责人张磊,首次系统介绍了研究院在具身智能方向的最新成果:
过去两年,具身智能异军突起,不少团队试图通过VLA(视觉-语言-动作)大模型架构,让机器人像人一样“听得懂人话,看得懂世界,动得起来”。
与其从动作建模着手,不如先把“看清楚”这样的一个问题解决得更彻底——这成为了IDEA研究院发力的突破口。
依托IDEA团队过去在开集目标检测和视觉感知的研究积淀,以强泛化的视觉检测模型DINO-X为基础,IDEA研究院发起了DINO-X Grasp项目
这个模型不仅仅可以精准识别物体、预测抓取点位,还能结合深度信息,还原物体的三维结构,从而指导机械臂完成稳定、精确的操作。
现场展示的视频中,DINO-X Grasp驱动的机器人灵活应对各种形状各异的物品,从食品包装袋到异形障碍物,一抓一个准。
目前,这套方案已在招商局集团多个子公司应用,覆盖港口集装箱验残、桥梁螺钉检测、夜间车辆识别等多个复杂场景。
写过ReScript语言的张宏波,现在又带领团队在IDEA研究院开发MoonBit。
沈向洋特别提到,张宏波是他知道的唯一一个写的编程语言全世界有以万为计量单位的人数在用的人。
他所带领的MoonBit团队2022年底才成立,刚好赶上了ChatGPT横空出世。张宏波在台上分享时说:“作为新的编程语言,(赶上这一段时间点),可以让我们有机会重新思考在AI时代下怎么做开发者工具。”
它是所有编程语言史上第一个原生提供AI助手的语言,还为语言模型打造了基于语义分析的IDE。
过去一年半,MoonBit从一门支持多后端的编程语言,逐步演进为完整的全栈工具链(包含专为AI设计的原生工具集),最终构建起集开发者工具链与智能体开发生态于一体的开发者平台。
张宏波透露,MoonBit已经有了商业付费客户,包括北美的云厂商用它来进行服务器开发。”大部分编程语言在前四年、前五年都是默默无闻的,而我们在这么早的阶段就累积了这么多用户。”
目前,MoonBit的用户从去年的2.6万到现在超过了10万。张宏波预计到2026年底会有接近100万用户,“成为首个从中国走出去的有世界影响力的开源平台”。
王嘉平团队的GPU渲染器Smaray是更为直观的IDEA研究院新近成果。
“在电影工业中,一个镜头通常包含几百个G的数据。”王嘉平在演示时介绍,电影工业的渲染和游戏完全不同。游戏要求毫秒级响应,而电影渲染一帧画面在大多数情况下要几小时甚至一天。
美国的Arnold占据半壁江山,皮克斯的Renderman和欧洲的V-Ray瓜分剩余市场。
花了整整5年时间,从基础算法到工业标准集成,IDEA研究院终于推出了Smaray渲染器。
原本需要几分钟才能看清的场景图和雄狮形象,Smaray几秒钟就渲染完成,还能够像玩FPS游戏一样在场景中自由探索。
更让人惊喜的是,Smaray不仅支持英伟达GPU,还支持AMD、国产GPU甚至苹果芯片。
目前,《流浪地球》特效制作方MoreVFX、《哪吒》制作方光线动画等顶级公司已开始使用Smaray。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
美国国家级算力动员启动!10万颗英伟达Blackwell GPU,助AI基础设施全面升级
43岁男子网上结识小6岁女子,花12万元彩礼闪婚闪离,法院判决退还彩礼后女方失联
《阿凡达3》首映遭遇放映“滑铁卢”:版本多,分辨率比较高,帧率翻倍,不少影院放映系统不堪重负
甘肃一轿车高速狂飙近500公里无法减速,驾驶问题还是车辆问题?网友吵翻了
“最低选择299元有女孩陪侍套餐”,记者说只想看电影,“私人影院”服务员直接让记者去别家看
残暴11-1 樊振东欧冠首秀3-0速胜:再秀C罗庆祝动作 现场球迷狂欢
南京一校最新通知:部分学生违规带手机入校,并在群内传播不文明不健康内容
毕业就拿近6000月薪,超90%对口就业!西安电力高等专科学校,凭什么这么“能打”
华为鸿蒙电脑MateBook Pro推送HarmonyOS 6.0.0.120 SP1版本
最近的新宝股份可谓是热闹非凡,继2025年4月4日获得了“手持搅拌机(HBN0006-GS)”的
该展会自1997年开始举办,展会地点位于日德兰中部的中心位置,作为参展者,您能体验到舒适的住宿,
了原著中的经典元素与创新的玩法,为玩家带来沉浸式的斗罗世界体验。游戏使用先进的3d技术,画面精美
金融界 2025 年 4 月 25 日音讯,国家知识产权局信息数据显现,广东金宗机械有限公司获得
网站地图sitemap备案号:豫ICP备17022679号-2 技术支持:贝博bb 体育
豫公网安备 41072102000363号