探讨RAG技术、AI代理及AI伦理挑战
2月14日,长江证券发布了一份针对软件与服务行业的深度报告,重点探讨了大模型技术在推进人形机器人软件发展中的重大意义。报告指出,人形机器人的最终目标是创造类似于人的物理实体,具备通过交互、感知和行动执行任务的能力,而这一切的核心在于智能因素的提升。
在人形机器人的早期发展阶段,机器人大脑主要依赖于整合多个小型模型与人工干预来完成决策。但随着大模型的出现,预计将彻底改写这一现有的软件开发范式。大模型的本质是一个参数级别达到千亿的多模态模型,,通过理解传感器的数据流和生成决策方案,使得机器人能够将复杂的决策分解为多个简单的步骤,实现高效的任务执行。这种转变代表着机器人技术的飞跃,使得人的思维模式可以被更好地模拟和应用。
根据长江证券的分析,现阶段的机器人大脑可以分为两种技术路径,分别是VLM(大脑+小脑)和VLA(端到端)。当前VLM方案正在取得快速进展,而其小脑部分则由运控模块组成,这个模块本质上是个千万元级别的小模型,虽然不具备泛化能力,但能够在执行任务时,从已有的运控数据库中快速查找并执行方案。
在硬件架构上,人形机器人呈现出一种云边端协同的趋势。云端大脑作为核心,依托于数千张高性能算力芯片,能够处理庞大的数据运算需求;而端侧的小脑则通过搭载在机器人本体的GPU或ASIC芯片来执行运控任务。这种异构化的发展使得人形机器人在软硬件的协同效率上得以大幅提升,同时也解决了云端计算延迟的问题,确保机器人实时响应指令。
当前,软件创新已成为人形机器人产业链中价值量最高的环节,跨界巨头的进入可能会重塑整个生态体系。可以借鉴智能汽车领域的“软件定义汽车”逻辑,软件算法将成为人形机器人厂商的差异化竞争优势,推动智慧型机器人向更广泛的市场渗透。回顾智能汽车行业在2018年以后的飞速发展,市场上出现了许多智能驾驶软件解决方案公司,预计人形机器人行业在不久的将来也会出现类似的发展趋势,特别是随着特斯拉的人形机器人Optimus小批量出货,各类运控解决方案公司有望迅速涌现。
在行业巨头的布局方面,特斯拉、谷歌和英伟达分别采取了自下而上、自上而下以及专注中间件和芯片的不同发展路径。特斯拉在2021年推出了Optimus,经过多轮迭代后,其机动性和灵活性有了显著提升;谷歌则自2022年开始在软件层面推出多款机器人模型,展示了多模态感知和快速决策的能力;而英伟达则在硬件及中间件层面发力,为具身智能产业链提供了基础技术支持。
总体而言,大模型技术的推广与应用,正在为人形机器人软件的发展带来深远的影响。通过整合先进的AI技术,这些机器人将能够更好地理解和适应复杂环境,成为更为智能且人性化的助理,进而为各行各业带来巨大的变革与机遇。
关注公众号
立刻获取最新消息及人工咨询