观点|人形机器人进化论:在“混乱”中爆发,于“笃定”中前行

发布时间:2025-05-19 16:17  浏览量:3

当人工智能的浪潮以前所未有的力量席卷全球,人形机器人,这个曾主要栖身于科幻作品与实验室的“未来造物”,正以惊人的速度闯入公众视野,并在产业界掀起滔天巨浪。

2025搜狐科技年度论坛上,一场名为“人形机器人进化论”的圆桌讨论,汇聚了学界泰斗与业界先锋,他们的智慧碰撞,为我们勾勒出这一新兴产业的真实图景:既有令人热血沸腾的远大前程,亦不乏荆棘丛生的现实挑战。这不仅是一场技术的进化,更是一场关于认知、耐心与决心的进化。

商业化迷思:泡沫与价值的拉锯战

“人形机器人到底有没有用,或者有没有泡沫?”乐聚机器人创始人兼CEO常琳认为,泡沫与否,最终取决于人形机器人能否“解决问题、创造价值”。今年初春晚的惊艳亮相,以及亦庄马拉松赛场上机器人蹒跚的身影,都将人形机器人从“云端”拉回“地面”,让公众意识到其走向大众的必经之路。常琳强调,只有当机器人真正融入生产生活,其价值才能驱散泡沫的疑云。

清华大学自动化系研究员赵明国则以更长远的视角审视这一问题。他回顾了自动驾驶技术从2005年DARPA挑战赛至今20年的发展历程,指出人形机器人的发展,即便在当前技术加速的背景下,也至少需要十年才能达到一个相对成熟的“中段阶段”。赵明国坦言,当前人形机器人领域呈现出一种“混乱”状态:科学原理、技术手段、产品定义乃至商品化,这四个传统上循序渐进的阶段,如今正以前所未有的方式“同时发生”,导致行业在摸索中前进。他提醒公众,对人形机器人“明天就能走进家庭”的预期需要调整,对齐行业发展的客观规律。

中国科学院自动化研究所研究员、灵宝CASBOT创始人张正涛将人形机器人比作一个“大装置”,其内涵之大、学科交叉之复杂远超想象。他认为,正如“神光”大装置在解决核聚变这一终极能源问题的漫长征途中,孵化出无数造福各行各业的科技成果一样,人形机器人在追求“阿童木”梦想的路上,其“沿途下蛋”的成果同样不可估量。

从产业落地角度,张正涛分享了他走访200多家工厂的经验,指出制造业对人形机器人的应用持非常开放的态度,积极探讨应用场景。他预判,未来一到三年,人形机器人在半结构化环境中的部分功能(如遥操作、手眼协作)将迎来质变,尽管这未必是纯粹的双足形态,也可能包含轮式或轮臂式机器人。

宇树科技副总经理王启舟以其公司九年深耕四足机器人的经验为例,强调“耐心”的重要性。他指出,四足机器人从最初仅服务于高校院所的研发平台,到如今在电力巡检、化工等领域实现应用,同样经历了漫长的探索。人形机器人自2023年因AI技术突破而火爆全球,至今不过两年,更需要时间沉淀。王启舟认为,无论是否存在泡沫,当前的热度至少能吸引更多资源、资金和人才投入,这对于一个极度缺乏这些要素的新兴领域至关重要。“哪怕只有一部分人相信并投身其中,也许某一天它就能变成我们想象的样子。”他如是说。

初心资本合伙人许旸洋作为投资人,也分享了他的观察。他认为,人形机器人赛道尚处于极早期,“进度条可能只有5%-10%”,公众预期与行业现实存在差距。一个有趣的现象是,机器人在locomotion(运动能力,如跳舞、打拳)上的进步,往往是人类相对不擅长的领域,这容易拉高公众预期;反而在manipulation(操作能力,如叠衣服、做家务)这些人类习以为常的任务上,机器人仍面临巨大挑战,这种“反差萌”也加剧了预期差。

技术进化阶梯:从“盲走”到“L4自主”

赵明国教授对人形机器人技术阶段的划分,提供了一个清晰的参照系。他借鉴自动驾驶L0到L4的分级思路,将其平移至人形机器人领域。目前,许多人形机器人,包括马拉松赛场上的,仍处于“L0”阶段,即人的智能在混合体中占主导,大量决策依赖遥控。

“现在所有运动方面的能力,AI只做了这么一部分,怎么避障全部是人来决定的。”赵明国指出。他设想,未来L1可能实现初步避障,L2能看到球门(目标导向),L3能团队协作,L4则达到更高程度的自主。他强调,当行业或细分领域能清晰地描绘出从L0到L4的路径图,整合技术与产品,发展将进入“加速级”。

当前,人形机器人的技术主战场仍在“盲走”的locomotion层面。赵明国指出,建图(mapping)与定位(localization)是下一阶段必须攻克的难关,要尽快将自动驾驶和其他移动机器人中的SLAM(即时定位与地图构建)能力移植过来,让机器人能在环境中自主行走。“下一届马拉松一定是自主地跑,遥控器和没有遥控器从赛道就有差别了。”他断言。此外,机器人与环境的感知交互、与人的协作适应性,也是亟待突破的关键。

常琳也认同赵明国的观点,乐聚机器人正致力于解决机器人在工厂环境中的导航、视觉等问题,提升其“有用性”。他认为,国内在locomotion和本体性能上可能领先,但在上肢操作、模型和技能层面与美国尚有差距。未来两三年,运动性能将不再是主要瓶颈,真正的制约在于操作、感知和任务完成能力。

张正涛为灵宝CASBOT设定了“生而为(wéi)人”与“生而为(wèi)人”两大目标。前者意指机器人具备类人的各项能力,是多学科交叉的技术集成;后者则强调科技向善,率先应用于危重环境替身,如深入千米矿井进行炸药装填的遥操作,或在核辐射、灾害救援等场景替代人类执行高危任务。“哪怕没有到L2、L3,通过辅助驾驶甚至遥操作把他(受困者)抱出来,local motion稳定了,能解决各种瓦砾沙土,这是非常有价值的。”

王启舟则认为,宇树科技的策略是根据客户需求,聚焦特定场景解决问题。目前人形机器人最大的难点仍是智能化,即具身智能。虽然本体灵活性已达一定阶段,但在精准度、末端操作可执行性上仍有巨大提升空间。

资本风向与全球竞逐:笃定的背后是国家意志与人才储备

谈及资本市场的“水温”,常琳和张正涛均表示,2025年投资机构的态度“更笃定”。常琳指出,国家自2022年起持续发文支持,将人形机器人定位为继PC、智能手机、新能源汽车后的下一代颠覆性产品,各地政府也积极布局,希望抢占未来产业链的制高点。张正涛则将2025年视为“分水岭”,机构对赛道的理解更深刻,从早期的“水中花”认知转变为基于ROI、场景驱动和财务数据的理性投资。

许旸洋补充道,资本之所以看好,很大程度上源于对中国在该产业长期扮演重要角色的信心,类比新能源汽车的成功,人形机器人作为软硬件结合、高度依赖供应链的行业,中国具有天然优势。同时,华人学者和团队在该领域的学术和产业领导力也是重要因素。

在全球竞争格局中,常琳认为,中国在“小脑和本体”(运动控制和硬件)方面凭借强大的供应链和成本优势可能领先,但在“大脑”(上层模型、具身操作能力)方面与美国差距明显。张正涛对零部件国产化率持乐观态度,认为已达90%以上,主要瓶颈在于GPU计算板卡(仍依赖英伟达)及其CUDA生态,以及高端谐波减速器在材料、精度、寿命上的差距,但这并不影响产业大的发展方向。

人才层面,赵明国教授观察到一个有趣的现象:具身智能的浪潮中,华人学者贡献卓著,占据了约70%的比例。国内的优势在于拥有大量“便宜”的机器人可供实验,赋予科研人员“无限开火权”,极大降低了人才培养成本。然而,他也指出了“0到1”原创性思维的不足,以及在脉冲神经网络等更接近生物神经机制的前沿领域探索较少。

王启舟则坦言宇树“非常缺人”,从底层机械电子到上层AI感知,乃至新材料、机器人专用芯片等领域均存在巨大的人才缺口。他呼吁教育体系的革新,并表示宇树偏爱具备动手能力、勇于尝试新技术、积极参与竞赛的人才。

未来畅想:人机共生的新图景

展望未来五到十年,嘉宾们描绘了人机协作的多彩画卷:

常琳预言:“可能会有另外一个世界诞生,就是机器人的世界”,生产、生活、工作中将遍布机器人,甚至可能在两三年后就初见端倪。

赵明国则以他热爱的机器人足球为例,希望五年后能看到真正具备观赏性、能让大众愿意购票观看的机器人足球比赛,若能实现,则机器人走进家庭便水到渠成。

张正涛的畅想更为宏大:未来每个家庭可能拥有三到五个机器人,全球总量或达150亿个。这将带来多智能体的“智能涌现”,甚至可能涉及脑机接口,人类可选择将记忆存储于机器人本体。初期,机器人将人类从繁重危险的工作中解放出来,提升幸福感;长远看,则可能引发碳基生命与硅基生命关系的深刻思考。

王启舟则聚焦于具体应用:机器人将接管人类不愿干的活儿、危险工种和简单家务,服务于“银发经济”和儿童教育,并以不同形态搭载行业模型,解决特定问题。

许旸洋总结认为,机器人未来的发展可能分化为两大方向:一是通用型机器人,旨在“节省时间”,如完成家务、养老服务、工厂作业;二是更个性化的机器人,旨在“花掉时间”,满足情感价值和娱乐需求,例如可定制的比赛机器人、个人机甲,甚至未来人人都能DIY专属机器人。