标签: 机器人

  • 人形伴侣机器人:科技浪潮下的情感新宠

    人形伴侣机器人:科技浪潮下的情感新宠

    在科技飞速发展的当下,人形伴侣机器人赛道正呈现出前所未有的火爆态势,宛如一颗璀璨的新星在资本市场与科技领域冉冉升起。从资本市场的反应来看,其热度堪称“疯狂”。

    近期,只要与“人形伴侣机器人”沾边的股票,仿佛被注入了一剂“强心针”,一路飙升。2月20日,A股市场上伴侣机器人概念股集体异动,双飞股份、长盛轴承等标的盘中强势涨停。不仅仅是这些直接相关的股票,一些看似与机器人关联不大的企业,也因为被贴上了“人形机器人”的标签而股价大涨。

    需求井喷:背后的市场力量

    人形伴侣机器人赛道的火爆并非偶然,其背后有着深刻的市场需求驱动因素。

    中国单身人口超2.4亿,这一庞大的群体正面临着情感陪伴缺失的困境。快节奏的现代生活,让人们的社交圈子变得越来越窄,找到合适的伴侣愈发困难,工作的忙碌使得人们无暇顾及社交,很多人每天在公司、家两点一线之间奔波,根本没有机会结识新的朋友。在这样的情况下,单身人士对情感陪伴的渴望愈发强烈。

    与此同时,人口老龄化的加剧也使得情感陪伴需求进一步增长。随着老年人口的增多,子女因工作等原因无法时刻陪伴在老人身边,许多老人只能独自面对生活。据统计,我国空巢老人占比已经超过半数,部分地区甚至超过70%。在这样的背景下,人形伴侣机器人的出现,无疑为这些渴望陪伴的人群提供了新的选择。

    市场数据也充分证明了人形伴侣机器人的广阔前景。预计到2031年,全球伴侣机器人市场规模将突破3亿美元,这一数据还仅仅是保守估计,随着技术的不断进步和市场的进一步开发,实际规模可能会远超预期。

    在国内,上海作为人工智能产业的重要基地,已建成首座人形机器人量产工厂,2024年已下线1000台人形机器人,预计2025年产能将达到数千台,这标志着人形伴侣机器人正逐步从实验室走向市场,走进人们的生活。

    技术飞跃:创新的核心引擎

    人形伴侣机器人之所以能在市场上掀起如此巨大的波澜,技术的飞跃无疑是其核心推动力。近年来,人工智能、材料科学、传感器技术等领域的迅猛发展,为人形伴侣机器人的功能革新提供了源源不断的动力。

    在人工智能领域,以DeepSeek大模型为代表的先进技术,为人形伴侣机器人赋予了强大的智能“大脑”。这些大模型具备自然语言处理、情感识别、深度学习等多种能力,使得机器人能够与用户进行流畅、自然的对话。它不仅能理解用户话语的字面意思,还能捕捉到其中蕴含的情感色彩,并给予恰当的回应。

    同时,借助深度学习能力,机器人可以不断学习用户的语言习惯、兴趣爱好、生活规律等,从而提供更加个性化的服务。随着时间的推移,它会了解用户喜欢的电影类型,在用户闲暇时主动推荐相关影片;知晓用户的饮食习惯,为用户制定健康的饮食计划。

    而材料科学的进步也为人形伴侣机器人带来了质的变化。新型材料的出现,使得机器人的外观更加逼真,触感更加接近人类。在机器人的关节和骨骼部分,采用了高强度、轻量化的材料。这些材料不仅提高了机器人的机械强度和耐用性,还降低了其重量,使其动作更加灵活、自然。

    传感器技术的发展则让人形伴侣机器人,对周围环境和用户状态有了更敏锐的感知。通过摄像头、麦克风、压力传感器、温度传感器等多种传感器的协同工作,机器人可以实时获取周围环境的信息,识别用户的身份、表情、动作等,从而做出更加准确的反应。

    资本狂欢:热钱涌入的盛宴

    人形伴侣机器人赛道的火爆,在资本市场上掀起了一场热钱涌入的狂欢盛宴。众多投资机构纷纷将目光聚焦于此,不惜重金押注,生怕错过这一具有巨大潜力的投资风口。

    在这场资本盛宴中,一些知名投资机构的身影格外引人注目。红杉资本作为全球顶尖的投资机构之一,对人形伴侣机器人赛道表现出了浓厚的兴趣。他们通过深入的市场调研和专业的技术评估,认为人形伴侣机器人在未来的市场中具有广阔的发展空间,因此果断出手,对多家相关企业进行了投资。

    软银集团也是人形伴侣机器人赛道的重要投资者之一。软银在科技投资领域一直有着敏锐的洞察力和大胆的投资策略,他们看中了人形伴侣机器人在人工智能和机器人技术融合方面的创新潜力。软银的投资不仅为人形伴侣机器人企业带来了巨额资金,还通过其全球布局的资源网络,为人形伴侣机器人的推广和应用开辟了新的渠道。

    除了专业投资机构,一些科技巨头也纷纷通过战略投资的方式入局人形伴侣机器人赛道。谷歌母公司Alphabet旗下的投资部门,对一家专注于人形伴侣机器人研发的初创企业进行了战略投资。这一投资举动不仅彰显了谷歌对人形伴侣机器人未来发展的信心,也为人形伴侣机器人技术的发展注入了强大的技术力量。

    这种资本的狂欢也引发了市场的一些担忧,部分企业虽然被贴上了人形机器人的标签,但其实际业务与人形机器人的实质性关联并不强,股价的上涨缺乏坚实的业绩支撑。一些企业仅仅因为名称或业务中存在一些与机器人相关的元素,就被市场炒作,其股价的大幅波动可能会给投资者带来较大的风险。一旦市场热情消退,很可能面临大幅回调的风险。

    隐忧浮现:非理性繁荣的背后

    在人形伴侣机器人赛道一片火热的表象之下,隐忧正悄然浮现,非理性繁荣的背后,潜藏着诸多问题,犹如平静湖面下涌动的暗流,随时可能对这一新兴产业的健康发展构成威胁。

    概念炒作的乱象,是当前人形伴侣机器人赛道面临的首要问题。在资本市场的狂热追捧下,许多企业被贴上了人形机器人的标签,但其实际业务与人形机器人的关联性却微乎其微。

    技术落地的挑战,也是人形伴侣机器人发展道路上的一大阻碍。尽管目前人形伴侣机器人在技术上取得了一定的突破,但距离大规模商业化应用仍有很长的路要走。从核心零部件的性能来看,国内厂商在材料强度、摩擦系数等关键指标上与国际先进水平仍存在较大差距。在仿生皮肤、触觉传感器等关键部件的研发上,目前也大多处于实验室阶段,距离大规模量产和实际应用还有诸多技术难题需要攻克。

    在实际应用场景中,人形伴侣机器人也面临着诸多挑战。在家庭服务场景中,机器人的隐私保护问题成为用户关注的焦点。机器人在与用户交互过程中,会收集大量的用户数据,包括个人隐私信息、情感数据等,一旦这些数据泄露,将对用户的权益造成严重损害。

    伦理道德的争议,同样不容忽视。随着人形伴侣机器人情感交互功能的不断增强,人机之间的情感界限逐渐模糊。如果被不当使用,可能会引发隐私泄露风险,给用户带来潜在的伤害。

    虽然人形伴侣机器人赛道虽然充满了挑战,但也蕴含着巨大的机遇。只要能够解决好伦理道德、隐私安全、成本等问题,不断推动技术创新和应用场景拓展,人形伴侣机器人必将在未来的社会生活中发挥重要作用,为人们的生活带来更多的便利和美好 。

    来源:微信公众号 “韭菜财经APP”

  • 抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖

    抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖

    与OpenAI分手之后,Figure自研首个模型终于交卷了!

    不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。

    它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。

    果然,Figure的一大目标,就是发展家庭机器人。为此,其内部的AI需要像人一样推理,需要处理任何家庭用品。

    「机器人若不实现能力上的飞跃,将无法进入家庭领域」

    目前,Helix还主要用于Figure上半身控制,包括手腕、头、单个手指、甚至躯干,能以高速率执行复杂任务。

    只需一句话,机器人便可以拿起任何物品。

    当被要求「捡起沙漠物品」时,Helix会识别出玩具仙人掌,选择最近的手,并执行精确的电机指令以牢固地抓住它。

    还有生活中各种小物件,比如金属链、帽子、玩具等等,它皆精准「拿捏」。

    快看,它还会将物品放置在冰箱,而且是两个Figure协作完成。

    这是因为Helix是首个同时操控两台机器人的VLA,使他它们能够解决共同的、长序列操作任务,即使是处理从未见过的物品。

    有网友表示,这一刻让我瞬间不寒而栗。

    另有网友表示,「这非常令人印象深刻」,甚至有人马上想要买两台体验一下。

    值得一提的是,新款模型采用单一神经网络权重学习所有行为,无需任何特定的微调。

    而且,它还是首款完全在嵌入式低功耗GPU上运行的VLA,未来商业部署,甚至走入家庭近在咫尺。

    Helix:通用视觉-语言-动作模型

    家庭环境是机器人技术面临的最大挑战。

    与可控的工业环境不同,家庭中充满了无数物品——易碎的玻璃器皿、褶皱的衣物、散落的玩具——每个物品都有着不可预测的形状、尺寸、颜色和质地。

    要想让机器人在家庭中发挥作用,它们需要能够生成智能化的新行为来应对各种情况,特别是对于那些此前从未见过的物品。

    如果没有质的飞跃,当前的机器人技术将无法适应家庭环境。

    目前,仅仅教会机器人一个新行为就需要大量人力投入:要么需要博士级专家花费数小时进行手动编程,要么需要数千次示教。

    考虑到家庭环境问题的庞大性,这两种方法的成本都高得难以承受。

    图1:不同机器人技能获取方法的扩展曲线。在传统启发式控制中,技能的增长取决于博士研究人员的手动编程。在传统机器人模仿学习中,技能随数据采集量扩展。而采用Helix技术,只需通过自然语言即可实时定义新技能

    但在人工智能的其他领域已经掌握了即时泛化的能力。

    如果我们能够将视觉语言模型(Vision Language Models,VLM)中捕获的丰富语义知识直接转化为机器人动作,将会带来什么改变?

    这种新能力将从根本上改变机器人技术的发展轨迹(图1)。

    突然间,那些曾经需要数百次示教才能掌握的新技能,现在只需通过自然语言与机器人对话就能立即获得。

    关键问题在于:我们如何从VLM中提取所有这些常识知识,并将其转化为可泛化的机器人控制?Helix的构建正是为了跨越这一鸿沟。

    首创「系统1,系统2」VLA

    团队表示,Helix是首个由「系统1,系统2」组成的VLA,可以实现人形机器人上半身的高速精确控制。

    先前的VLM主干网络具有通用性但速度不快,机器人视觉运动策略速度快但缺乏通用性。而Helix通过两个系统解决了这个难题,两个系统经过端到端训练,并可以相互通信:

    系统2(S2):VLM主干网络,经互联网规模数据预训练,工作频率7-9Hz,用于场景和语言理解,可对不同的物体和场景进行泛化。

    系统1(S1):80M参数交叉注意力Transformer,依靠一个全卷积的多尺度视觉主干网络进行视觉处理,该网络在模拟环境中完成预训练初始化。

    这种解耦架构让每个系统都能在最佳时间尺度上运行,S2可以「慢思考」高层目标,S1通过「快思考」来实时执行和调整动作。

    例如,在协作中,S1能快速适应伙伴机器人的动作变化,同时维持S2设定的语义目标。

    Helix的设计相较现有方法具有以下几个关键优势:

    速度和泛化能力:Helix不仅达到了专门针对单任务行为克隆(behavioral cloning)策略的运行速度,还能够对数千个全新测试对象实现零样本学习。

    可扩展性:Helix能够直接输出高维动作空间的连续控制,避免了先前VLA方法中使用的复杂动作token化方案。这些方案虽然在低维控制设置(如二指夹爪)中取得了一定成功,但在高维人形机器人控制中面临扩展性挑战。

    架构简单:Helix采用标准架构——系统2使用开源、开放权重的视觉语言模型,系统1则采用简单的基于Transformer的视觉运动策略。

    职责分离:通过S1和S2的「解耦」,能够独立迭代优化每个系统,无需受限于寻找统一的观察空间或动作表示。

    模型和训练细节

    数据

    研究人员收集了一个高质量的、多机器人、多操作员的多样化遥操作行为数据集,总计约500小时。

    为了生成自然语言条件下的训练对,他们使用自动标注VLM来生成回顾性指令。

    VLM会处理来自机器人板载摄像头的分段视频片段,提示词是这样的:「如果要实现视频中看到的动作,你会给机器人什么指令?」

    为了防止数据干扰,所有训练中使用的物品都被排除在评估之外。

    架构

    这个系统主要包括两个主要组件,S2(VLM主干网络)和S1(基于潜层条件的视觉运动Transformer)。

    S2建立在一个经过互联网规模数据预训练的7B参数开源开放权重VLM之上。它处理单目机器人图像和机器人状态信息(包括手腕姿态和手指位置),将这些信息投影到视觉-语言嵌入空间中。

    结合指定期望行为的自然语言命令,S2会将所有与任务相关的语义信息提炼为单个连续潜层向量,传递给S1用于条件化其低层动作。

    其中S1是一个80M参数的交叉注意力(cross-attention)编码器-解码器Transformer,负责低层控制。它依赖于一个全卷积的多尺度视觉主干网络进行视觉处理,该网络完全在模拟环境中预训练初始化。

    虽然S1接收与S2相同的图像和状态输入,但它以更高的频率处理这些信息,以实现更快速的闭环控制。来自S2的潜层向量被投影到S1的token空间,并在序列维度上与S1视觉主干网络的视觉特征连接,提供任务条件。

    S1以200Hz的频率输出完整的上半身人形机器人控制信号,包括期望的手腕姿态、手指弯曲和外展控制,以及躯干和头部方向目标。

    另外,团队还在动作空间中,附加了一个合成的「任务完成百分比」动作,让Helix能预测自己的终止条件。这样,多个学习行为的序列化就更容易了。

    训练

    Helix采用完全端到端(end-to-end)的训练方式,将原始像素和文本命令映射到连续动作,使用标准回归损失。

    梯度通过用于条件化S1行为的潜在通信向量从S1反向传播到S2,实现两个组件的联合优化。

    Helix不需要任务特定的适配;它保持单一训练阶段和单一神经网络权重集,无需独立的动作输出头或每个任务的微调阶段。

    在训练过程中,研究中还在S1和S2输入之间添加了时间延迟。这个延迟经过校准,以匹配S1和S2在部署推理延迟之间的差距,确保部署期间的实时控制要求在训练中得到准确反映。

    优化的流式推理

    因为这种训练设计,Helix就能在Figure机器人上进行高效的模型并行部署了,每个机器人都配备了双低功耗嵌入式GPU。

    其中,推理流程在S2(高层潜规划)和S1(低层控制)模型之间分割,各自在专用GPU上运行。

    S2作为异步后台进程运行,处理最新的观察数据(机载相机和机器人状态)和自然语言命令。它会持续更新共享内存中的潜在向量,用于编码高层行为意图。

    而S1作为独立的实时进程执行,能维持平滑的整体上半身动作所需的关键200Hz控制循环。它会同时接收最新的观察数据和最近的S2潜在向量。

    S2和S1推理之间固有的速度差异,自然会导致S1以更高的时间分辨率处理机器人观察数据,为响应式控制创建更紧密的反馈循环。

    这种部署策略有意模仿训练中引入的时间延迟,最小化训练和推理之间的分布差异。异步执行模型允许两个进程以其最优频率运行,因此能以与最快的单任务模仿学习策略相当的速度运行Helix。

    结果

    精细化VLA全上半身控制

    Helix以200Hz的频率协调35个自由度的动作空间,控制从单个手指运动到末端执行器(end-effector)轨迹、头部注视和躯干姿态的所有动作。

    头部和躯干控制带来独特的挑战——当它们移动时,既会改变机器人的可达范围,也会改变它的可视范围,形成传统上容易导致系统不稳定的反馈循环。

    机器人在调整躯干以获得最佳可达范围的同时,用头部平滑地跟踪其手部动作,并保持精确的手指控制以进行抓取。

    从传统角度来看,即使对于单个已知任务,在如此高维(high-dimensional)的动作空间中实现这种精度一直被认为是极具挑战性的。

    目前,还没有VLA系统能够在保持通用泛化能力(适用于不同任务和物体)的同时,展示出这种程度的实时协调控制。

    零样本学习多机器人协调

    研究人员在一个具有挑战性的多智能体(multi-agent)操作场景中将Helix推向极限:两台Figure机器人之间的协作式零样本学习杂货存储任务。

    结果显示,机器人成功操作了在训练中从未见过的杂货,展示了对不同形状、尺寸和材料的强大通用泛化能力。

    此外,两个机器人使用完全相同的Helix模型权重(model weights)运行,无需针对特定机器人的训练或明确的角色分配。

    它们通过自然语言提示词来实现协调配合,比如「把饼干袋递给你右边的机器人」或「从你左边的机器人那里接过饼干袋并放入打开的抽屉中」。

    这是首次使用VLA实现多机器人之间的灵活、持续性协作任务,而且机器人能够成功处理完全陌生的物体,这一成就具有重要的里程碑意义。

    「任意物品拾取」能力涌现

    研究人员发现配备Helix的Figure机器人只需一个简单的「拾取[X]」指令就能拾取几乎任何小型家居物品。

    即使在杂乱的环境下,机器人也能成功处理从玻璃器皿和玩具到工具和衣物等数千件前所未见的物品,而这一切无需任何事先示范或定制编程。

    值得注意的是,Helix成功地连接了大规模语言理解能力与精确的机器人控制系统。

    例如,当接收到「拾取沙漠物品」这样的提示词时,Helix不仅能识别出玩具仙人掌符合这个抽象概念,还能选择最近的机械手臂并执行精确的运动指令(motor commands)来稳固抓取它。

    这种通用的「语言到动作」抓取能力为类人机器人在复杂且不确定的非结构化环境中的部署开创了激动人心的可能性。

    讨论

    Helix的训练极其高效

    Helix仅需极少的资源就实现了强大的物体识别和适应能力(物体泛化能力)。

    研究人员总共使用了约500小时的高质量监督数据(supervised data)来训练Helix,这仅占此前收集的VLA数据集规模的一小部分(<5%),而且无需依赖多机器人实体数据收集或多阶段训练。

    值得注意的是,这种数据收集规模更接近现代单任务模仿学习(imitation learning)数据集。尽管数据需求相对较小,Helix仍然可以扩展到更具挑战性的完整上肢人形机器人控制动作空间,成功实现高频率、高维度的输出控制。

    统一的模型权重系统

    现有的VLA系统通常需要专门的微调或专用的动作输出层来优化不同复杂行为的性能。

    然而,Helix却能使用单一统一模型就实现了各种任务的出色表现。

    仅使用一组神经网络权重(System 2使用70亿参数,System 1使用8千万参数),Helix就能够完成将物品放入各种容器、操作抽屉和冰箱、协调精确的多机器人交接,以及操作数千种全新物体等多样化任务。

    结论

    Helix是首个能够通过自然语言直接控制整个人形机器人上半身的视觉-语言-动作模型(Vision-Language-Action model)。

    与早期的机器人系统相比,Helix能够实时完成持续性、需要配合的精密操作,而无需任何特定任务示范或大量手动编程。

    Helix展现出卓越的物体适应能力,只需通过自然语言指令,就能拾取数千种在训练中从未接触过的家居物品,这些物品具有各种不同的形状、尺寸、颜色和材料特性。

    这标志着Figure在拓展人形机器人行为能力方面取得了突破性进展——研究人员相信,随着机器人在日常家居环境中的应用日益广泛,这一进展将发挥重要的推动作用。

    尽管这些初步成果令人振奋,但这仅仅是揭开了可能性的冰山一角。研究人员热切期待着将Helix的规模扩大至现有规模的千倍乃至更多时会带来怎样的突破。

    参考资料:HNYZs

    https://www.figure.ai/news/helix‍

    来源:微信公众号“新智元”

  • 马斯克“画饼”人形机器人,国内企业闷头搞实干

    马斯克“画饼”人形机器人,国内企业闷头搞实干

    你以为人形机器人会像电影里演的那样,一夜之间就统治世界,成为人类的“完美替代品”?

    错!

    现实中的人形机器人,虽已初露锋芒,却离“称霸”之路遥不可及,目前仍处于蹒跚学步的阶段。

    马斯克“画饼”人形机器人,国内企业闷头搞实干

    还记得特斯拉那场发布会吗?马斯克那叫一个自信满满,推出的人形机器人仿佛是未来生活的救星。

    他宣称,一旦生产规模扩大,成本将低至2-3万美元,实现人人可负担。并声称这款机器人功能强大,无论是带孩子、遛狗,还是端咖啡、购物、做家务,皆能轻松应对,堪称全能“保姆”。

    不得不承认,这“饼”画得确实诱人,但能否成真,仍需打上一个大大的问号。

    毕竟,从概念到量产,中间隔着无数技术和成本的“大坑”,这可不是靠嘴皮子就能填平的。

    再看看咱国内,可没有被马斯克的“大饼”迷惑,一直在闷头搞研发。

    外交部发言人林剑就曾分享过一款中国公司研发的AI人形机器人,能敲核桃、煎面包、折叠身体,像个便携式管家。

    尽管这只是中国在人形机器人领域迈出的一小步,却足以彰显国内企业在该领域的实力与潜力。

    深圳星辰智能的Astribot S1,毛笔字写得飘逸,衣物熨得平整,炒菜颠锅手法娴熟。

    前华为天才少年打造的智源机器人,移动迅速,承载重物不在话下。

    富里夜智能GR、语数科技G1、优必选Walker系列等,如雨后春笋般涌现,各显神通。

    从工厂自主搬运的优必选Walker S1,到家庭服务乐居机器人夸父,再到全球首例纯电驱动全尺寸人形机器人拟人奔跑的天工,国内人形机器人市场一片喧嚣,新兴产业蓬勃发展的景象跃然眼前。

    然而,这繁花似锦的背后,真的如表面那般光鲜亮丽吗?拨开迷雾,我们看到的却是一系列令人忧心的问题。

    优必选陷盈利困境

    人形机器人产业的企业,可能正走在一条布满荆棘的道路上。就拿“人形机器人第一股”深圳优必选来说,它的遭遇就是一出活生生的警示剧。

    花开两朵,先看“优点”。

    优必选人形机器人家族,囊括Walker S系列、S Lite及协同先锋S1。

    Walker S系列作为工业人形机器人代表,身高1.7米的Walker S、1.3米的S Lite及协同工作先锋S1,各展所长。

    S1作为全球首款能与无人物流车等协同作业的机器人,展现了其技术上的领先优势。优必选在伺服驱动、大模型、语义VSLAM等技术上不断突破,确保机器人在工业场景中安全稳定服务。

    再看资本市场反馈,2023年12月29日,优必选风光登陆港交所,发行价90港元,股价一度飙升,最高达到328港元/股,市值直冲1416亿港元,那气势,犹如人形机器人行业的黄金时代已悄然开启。

    好景不长,财报一出,一切都变了味。

    2023年,营收10.47亿元,归母净亏损却高达12.34亿元;2024年中报,营收4.80亿元,归母净亏损5.16亿元。

    这些数字,让人不禁为之一惊。

    别看优必选的工业人形机器人Walker S1在比亚迪汽车工厂实训表现不错,效率提升一倍,稳定性提升30%,还拿到了多家车厂的超500台意向订单,预计今年Q2就能规模化交付。

    但业绩亏损的巨坑,却非轻易能够填补。

    股价四个交易日内暴跌近50%,这哪是市场情绪波动那么简单,分明就是对优必选盈利能力的彻底否定。

    那些看似繁华的产品展示背后,实则隐藏着企业盈利的重重难关。优必选的问题,可不是个例。整个人形机器人行业,都可能面临这样的困境。

    人形机器人普及之路漫漫其修远兮

    当所有人都在幻想人形机器人即将开启智能生活新篇章时,一盆冷水泼下。

    人形机器人的商业化之路,远没有想象中那么顺畅。

    技术瓶颈就像一道难以逾越的鸿沟。

    人形机器人的关键零部件,比如关节、电机、传感器,精度大多还在厘米级徘徊,跟工业级的毫米级精度比,那可是差了一大截。想让它干点精密活儿,比如制造精密仪器、做微创手术,那简直是难如登天。

    再说算法,多算法协同能力弱得可怜,感知、认知、决策、执行,哪个环节都跟不上趟儿,一遇到复杂环境就蒙圈。

    续航亦是难题,人形机器人能耗巨大,而电池技术滞后,导致其工作时间和活动范围受限,令人颇为头疼。

    接着是成本瓶颈。

    硬件成本居高不下,尤其是关节部分,占比高达三分之二。以伺服电机为例,国外售价在2000至3000元之间,而一个人形机器人需配备20至30个,仅电机成本便高达十万余元。

    这么高的成本,普通消费者哪买得起?

    研发成本也不低,人形机器人涉及的前沿技术太多,研发难度大、周期长,资金投入像个无底洞,企业想盈利,难!

    市场和应用瓶颈也是个大问题。

    人形机器人现在能干的活儿太有限,主要集中在工业生产、物流仓储这些特定领域。

    家庭、医疗、教育等更广阔的天地,它还进不去,商业模式和大规模应用的切入点都没找到。

    消费者对人形机器人也是半信半疑,担心它不安全、不可靠、不实用,甚至还可能引发伦理和社会问题。

    最后是人才瓶颈。

    人形机器人的研发和生产,需要跨学科的复合型人才,可这类人才太稀缺了。高校和职业院校在相关领域的专业设置与课程体系尚不完善,迫使企业不得不自行培养所需人才,这无疑加大了企业在时间与资源上的投入。

    此外,隐私与安全问题同样不容忽视,人形机器人一旦进入家庭,我们的私人生活将无时不刻不被这一智能设备所记录。一旦数据泄露或被恶意利用,后果不堪设想。

    【结语】

    人形机器人的商业化之路,步步艰难。技术、成本、市场、人才,四大瓶颈像四座大山。可见,人形机器人要想真正成为改变人类生活的重要力量,还有很长的路要走。

    来源:微信公众号“大局财经”

  • 国投集团,再投人形机器人

    人形机器人赛道再获新融资。

    近日,人形机器人企业灵宝CASBOT宣布完成新一轮融资,至此,灵宝CASBOT融资额累计已超亿元人民币,投资方包括:联想创投、国投创合、河南资产基金等。

    据悉,本轮融资将主要用于加速推进人形机器人量产及核心技术的研发,进一步巩固灵宝CASBOT在市场竞争和技术创新方面的双重优势。

    灵宝CASBOT联创&COO张淼向创投日报记者表示,目前,灵宝CASBOT正按照2025年的目标,稳步推进订单交付,预计在今年实现小规模量产。

    01 定位多场景落地的通用类脑智能机器人

    灵宝CASBOT成立于2023年,致力于研发面向场景落地的通用人形机器人和具身智能产品。公司核心团队由来自国内外顶尖高校和科技企业的业内人士组成,在智能机器人、精密装配、视觉伺服、机器人技能学习等专业领域拥有超过20年的研究经验积累。

    2024年11月13日,灵宝CASBOT发布了首款双足人形机器人产品“CASBOT 01”,定位通用类脑智能机器人,整机拥有52个自由度,算力达550T,续航时间超过4小时。

    得益于“从大脑到小脑到本体再到仿生灵巧手”的全栈技术支撑,CASBOT 01实现了高性能全身一体化控制和长时序灵巧操作,能够广泛应用于工业制造、商业服务、家庭社区等多个领域。

    在2024年中关村仿生机器人大赛上,灵宝CASBOT团队获得人形仿生机器人赛道作业赛第一名、具身智能大模型赛道工业场景第一名。

    另外,在人形机器人关键的灵巧手方面,灵宝CASBOT五指灵巧手能做到弹钢琴和打螺丝等精细化作业,具有高强度、高刚度、低自重的特点,适用于家庭服务、工业装配等多种应用场景。

    关于目前灵宝CASBOT的智能水平所处阶段,张淼向创投日报记者表示,公司基于分层端到端架构,从运动智能、操作智能与认知智能三大维度构建技术体系。

    在运动智能方面,具备了全地形适应能力。机器人可在非结构化地形,如楼梯、斜坡及碎石等路面保持稳定拟人步态,并在跌倒后通过全身协同控制完成自主复位。

    在操作智能层面,灵宝 CASBOT 实现了涵盖物体转运等基础操作,以及亚毫米级精密装配这类高精度操作的通用技能体系构建 。借助先进的触觉 – 视觉多模态伺服控制技术,机器人的末端执行器能够敏锐捕捉接触力反馈,并据此实时、精准地调整抓取策略,以应对各类复杂操作场景。

    在认知智能方面,CASBOT 01搭载的CASBOT Embodied Brain整合了视觉-语言-环境状态的多模态大模型,能够实现高级环境感知、复杂任务分解,使机器人可理解自然语言指令,执行包含条件判断与逻辑推理的多步操作。

    谈及2025年及未来几年的量产目标和市场推广策略,张淼介绍,今年的目标是将产品完美地交付给客户,建立售前售中售后的完整链路。市场推广方面,2025年将结合灵宝在工业制造领域的优势,形成有行业竞争壁垒的产品和方案。“例如,在工业制造领域,我们已经与联想在智能制造领域达成深度业务合作。”

    据悉,灵宝CASBOT已经在应急救援、井下作业、工业制造和商业服务等多个领域积累了众多合作伙伴。

    据创投日报记者不完全统计,国内致力于人形机器人领域的企业还包括优必选、达闼科技、银河通用Galbot、宇树科技、以及逐际动力等。

    02 国投系联手河南国资出手

    成立至今,灵宝CASBOT一共经历了2轮融资。包括上一轮的联想创投和这一轮的国投创合。

    其中,联想创投于2016年正式成立,专注于科技产业投资。联想集团高级总监、联想创投董事总经理顾正斌表示,灵宝CASBOT在工业、煤炭等场景上落地快,非常务实。

    创投日报记者注意到,在机器人领域,联想创投此前还投资了服务机器人开发企业云迹科技、物流机器人企业未来机器人、人形机器人企业逐际动力等。

    本轮投资方国投创合,则是国投集团旗下专业的引导基金及产业基金管理机构,直接管理规模超过400亿元,专注于战略性新兴产业领域的股权投资、创业投资及基金投资,合计支持了4000多家创新型科技企业,其中230余家已上市。

    国投创合针对本次投资表示,灵宝CASBOT已实现人形机器人多地形快速稳定行走和复杂作业场景下的精密操控,团队技术底蕴深厚,研发及迭代速度快,优先面向高价值场景推出产品及服务,商业路径清晰。

    本轮另一投资方河南资产基金是河南资产管理有限公司(以下简称“河南资产”)的全资子公司,成立于2018年5月,河南资产成立于2017年8月8日,注册资本60亿元,是河南省人民政府批准设立并经银监会备案具有金融不良资产批量收购业务资质的地方资产管理公司。

    值得一提的是,灵宝CASBOT的创始人兼董事长张正涛,也是中国科学院自动化研究所研究员、博士生导师。2016年,他决定先投身自动检测行业的创业之中,并把一家初创公司做成了细分领域的世界第一。

    经过沉淀,张正涛既有深耕机器人领域十几年的技术沉淀,又深谙将技术转化为产业动能的商业逻辑。2023年8月,他创立灵宝CASBOT,入局人形机器人领域。据悉,公司预计在今年发布双足、轮式人形机器人整机产品和全新灵巧手。

    来源:微信公众号“创投日报”

  • 1个顶5个!机器人开始抢饮品打工人的活儿了

    1个顶5个!机器人开始抢饮品打工人的活儿了

    还记得在春晚扭秧歌的机器人吗?它们在全国甚至全世界观众面前大出风头。

    但你可能不知道,机器人早已入侵饮品业,干起茶饮店员和咖啡师的活儿,甚至“一个机器人就能开一家店”。

    AI时代,机器人要取代饮品打工人了?

    做冰淇淋、做咖啡

    机器人正在抢饮品店员的活

    今年春晚捧红了“机器人”。    迈着小碎步,灵活地转手绢,跟着音乐扭秧歌,引发全民热议。

    最近,春晚“顶流”机器人火到饮品行业,    “机器人做冰淇淋/奶茶/咖啡”等视频正在网络走红。

    在一条“机器人做冰淇淋”的热门视频中,一个机器人手臂捏着蛋筒,准确地放在冰淇淋机下,有节奏地小幅度扭动几下,一个形状完美的冰淇淋便做好了,并“贴心”地递到顾客面前。

    春晚机器人和网友分享的“机器人做冰淇淋”

    该视频收获9000多点赞,网友表示“它扭得那几下,我一辈子都学不会”,甚至连海底捞国际版账号也留言发问“可以来捞面吗?”

    事实上,机器人“入侵”饮品行业已经有一段时间了 ,与上春晚的人形机器人不同,它们大多是“自动化饮品设备+机械臂”的形态,代替店员制作饮品:

    • 库迪旗下茶饮品牌茶猫开业时,一度将“机器人做奶茶”作为宣传卖点;
    • 去年,北京地铁19号线就出现许多机器人奶茶亭;
    • 哈工大食堂、西安、南昌等地的博物馆和科技馆,都有机器人做咖啡;
    • 深圳、合肥、北京等地的独立咖啡馆,引入机器人拉花、做手冲咖啡
    • ……

    机器人的应用热潮更是催生出许多主打“智能化”的饮品品牌,比如freshcube鲜饮站、HOOLOO呼噜咖啡、茉茶理等。

    HOOLOO呼噜咖啡

    当机器人开始做饮品,会对从业者带来什么影响?

    一个机器人  ,就能开一家店?

    饮品机器人有多智能?目前行业应用到什么程度了?

    我联系睿尔曼智能科技有限公司进行了解,这是一家专注于超轻量仿人机械臂研发生产的高新技术企业,在打造智能通用机器人方面经验丰富。

    其新餐饮事业部销售总监张悫告诉我,目前国内用于服务饮品行业的机器人技术较为成熟,产品形态主要有两种:

    一种是“开放式”,将机械臂设计与饮品店吧台融为一体;另一种“封闭式”,即“机器人饮品亭/站”,实现“一个机器人就能开一家店”。

    后者相对主流。以机器人咖啡站为例,通过集成方式联结一台全自动咖啡机、1或2条机械臂、落杯器、制冰机、粉料机、水箱、奶箱等模块,    占地三四平米左右,从点单到出餐全流程智能化。

    楷这样一家店,相当于代替一家传统饮品店四到五人的配置。

    一般来说,系统会提供十几种咖啡选项。顾客在点餐屏下单后,落杯器自动脱落一个纸杯,机械臂将其拿到全自动咖啡机下,按照设定程序萃取咖啡液,加牛奶等物料。

    做好之后,盖盖将咖啡放到指定位置,通过窗口“推送”到顾客面前,机器人还会发出“饮品已做好,请取餐”的语音提示。

    一杯出品时间在1分半以内,如果是美式或操作更简单的饮品,用时更少。

    机器的电子屏动态展示品牌宣传内容、咖啡豆产地信息以及当前制作状态等。不少顾客表示,    制作过程有一定视觉吸引力    ,等待期间不无聊。

    机器人还具备    智能统筹能力    ,遇到连续出杯的情况,会一边接牛奶,一边准备下一杯的咖啡液或冰块,提高效率。

    有的机器人    还有“打标签”功能    ,可为饮品贴标签,应对多杯和线上点单场景。

    咖啡店的一些常见问题,机器人也能“从容”应对。比如某杯制作时出现瑕疵,    机器人会自动倒进垃圾桶,重做一杯。

    如果设备故障导致机器人无法正常工作,工程师可以远程操作修复,顾客也可以拨打电话联系退款。

    机器人能做得越多,人要做得越少。

    “只需营业前添加物料、开机,营业结束后清洗、关机即可。”张悫说。

    经营者可在后台实时监控,比如做了多少杯、是否有异常、物料是否充足等,不在店也能“管好生意”。

    与常规门店相比,机器人咖啡亭对选址要求不高,保持通电即可正常运行。一次装满物料,可出100~150杯。

    由于“开店”相对灵活,一定程度上可以解决淡旺季的问题。

    “平时可以放在学校,假期挪到商场、景区等客流量高的地方。”    张悫说,尤其是景区、博物馆等地的顾客对效率要求不那么高,而且机器人做咖啡自带噱头和打卡属性,往往很受欢迎。

    我还了解到,许多城市已经为包括机器人饮品站在内的全自动设备现制现售饮品企业,办理了食品经营许可证。 “北京、深圳等一线城市普及度较高。”

    机器人会取代饮品店打工人吗?

    近年来,各大连锁门店相继用上了全自动泡茶机、奶茶机,明显感觉到,饮品行业的智能化进程加速。

    从操作上来说,机器人已经替代部分人力。甚至相比开一家传统奶茶店需要五名员工,一个机器人就能开一家店,那么未来饮品店员会被取代吗?

    多位业内人士持保留意见。

    店员正在使用佳泽泡茶机制茶

    首先,成本是最关键的因素。

    我了解到,机器人机械臂每条至少两三万,为了保证饮品的多样性和稳定性,往往需配套价格不菲的进口咖啡机,整体“开店”价格在15~35万之间。

    “造价高,长期的维修成本也要考虑,整体拉高了使用门槛”,成都Auncel Coffee称咖啡的主理人蔡元凯说。

    其次,现制饮品的丰富程度和更新频率,让机器人“有心无力”。

    “机器人生产商的技术创新往往集中于硬件和软件,产品研发属食品专业人员的工作范畴。”张悫说,“未来或催生一批专门负责机器人食品研发的工程师,但目前还未形成气候。”

    哪怕是机器人最擅长的流程化操作,实际落地过程中也面临诸多挑战。

    “流水线”咖啡

    “做一杯饮品看起来简单,其实流程非常繁杂,比如奶茶仅备料这件事机器人就操作不了。如果无法完全脱离人工,就没有太大的意义。”蔡元凯说。

    “ 由于没有后厨,出品多,补料会很麻烦;出品少,投入和回报不成正比。”某设备供应商说。

    最后,消费者是否愿意持续为机器人饮品买单,目前存疑。

    消费者可能会为了噱头尝鲜,但长期看来,“一杯机器做的饮品,如果价格不占优势,相比即饮咖啡或者动辄9块9的现制咖啡,仍缺乏一定竞争力。”蔡元凯说。

    他还提到,现制饮品的顾客喜好千人千面,至少目前的机器人无法精准满足客制化需求。

    最根本的是,消费者对于一杯饮品的需求,也绝不仅仅是饮品而已,与店员的互动、手作的价值感等都是不可或缺的消费体验。

    基于这些,包括张悫在内的多位业内外人士认为,机器人的最佳角色是“人机协作”提高效率 ,比如代替店员处理水果,协助咖啡师手冲、出杯,而非取代人力。

    尽管机器人在短期内很难代替打工人,但其所代表的“智能化”趋势依然值得关注。

    蔡元凯说:“行业对于智能化设备有持续需求,供人使用的高效、简单的新型高科技设备是长期发展方向。”

    结语

    人类面对新质生产力时,总会无法抑制地对自身存在产生忧虑。

    但就像DeepSeek所说,AI不会取代人类,就像望远镜不会取代天文学家。

    AI时代到来,给饮品人带来的真正危机是,如何在效率和服务之间做好平衡,让每一杯饮品在流水线的速度中,依然流淌着手作的温度。