作者: sodudu

  • 马斯克宣布Grok 3免费,用户气晕了……

    马斯克宣布Grok 3免费,用户气晕了……

    刚刚发布48小时,Grok 3的第一批“受害人”就出现了。

    有用户才花40美元订阅了X的Premium+服务,想要畅玩xAI的最新一代大模型Grok 3,结果一看马斯克在社交媒体X上的豪言,心凉了半截。

    “短期内,Grok 3将免费提供给所有人!”马斯克如是说。而xAI的官方X账号则放出豪言,免费开放,“直到服务器崩溃”。

    几个小时之后,马斯克又快乐截图苹果应用商店生产力工具榜单,Grok的独立应用登顶免费榜,这也是其首次超越ChatGPT。马斯克还强调,这还是语音模式还没推出的情况下。

    马斯克大手一挥当好人,本来就是免费用户的有福了,为信仰充值Premium+的用户成了大冤种。

    “兄弟,你是说我白白升了个级?”用户在相关消息的评论区无奈地说,还加上了两个小丑emoji,谁是小丑咱都不好意思点名。

    更别提“每月40美元”也是在发布会之后涨价的结果,要不是Grok 3发布,X平台美国区Premium+的订阅费用仅为22美元。

    Grok 3本就被视为马斯克针对OpenAI和DeepSeek的反击之作,尤其是推理模型Grok Reasoning更是把马斯克的心思展露无遗。

    如今的免费一跃,也是xAI进一步在和两个竞争对手靠近。DeepSeek压根还没有面向普通用户推出付费计划,而OpenAI也在DeepSeek大火之后,将推理模型o3-mini下放给了免费用户。

    只是咱们看齐归看齐,免费归免费,也不能这么突然、不顾付费用户死活吧?

    A

    Grok 3发布后的48小时,可真够乱的。

    Grok 3的发布会在北京时间2月18日上午12点播出,彼时马斯克表示,试用的最低门槛是X的Premium+用户,每月订阅费22美元(美国区价格,下同)。此外,用户还可以在独立于X平台的Grok应用内,付费开通单独的SuperGrok服务。

    SuperGrok是这次xAI才推出的新订阅计划,费用据报道会在每月40美元的水平。

    然而,到了昨天上午,也就是Grok 3发布不到24小时的时候,人们惊讶地发现:马斯克偷偷给X平台的Premium+涨了个价?

    前情提要:马斯克收购推特之后,将平台改名为X,并推出了订阅服务。X的订阅服务分为三个层级,分别是X Basic、X Premium、X Premium+(标准杯、大杯、超大杯)。在xAI成立后,马斯克进一步将大模型Grok也接入到X的订阅服务当中,作为尊贵订阅用户的一项特权功能。

    当然,接入大模型,X的订阅服务也开始变贵。去年12月,X Premium+已经从16美元涨价至22美元。

    而Grok 3发布之后,这个价格突然就从22美元进一步涨到了40美元。美国之外的其他市场也同步涨价,如英国从每月17英镑涨至35英镑;法国、德国等欧洲国家从每月21欧元上涨至38欧元。

    虽然没有明说,但用户普遍认为这是在为Grok 3付费,毕竟其他两档计划的订阅费用不变,因此形成了3美元、8美元,突然跃升到40美元的奇怪格局,两档订阅之间的跨越过大。

    一天前还说Grok 3首先让Premium +用户享受上,马斯克甚至在发布会上鼓励大家感兴趣的话去开通订阅服务。结果一转眼价格几乎翻倍?就挺突然的,也挺不讲武德的。

    而且,Grok应用中购买SuperGrok的话,每月50美元或者每年350美元,价格也比之前外界预估的要贵不少。

    而且,升级到Premium+的用户发现,Grok 3确实可以用上了,但是限制的条数给得也太少了:

    最让人崩溃的是,又过了一天,也就是北京时间2月20日上午十点半,xAI的X官方账号突然宣布:“全世界最聪明的AI,Grok 3,现在免费(直到我们的服务器崩溃)”。

    而马斯克也转发了这条消息:“短期内,Grok 3全面免费!”

    果不其然,刚刚付费(花40美元)升级到X Premium+的用户emo了。

    之前还在X上和人辩论称有Grok 3的Premium+绝对值22美元一个月的价格,结果转眼看到涨价消息,也赶紧撇清自己:“对Grok我已经没有什么好话讲了。”

    甚至有人引用了一年前马斯克的帖子,来表达对他破坏承诺的不满。在那条帖子中,马斯克承诺今后所有订阅超过5000人的X用户都将自动获得Premium+的权益。

    信谁能得永生咱不知道,但信马斯克很有可能被背刺。

    B

    虽然看起来马斯克发布了“全世界最聪明的AI”,而且还豪气地将之免费,但这背后反而暴露了些许焦虑。

    免费的决策很有可能是没有经过深思熟虑的。

    如今场面依旧十分混乱:

    第一,经过用户不断在X上互相勾兑(交头接耳),才终于搞明白,Grok 3被声称免费开放了,但是免费用户似乎获得的是Grok 3的beta版本;Premium+用户可以用推理模型,有“深度搜索(DeepSearch)”和“推理(Reasoning)”,SuperGrok则有更多功能和无限的图像生成权限。

    第二,免费用户每小时请求的数量十分有限。官方没有给出确切数字,有用户反馈大概是每小时请求5次的限额。而X的Premium+和Grok的SuperGrok用户,据说是有更多限额,每日请求次数更多,但具体多少,没有准话。

    第三,Premium+涨价到40美元,但订阅费用似乎飘忽不定。国外科技媒体TechChurch测试发现,注册时显示39.83美元/月、477.95美元/年,最终结账页面却显示395美元/年。

    如果一个用户对Grok3十分感兴趣,要搞清楚究竟是免费的就够用,还是要付费、付费的话又是哪一种方案最适合自己,又最终需要付多少钱,需要自己好好做一番功课。

    相比而言,OpenAI的ChatGPT推出两年多了,只有三种方案,即免费、每月20美元的Plus和每月300美元的Pro;而谷歌把Gemini Advanced放在了谷歌的订阅“大礼包”之中,即每月20美元的Google One AI Premium。

    各个订阅层之间的区别、定价,急需马斯克归置归置。

    C

    突然免费,可能也和48小时内用户对Grok3的反馈有关。面对DeepSeek的横空出世和OpenAI的快速跟进,马斯克端上Grok3,并不断强调这是“地球上最聪明的AI”。

    从xAI放出的Grok3在各种基准测试中的成绩,不难看出其实力的确过硬。但能否担得上“地表最强”,还要打一个问号。

    毕竟傲娇如马斯克,都不断强调现在只是测试阶段,还呼吁大家务必反馈一切使用中遇到的问题。并且,马斯克给出了一些承诺,称语音模式等在路上,需要大概一周的时间和大家见面。

    Grok3发布之后,各路测试接踵而至,但并未见到Grok3在各个方面碾压同行。至少比起两年前ChatGPT发布或今年DeepSeek走红所引起的轰动相比,Grok3可以说雷声很大,但雨点有那么一点点小了。

    在xAI官方账号宣布Grok3免费的消息下,有很多评论都在表达对Grok3的失望,甚至是排着队接连出现,诉说自己提了多么简单的请求,而Grok3又是怎样地没有成功应答。

    到最后,Grok3最出圈的依然是剑走偏锋的“没底线”。

    主打“反觉醒”的Grok向来不会像竞争对手一样浑身都是敏感点、动不动就拒绝回答问题,不管是生成名人图片,还是回答敏感问题,抑或是“搞颜色”,Grok都很“大胆”。(而且生成裸体图片、讨论冒犯性话题等的安全栏已经被火速提高了,Grok3当下已经没有刚发布的时候那么狂野)。

    在不远处,竞争对手也要更新模型了,如Anthropic很有可能在本周发布Claude 4。

    而马斯克的Grok和“世界最聪明的AI”之间,大概不止一句“免费”和几张裸体照片的距离。

    来源:微信公众号“直面派”

  • 抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖

    抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖

    与OpenAI分手之后,Figure自研首个模型终于交卷了!

    不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。

    它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。

    果然,Figure的一大目标,就是发展家庭机器人。为此,其内部的AI需要像人一样推理,需要处理任何家庭用品。

    「机器人若不实现能力上的飞跃,将无法进入家庭领域」

    目前,Helix还主要用于Figure上半身控制,包括手腕、头、单个手指、甚至躯干,能以高速率执行复杂任务。

    只需一句话,机器人便可以拿起任何物品。

    当被要求「捡起沙漠物品」时,Helix会识别出玩具仙人掌,选择最近的手,并执行精确的电机指令以牢固地抓住它。

    还有生活中各种小物件,比如金属链、帽子、玩具等等,它皆精准「拿捏」。

    快看,它还会将物品放置在冰箱,而且是两个Figure协作完成。

    这是因为Helix是首个同时操控两台机器人的VLA,使他它们能够解决共同的、长序列操作任务,即使是处理从未见过的物品。

    有网友表示,这一刻让我瞬间不寒而栗。

    另有网友表示,「这非常令人印象深刻」,甚至有人马上想要买两台体验一下。

    值得一提的是,新款模型采用单一神经网络权重学习所有行为,无需任何特定的微调。

    而且,它还是首款完全在嵌入式低功耗GPU上运行的VLA,未来商业部署,甚至走入家庭近在咫尺。

    Helix:通用视觉-语言-动作模型

    家庭环境是机器人技术面临的最大挑战。

    与可控的工业环境不同,家庭中充满了无数物品——易碎的玻璃器皿、褶皱的衣物、散落的玩具——每个物品都有着不可预测的形状、尺寸、颜色和质地。

    要想让机器人在家庭中发挥作用,它们需要能够生成智能化的新行为来应对各种情况,特别是对于那些此前从未见过的物品。

    如果没有质的飞跃,当前的机器人技术将无法适应家庭环境。

    目前,仅仅教会机器人一个新行为就需要大量人力投入:要么需要博士级专家花费数小时进行手动编程,要么需要数千次示教。

    考虑到家庭环境问题的庞大性,这两种方法的成本都高得难以承受。

    图1:不同机器人技能获取方法的扩展曲线。在传统启发式控制中,技能的增长取决于博士研究人员的手动编程。在传统机器人模仿学习中,技能随数据采集量扩展。而采用Helix技术,只需通过自然语言即可实时定义新技能

    但在人工智能的其他领域已经掌握了即时泛化的能力。

    如果我们能够将视觉语言模型(Vision Language Models,VLM)中捕获的丰富语义知识直接转化为机器人动作,将会带来什么改变?

    这种新能力将从根本上改变机器人技术的发展轨迹(图1)。

    突然间,那些曾经需要数百次示教才能掌握的新技能,现在只需通过自然语言与机器人对话就能立即获得。

    关键问题在于:我们如何从VLM中提取所有这些常识知识,并将其转化为可泛化的机器人控制?Helix的构建正是为了跨越这一鸿沟。

    首创「系统1,系统2」VLA

    团队表示,Helix是首个由「系统1,系统2」组成的VLA,可以实现人形机器人上半身的高速精确控制。

    先前的VLM主干网络具有通用性但速度不快,机器人视觉运动策略速度快但缺乏通用性。而Helix通过两个系统解决了这个难题,两个系统经过端到端训练,并可以相互通信:

    系统2(S2):VLM主干网络,经互联网规模数据预训练,工作频率7-9Hz,用于场景和语言理解,可对不同的物体和场景进行泛化。

    系统1(S1):80M参数交叉注意力Transformer,依靠一个全卷积的多尺度视觉主干网络进行视觉处理,该网络在模拟环境中完成预训练初始化。

    这种解耦架构让每个系统都能在最佳时间尺度上运行,S2可以「慢思考」高层目标,S1通过「快思考」来实时执行和调整动作。

    例如,在协作中,S1能快速适应伙伴机器人的动作变化,同时维持S2设定的语义目标。

    Helix的设计相较现有方法具有以下几个关键优势:

    速度和泛化能力:Helix不仅达到了专门针对单任务行为克隆(behavioral cloning)策略的运行速度,还能够对数千个全新测试对象实现零样本学习。

    可扩展性:Helix能够直接输出高维动作空间的连续控制,避免了先前VLA方法中使用的复杂动作token化方案。这些方案虽然在低维控制设置(如二指夹爪)中取得了一定成功,但在高维人形机器人控制中面临扩展性挑战。

    架构简单:Helix采用标准架构——系统2使用开源、开放权重的视觉语言模型,系统1则采用简单的基于Transformer的视觉运动策略。

    职责分离:通过S1和S2的「解耦」,能够独立迭代优化每个系统,无需受限于寻找统一的观察空间或动作表示。

    模型和训练细节

    数据

    研究人员收集了一个高质量的、多机器人、多操作员的多样化遥操作行为数据集,总计约500小时。

    为了生成自然语言条件下的训练对,他们使用自动标注VLM来生成回顾性指令。

    VLM会处理来自机器人板载摄像头的分段视频片段,提示词是这样的:「如果要实现视频中看到的动作,你会给机器人什么指令?」

    为了防止数据干扰,所有训练中使用的物品都被排除在评估之外。

    架构

    这个系统主要包括两个主要组件,S2(VLM主干网络)和S1(基于潜层条件的视觉运动Transformer)。

    S2建立在一个经过互联网规模数据预训练的7B参数开源开放权重VLM之上。它处理单目机器人图像和机器人状态信息(包括手腕姿态和手指位置),将这些信息投影到视觉-语言嵌入空间中。

    结合指定期望行为的自然语言命令,S2会将所有与任务相关的语义信息提炼为单个连续潜层向量,传递给S1用于条件化其低层动作。

    其中S1是一个80M参数的交叉注意力(cross-attention)编码器-解码器Transformer,负责低层控制。它依赖于一个全卷积的多尺度视觉主干网络进行视觉处理,该网络完全在模拟环境中预训练初始化。

    虽然S1接收与S2相同的图像和状态输入,但它以更高的频率处理这些信息,以实现更快速的闭环控制。来自S2的潜层向量被投影到S1的token空间,并在序列维度上与S1视觉主干网络的视觉特征连接,提供任务条件。

    S1以200Hz的频率输出完整的上半身人形机器人控制信号,包括期望的手腕姿态、手指弯曲和外展控制,以及躯干和头部方向目标。

    另外,团队还在动作空间中,附加了一个合成的「任务完成百分比」动作,让Helix能预测自己的终止条件。这样,多个学习行为的序列化就更容易了。

    训练

    Helix采用完全端到端(end-to-end)的训练方式,将原始像素和文本命令映射到连续动作,使用标准回归损失。

    梯度通过用于条件化S1行为的潜在通信向量从S1反向传播到S2,实现两个组件的联合优化。

    Helix不需要任务特定的适配;它保持单一训练阶段和单一神经网络权重集,无需独立的动作输出头或每个任务的微调阶段。

    在训练过程中,研究中还在S1和S2输入之间添加了时间延迟。这个延迟经过校准,以匹配S1和S2在部署推理延迟之间的差距,确保部署期间的实时控制要求在训练中得到准确反映。

    优化的流式推理

    因为这种训练设计,Helix就能在Figure机器人上进行高效的模型并行部署了,每个机器人都配备了双低功耗嵌入式GPU。

    其中,推理流程在S2(高层潜规划)和S1(低层控制)模型之间分割,各自在专用GPU上运行。

    S2作为异步后台进程运行,处理最新的观察数据(机载相机和机器人状态)和自然语言命令。它会持续更新共享内存中的潜在向量,用于编码高层行为意图。

    而S1作为独立的实时进程执行,能维持平滑的整体上半身动作所需的关键200Hz控制循环。它会同时接收最新的观察数据和最近的S2潜在向量。

    S2和S1推理之间固有的速度差异,自然会导致S1以更高的时间分辨率处理机器人观察数据,为响应式控制创建更紧密的反馈循环。

    这种部署策略有意模仿训练中引入的时间延迟,最小化训练和推理之间的分布差异。异步执行模型允许两个进程以其最优频率运行,因此能以与最快的单任务模仿学习策略相当的速度运行Helix。

    结果

    精细化VLA全上半身控制

    Helix以200Hz的频率协调35个自由度的动作空间,控制从单个手指运动到末端执行器(end-effector)轨迹、头部注视和躯干姿态的所有动作。

    头部和躯干控制带来独特的挑战——当它们移动时,既会改变机器人的可达范围,也会改变它的可视范围,形成传统上容易导致系统不稳定的反馈循环。

    机器人在调整躯干以获得最佳可达范围的同时,用头部平滑地跟踪其手部动作,并保持精确的手指控制以进行抓取。

    从传统角度来看,即使对于单个已知任务,在如此高维(high-dimensional)的动作空间中实现这种精度一直被认为是极具挑战性的。

    目前,还没有VLA系统能够在保持通用泛化能力(适用于不同任务和物体)的同时,展示出这种程度的实时协调控制。

    零样本学习多机器人协调

    研究人员在一个具有挑战性的多智能体(multi-agent)操作场景中将Helix推向极限:两台Figure机器人之间的协作式零样本学习杂货存储任务。

    结果显示,机器人成功操作了在训练中从未见过的杂货,展示了对不同形状、尺寸和材料的强大通用泛化能力。

    此外,两个机器人使用完全相同的Helix模型权重(model weights)运行,无需针对特定机器人的训练或明确的角色分配。

    它们通过自然语言提示词来实现协调配合,比如「把饼干袋递给你右边的机器人」或「从你左边的机器人那里接过饼干袋并放入打开的抽屉中」。

    这是首次使用VLA实现多机器人之间的灵活、持续性协作任务,而且机器人能够成功处理完全陌生的物体,这一成就具有重要的里程碑意义。

    「任意物品拾取」能力涌现

    研究人员发现配备Helix的Figure机器人只需一个简单的「拾取[X]」指令就能拾取几乎任何小型家居物品。

    即使在杂乱的环境下,机器人也能成功处理从玻璃器皿和玩具到工具和衣物等数千件前所未见的物品,而这一切无需任何事先示范或定制编程。

    值得注意的是,Helix成功地连接了大规模语言理解能力与精确的机器人控制系统。

    例如,当接收到「拾取沙漠物品」这样的提示词时,Helix不仅能识别出玩具仙人掌符合这个抽象概念,还能选择最近的机械手臂并执行精确的运动指令(motor commands)来稳固抓取它。

    这种通用的「语言到动作」抓取能力为类人机器人在复杂且不确定的非结构化环境中的部署开创了激动人心的可能性。

    讨论

    Helix的训练极其高效

    Helix仅需极少的资源就实现了强大的物体识别和适应能力(物体泛化能力)。

    研究人员总共使用了约500小时的高质量监督数据(supervised data)来训练Helix,这仅占此前收集的VLA数据集规模的一小部分(<5%),而且无需依赖多机器人实体数据收集或多阶段训练。

    值得注意的是,这种数据收集规模更接近现代单任务模仿学习(imitation learning)数据集。尽管数据需求相对较小,Helix仍然可以扩展到更具挑战性的完整上肢人形机器人控制动作空间,成功实现高频率、高维度的输出控制。

    统一的模型权重系统

    现有的VLA系统通常需要专门的微调或专用的动作输出层来优化不同复杂行为的性能。

    然而,Helix却能使用单一统一模型就实现了各种任务的出色表现。

    仅使用一组神经网络权重(System 2使用70亿参数,System 1使用8千万参数),Helix就能够完成将物品放入各种容器、操作抽屉和冰箱、协调精确的多机器人交接,以及操作数千种全新物体等多样化任务。

    结论

    Helix是首个能够通过自然语言直接控制整个人形机器人上半身的视觉-语言-动作模型(Vision-Language-Action model)。

    与早期的机器人系统相比,Helix能够实时完成持续性、需要配合的精密操作,而无需任何特定任务示范或大量手动编程。

    Helix展现出卓越的物体适应能力,只需通过自然语言指令,就能拾取数千种在训练中从未接触过的家居物品,这些物品具有各种不同的形状、尺寸、颜色和材料特性。

    这标志着Figure在拓展人形机器人行为能力方面取得了突破性进展——研究人员相信,随着机器人在日常家居环境中的应用日益广泛,这一进展将发挥重要的推动作用。

    尽管这些初步成果令人振奋,但这仅仅是揭开了可能性的冰山一角。研究人员热切期待着将Helix的规模扩大至现有规模的千倍乃至更多时会带来怎样的突破。

    参考资料:HNYZs

    https://www.figure.ai/news/helix‍

    来源:微信公众号“新智元”

  • DeepSeek:人工智能领域的沃尔玛

    DeepSeek:人工智能领域的沃尔玛

    • DeepSeek 已经可以与 OpenAI 的 ChatGPT 相匹敌了,而且成本只是 OpenAI 的一小部分。
    • 这改变了游戏规则,让规模较小的参与者也有机会在AI的舞台上亮相。
    • 这对市场产生了巨大的影响,并彻底重塑了 AI 市场。

    图片来源:Alex Shuper Unsplash

    DeepSeek是中国公司推出的一款新的开源人工智能模型,它正在以一种引人注目的方式改变着游戏规则。我会用通俗的语言解释一下当下正在发生的事情,以及纳斯达克指数暴跌的原因。

    DeepSeek表示,他们的人工智能与OpenAI的ChatGPT一样好,甚至可能更好。关键是,他们只花了一小部分成本。当其他公司花费 1 亿美元或更多来构建 AI 模型或“大脑”时,DeepSeek 仅以 600 万美元就完成了这项工作。这个消息导致所有大型 AI 股票暴跌。英伟达的市值损失了大约 6000 亿美元。

    最疯狂的是,美国的科技封锁旨在减缓中国的发展速度,但这种做法似乎起到了相反的作用。由于缺乏高级芯片,DeepSeek找到了更聪明的方法,用他们能买到的更便宜、更慢的芯片来工作,并扭转了局面。这不仅仅是DeepSeek的胜利,也是在压力下进行创新的胜利。

    1. 便宜的人工智能

    技术方面,DeepSeek没有使用英伟达的尖端H100芯片,而是用略微受限的H800芯片来训练人工智能。这些芯片不如 H100 那么快,但 DeepSeek最终找到了方法来获得令人难以置信的结果。他们已经证明,你并不总是需要最新最好的硬件来构建顶级人工智能。例如,在棒球比赛中,裁判要求你用一只手击球,你不抱怨,也不发牢骚,而且你做得很好。

    这改变了小型参与者的游戏规则。这意味着以前负担不起人工智能的国家、公司甚至创造者现在都有机会了。例如,泰国电影业可以使用这样的工具为东南亚市场制作尖端的特效,或为东南亚市场实现故事的自动化,所有这些都不需要花费巨额资金。成为领导者对更多人来说变得更加负担得起了。

    2. 人工智能领域的沃尔玛

    这里有一些更深层次的问题需要考虑。DeepSeek可能会成为人工智能领域的沃尔玛(Walmart),将低成本普惠带给一个由高价选项主导的行业。OpenAI每百万字收费60美元,而DeepSeek只需55美分,比OpenAI低95%。

    ChatGPT Plus的费用是每月20美元,在美国,这是一个非常合理的费用,一般美国人不会抱怨价格高,除非他们考虑ChatGPT Pro,用户可以无限制地使用OpenAI的模型和工具,每月200美元。然而,撒哈拉以南非洲地区的人均年收入约为750美元,20美元相当于一个月工资的三分之一。在美国,这就像每月支付1800美元来访问ChatGPT。DeepSeek能提供高质量的人工智能,每月费用约为1美元。对于非洲的大学生来说,这仍然是相当昂贵的,但DeepSeek开源了他们的模型,让非洲的开发人员可以利用它,并想办法让它以更低的成本运作。

    就像沃尔玛改变零售业一样,这可能会彻底重塑人工智能市场。依赖高额费用和大量订阅的美国公司可能会感受到压力。如果DeepSeek坚持这一策略,他们将迫使其他公司重新思考人工智能的定价和销售方式。这是一件好事,当价格大幅下降时,使用量就会增加。更多用户参与其中,新的市场就出现了。计算和互联网的成本也在不断下降,天从来没有塌下来。

    3. 人工智能的新时代

    DeepSeek证明了人工智能游戏不仅仅是关于谁花的钱最多,而是关于谁更聪明,并相信不可能的事情是可能的。这一突破意味着人工智能将比以往任何时候都更容易获得,为创造者、小企业,甚至想要建立自己技术的国家打开大门。这对美国来说是一个警醒,不要再依赖其主导地位来主导市场,是时候接受美国例外论了。

    老实说,这真是一场好戏,看着这些曲折的剧情展开,感觉就像一场终极真人秀。国家和公司相互竞争,试图比对方更聪明,这种事情甚至比泰勒·谢里丹(Taylor Sheridan)最疯狂的剧本都要好。这就像一部电影,一个来自穷苦家庭的孩子克服了所有困难,击败了富家子弟,击败了癌症,击败了一切,成为有史以来最伟大的球员。你怎么能不为他欢呼呢?

    人类,一如既往地混乱和聪明,总是会给人惊喜。这不正是整个故事最精彩的部分吗?

    来源:互联网

  • DeepSeek加速AI智能体落地

    DeepSeek加速AI智能体落地

    从大模型到AI Agent(智能体),是AI真正走向落地应用的关键一步。相比大模型,智能体更像是拥有自主决策和执行能力的“AI助手”,能主动分析、规划,并根据不同场景提供更精准、实时的服务。

    市场咨询机构Gartner将AI Agent列为2025年十大战略技术趋势之首。业界认为,2025年有望成为AI Agent的商业化应用元年。

    DeepSeek的横空出世大大加速AI Agent的落地速度,不到一个月,一场深刻的科技变革悄然展开。

    大模型“入行”难

    尽管舆论对智能体的成熟速度呈现出越来越乐观的态度,但业内人士仍普遍认为,智能体应用发展仍处于早期阶段,即业务场景探索和技术验证阶段。

    泛微副总裁杨国生在接受《IT时报》记者采访时表示,当大模型应用到企业的垂直产品领域时,精准度显得尤为关键,“很多业务场景并不是简单的问答模式,而是需要更复杂的业务逻辑和场景化需求。这需要大量的工程技术介入,才能确保其真正实现企业级应用的效果。”

    杨国生说,ChatGPT等通用大模型虽然在基础知识应用、数学运算和代码生成等方面展现了强大的推理能力,但当这些模型应用于垂直领域时,其稳定性却难以令人满意,“当推理某个结果时,今天的表现可能令人满意,但明天就会出现波动,甚至效果下降。这是大模型通用性与垂直精度之间的矛盾所带来的挑战,且常常伴随‘幻觉’等问题”。

    此外,算力资源的限制也是当前智能体应用的一大瓶颈。在企业级应用中,由于大模型需要处理海量的参数,企业直接部署这样的模型面临巨大的算力成本压力。尤其在当前的经济环境下,许多企业无法投入大量预算购买专用的算力卡,这成为制约企业级大模型应用的基础性障碍。

    因此,出于成本、精度等多方面的考虑,相较于针对个人用户的AI助手,初创企业更愿意针对垂直领域开发有针对性的行业应用垂类模型。

    DeepSeek正是行业“及时雨”

    短短一个春节,DeepSeek不仅大幅降低AI大模型部署的技术门槛与成本,还加速了AI的商业化进程,推动应用场景的大规模崛起,甚至大大提升AI的普及速度。AI产业的经济价值,正在从“卖水人”转向应用端。

    越来越多的企业开始接入DeepSeek,更多垂直领域人工智能公司尝试或升级自己的AI Agent。

    作为一家专注于能源大模型的企业,达卯智能近期接入DeepSeek,并推出最新产品——能源小达DeepSeek-R1671B。达卯智能CTO刘净在接受《IT时报》采访时表示,DeepSeek的推理能力是其最为突出的亮点之一。

    刘净表示:“相比传统的大模型,DeepSeek在推理能力上实现了质的飞跃,甚至在用户体验上,它可能优于OpenAI的o1模型,甚至o3模型。”

    对于像达卯智能这样的垂类能源应用企业而言,DeepSeek的推理能力填补了此前的空白。刘净进一步解释:“我们公司并不开发基座大模型,之前我们一直依赖国产自主可控的开源大模型,但为了更好地满足客户需求,我们迫切需要具备强大推理能力的模型,因此选择了DeepSeek的V3版本,并迅速接入。”

    在实际使用中,刘净表示,DeepSeek提供了全链条的推理过程,真正实现从数据输入到最终用户反馈的完整闭环,“DeepSeek不仅展示了推理过程,还能将整个推理流程呈现给最终用户,极大提升了用户体验。通过结合我们的行业知识库和DeepSeek的强大推理能力,用户可以得到一个全面的解决方案,这种全新的体验之前是无法实现的。”

    例如,在电费账单分析和电费解析方面,DeepSeek的推理深度相比之前的产品有了质的飞跃。

    从“生成”到“做事”

    同样近期接入DeepSeek的达观数据CEO陈运文告诉《IT时报》记者,DeepSeek改变了AI Agent的发展路径。在技术路线上,它没有一味依赖大模型和大算力,而是通过优化模型和蒸馏技术降低对算力的需求,让AI Agent能在边缘设备进行轻量化推理。

    开发模式上,DeepSeek的开源降低了开发门槛,吸引了更多开发者参与,加速AI Agent从实验室研究向工业级应用的转变,推动了多主体协同开发,开发者的关注焦点也从注重“语言生成”转变为更重视“任务执行”,让AI Agent“实际做事”的价值更受关注。

    陈运文认为,在功能上,DeepSeek能实现多模态交互,理解复杂指令,还能在复杂场景里生成最优路径;应用场景也拓宽了,在金融、医疗、制造、媒体娱乐等多个领域都能构建智能Agent,比如智能投顾、诊断辅助、供应链优化、内容创作等;协作集成方面,它预置了常用API,降低了集成成本,还支持多Agent分工协作,适用于供应链管理、智慧城市这些场景。

    “强大+便宜”推动模型“平民化”

    LogenicAI联合创始人李博杰告诉《IT时报》记者,随着DeepSeek的出现,AI Agent领域发生了两方面的重要变化:首先是成本显著降低,其次是许多人的心态发生改变。

    李博杰指出,要实现真正有效的AI Agent,能够解决实际问题并达到商业需求,需要像R1或更高级别的模型。但以往,如OpenAI等模型成本非常高,比如OpenAI的o1模型,每100万个Token的成本为60美元,而现在,DeepSeek-R1的成本仅为2美元100万个Token,缩减30倍,大幅降低成本。

    对于OpenAI来说,这无疑是一个挑战,因为它长期以来锁定自己的技术,并通过高价盈利,但现在DeepSeek的出现迫使OpenAI调整策略,甚至降低o3Mini版本的价格,这表明推理模型的成本正在普遍下降。

    值得一提的是,2月13日凌晨,OpenAI首席执行官萨姆·奥尔特曼公布了GPT-4.5和GPT-5的最新消息。奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3模型,并应用于聊天机器人ChatGPT以及API平台,此外,更重要的是,免费版ChatGPT能在标准智能设置下无限制地与GPT-5进行对话。

    李博杰还提到,成本的降低让AI Agent类应用得以普及,过去由于模型能力不够强大,效果并不理想。如今,借助DeepSeek或OpenAI o3等更强大的模型,AI Agent能够帮助解决更复杂的问题。

    李博杰认为,DeepSeek的成功不仅在于技术的突破,还在于它的开源模式,这使得其对更多开发者开放,打破了以往AI技术需要巨额投入的“迷思”。OpenAI的收费体系一直较高,且最先进的模型也只限特定合作伙伴使用,而DeepSeek的出现让这些技术变得平民化,带来了根本的认知变化。

    这种变化尤其体现在投资者的态度上。金沙江创投主管合伙人朱啸虎曾明确表示,他不会投资中国的AI大模型创业公司。然而,随着DeepSeek的出现,朱啸虎的看法发生180度转变,表示“大开眼界”“DeepSeek让我开始相信AGI的可能性”。

    与其“做模型”,不如“接入生态”

    提到个人智能助手,许多人最先想到的可能是科幻电影《钢铁侠》中的贾维斯。然而,要拥有属于普通大众自己的“贾维斯”,所需要的远远不止一家能够生产“贾维斯”的公司。

    在杨国生看来,未来的AI Agent几乎会渗透每一个软件,支撑着每个功能的实现。如今,我们通常通过编写代码来开发程序,并经过测试和调试来实现功能,但未来,很多功能可能不再依赖传统的编码方式,而是由智能体自动完成。例如,计算每月的良品率,未来可能由智能体自动处理,而无需我们手动编写和调试代码。

    陈运文坦言,AI Agent的全民普及仍面临瓶颈。大众对其功能和价值的理解不深,接受度较低,且专业人才匮乏,尤其缺少既懂技术、产品,又熟悉商业和生态的复合型人才。在伦理、法律与安全方面,AI决策往往缺乏可解释性,责任归属不清晰,且存在隐私泄露和被攻击的风险。未来的技术突破方向主要包括:优化模型,提高准确性、泛化能力和可解释性,减少算力需求;发展多模态技术,促进更自然的多模态融合;强化学习与自主决策能力,使AI Agent能够在复杂环境中自主学习和决策。

    从技术角度看,AI模型可能面临偏差风险。例如,算法歧视可能导致不公平结果,训练数据不足或应用不当也可能导致模型失效。此外,网络安全问题也不容忽视,DeepSeek曾遭遇过DDoS攻击,因此,加强大模型的安全防护至关重要。

    李博杰以雷军和小米公司举例,在移动互联网的早期阶段,尽管有数百家公司涉足手机行业,但最终,只有小米等少数公司取得了成功,最终市场上的主流手机品牌依然是那些早期就有基础的公司。

    对于从事AI行业的人来说,并不一定需要像OpenAI那样打造基础大模型。与其直接与巨头竞争,不如选择像小米的空气净化器或插线板这样的生态链产品,在AI应用领域找到特定的突破口,与巨头形成互补关系。例如,OpenAI投资了多个垂直领域的公司,如语音学习应用Speak、编程教育平台Canvas、法律应用等,这些公司专注于特定行业,与OpenAI的基础模型形成互补,而不是直接竞争。

    李博杰强调,未来AI行业需要更多的人愿意深入垂直领域。许多创业者往往只关注大模型,但那些看似“小”的垂直领域应用,恰恰是AI技术实现商业化的重要突破口。

    来源:微信公众号“IT时报”

  • 有些孩子,在不知不觉中就成了AI的奴隶

    有些孩子,在不知不觉中就成了AI的奴隶

    前几日,朋友聚会,十几个人围炉煮茶。坐下闲扯了几句,话题自然就引到时下最火的DeepSeek上去了。

    正当大家纷纷感叹DeepSeek能力强大的时候,一位大姐却倒起了苦水。她说,正是现在这些所谓的AI大模型,几乎快把她儿子给“废”了。

    众人都感诧异,连忙问是怎么个说法。大姐说,她家孩子今年初二,明年就要中考了,原本成绩还不赖,考上重高肯定没问题,但上学期期末考试成绩却出乎意料地大幅倒退。她和她老公当然心急如焚,特地跑到学校里去找老师面谈。

    老师先问他们,家里是不是不禁止孩子使用电子设备?她跟她老公面面相觑,说,孩子之前自律性还可以,而且也经常要用电脑上网课,所以这方面管得松,但好像也没见他用电脑打游戏、看小说什么的,最多只是上网查查资料。

    老师嗯了一声,拿出孩子的作业本,指着其中几页说,这几次作业,是用AI做的。

    他俩也看不懂题,只是觉得很惊讶,也不知该怎么接话。

    老师也不见怪,继续道,这个也是最近才有的情况,我也是才发现的。这几道数学题的解答错得很怪异,不太像初中生的思路,观察了一阵,后来才发现用AI作答的结果。这种情况能发现出来的都是少数,估计孩子用AI做作业不是一天两天了。这可能是你家孩子上学期退步的一个重要原因。

    大姐讲完,又补充了一句,老师说,这种现象在班上不少见,她家孩子不是个例。前些年还只是用搜题软件,如今连主观题都能用AI轻松作答。比如,很多孩子的作文都是用AI写的,语文老师一开始还觉得学生最近作文功力长进不少,等到考试一批改才真相大白。

    过度依赖,提前出局

    大姐的讲述引发我们深思。显然,这并不是新技术的错误。但科技的爆炸式发展,总会不可避免地带来一些副作用。只是对于大姐家里,这个副作用挑了一个非常敏感而致命的时机发作了出来。

    孩子用AI做作业,背后有很多诱因。比如作业太多,用AI偷个懒,或者对于自己不擅长的问题,用AI辅助一下,等等。但由于这几年AI技术的大幅进步,替代自己写作业的效果也越来越好,于是便用得愈来愈多,一发不可收拾了。

    这也不能全怪孩子。想想现在很多大人,碰到一个工作上的问题,也会习惯性地先求助于AI,让AI给一个思路、搜集并汇总资料、写个初稿,然后稍微加工一下(往往只是形式上的),便作为工作成果向上汇报了。从结果上看,这不仅大大提高了工作效率,效果上也不差。

    但对于孩子的学习结果来说,这就是另一回事了。孩子做题,本质上是一种训练,让自己的大脑通过思考、解决问题来加深对知识的记忆和理解,同时提升思维能力。AI替代写作业,作业效率和结果是不赖,但最要紧的训练过程却整体略过了。而且,由于孩子缺乏训练,有时候也无法识别出AI给出结论中的明显错误。这就导致了前文所说的那个案例中的情况:AI的答案错了,孩子也发现不了;平时作业一帆风顺,期末考试一塌糊涂。

    更可怕的是,一旦形成了对AI的这种“依赖”,再想摆脱,就困难了。人的天性是懒惰的,如果有个方法能够不费力地得出不错的答案,为什么还要自己去苦苦思索呢?成年人都是如此,初中生更别提了。于是,本该是认知觉醒关键时期的初中生,陷入到了“AI依赖”的陷阱中,这对他未来的人生都会产生很深远的负面影响。

    大姐家的孩子便是如此。自从跟老师面谈之后,他们在家就严格禁止孩子使用电子设备。即便是上网课,也必须有大人看着。但这么做的结果是,孩子的学习效率变得非常低下,有点类似上瘾“戒断期”的感觉。原本父母也还能接受,毕竟是改坏习惯,需要点时间也是正常。但这发生在中考即将到来的节骨眼上,就非常要命。父母都很焦急,却又没别的法子,只能暗自祈祷孩子能尽快找回学习状态,早日重回正轨。

    如果不能及时拉回来怎么办?

    “唉,那就真的废了,至少这次中考算是提前出局了。”大姐一声叹息。

    因噎废食,亦不可取

    前面这个案例有点极端,在更多的情况下,像AI这样的新技术带来的还是效率提升。

    例如,我身边就有几个家长用AI帮助孩子背单词,取得了很好的效果。对于英语学习来说,对着单词表苦背单词其实是一种效率很低下的方法,更合理的是在恰当的情境和上下文中,通过高频率地阅读来记忆和理解单词。之前,这样的文章不太好找,但有了AI之后,就可以让AI来创作一篇将目标单词融入文意的文章来,而且还能顺带出题。这就大大提高了英语单词学习的效率。

    用AI学数学的成功案例也不少。当然,可不是用AI直接出答案,而是采用“苏格拉底式提问”的方式,循序渐进,让孩子通过一阶一阶地解答简单的小问题,来引导他们思考并最终解决问题。对于中学数学题,家长往往自己也不会做,或者没法跟孩子讲明白,而老师时间又有限,有了AI这个老师,就能在一定程度上起到替代老师的作用,达到事半功倍的效果。

    还有用AI做学习规划的。校内是大课堂,学习效率的上限比较低。如果想提高效率,就需要根据个人情况来定制学习计划。这本身是一件比较复杂的时间,以前需要占用家长大量的时间和精力,而且由于专业性不足,家长即便帮忙做了规划,也未必科学合理。有了AI,就不一样了。它可以测评,可以给整体规划,也可以给细节上的帮助。让AI出一个初步的学习规划,然后家长、孩子再根据个人情况加以调整,也能对学习起到很大的助力。

    目下,AI技术崛起已经成了一种趋势,未来的人类,必定要经常跟AI打交道。如果彻底屏蔽AI,其实是选择与现实世界主动脱节,也是有问题的。因此,若是害怕AI带来的副作用而就此因噎废食,同样不可取。

    拥抱AI,但不要成为它的奴隶

    所以,最后还是回到“度”或是“界限”的问题上。如何在教育过程中把握好AI技术的应用边界?这是我们未来要长期面对、不断反思的问题。我想,应该遵循这么几个原则吧。

    首先,要提升家长和老师的“AI素养”。其实孩子平时接触最多的还是自己的父母和老师,他们最原始的学习就是“看样学样”、“耳濡目染”。因此,在合理利用AI技术这个问题上,家长和老师要先做到位:既不滥用,也不逃避。

    其次,在教学中,要分层应用AI,明确其在教学中的边界。基础性任务(如作业批改)可借助AI提效,但思维训练、实践探究必须以学生为主体,切不可越俎代庖。

    最后,也是至关重要的一点,要让孩子明白人类与AI的基础性差异。AI再先进也只是手段。这一方面需要加强人文教育,让孩子理解人与机器的底层区别。另一方面,也应加入人机关系的伦理讨论,让学生主动思考“AI偏见”“数据隐私”等议题,培养技术责任感。

    做到这些绝非易事,人机伦理恐怕是未来很长一个时期人类都要直面的关键议题。

    来源:微信公众号“首席商业评论”

  • 强过DeepSeek?马斯克放大招

    强过DeepSeek?马斯克放大招

    就在18号,被马斯克狂吹为“地球上最聪明AI”的Grok 3聊天机器人现世了。

    马斯克携手xAI(其投资创建的AI企业)的工程师们通过直播的形式,向世界展示了Grok 3的实力——在减少AI幻觉、提升逻辑一致性、联网获取实时信息以及深度搜索等方面,Grok 3都展现出了可能超越OpenAI和DeepSeek等大模型的能力。

    马斯克在发布会上激动地说,Grok 3的能力相比其前身Grok 2,强大了一个数量级。这番言论,让Grok 3迅速成为全球科技与资本市场的热门话题。

    而且马斯克还为Grok3整了一个更有逼格的定位:“our mission is to understand universe(我们的使命是了解宇宙)”。

    而迅速推出Grok 3的背后,也藏着马斯克与阿尔特曼(OpenAI创始人)之间的复杂恩怨。两人曾携手创立OpenAI,誓言用开源技术挑战谷歌的AI霸权。可如今两人却分道扬镳,甚至在某些场合针锋相对,上演了一出出“背叛”与“反击”的戏码。

    那么,这个由马斯克倾尽心血的Grok 3,能否让马斯克在阿尔特曼面前争一口气?它是否能够重塑AI聊天机器人的格局?而资本市场又是否会给予它足够的支持呢?

    Grok3超越DeepSeek和ChatGPT?

    美国科幻大师罗伯特·海因莱因的小说《异乡异客》中,有一位在火星上长大的角色叫作“Grok”,它代表了对某事物全面且透彻的理解。

    马斯克表示,xAI 团队之所以将其聊天机器人命名为Grok就是源于这个初衷。

    作为xAI正在精心打磨的杰作,Grok 3最引以为傲的便是突破性的“思维链”推理能力和多模态功能的全面升级。

    虽然Grok 3是一款聊天机器人,但其“推理”能力却不容小觑。它不仅能与用户进行流畅的自然语言互动,更能逻辑性地测试其响应并进行严格的事实核查。

    马斯克和他的团队自豪地宣布,Grok 3测试版的推理能力甚至可能已经超越了现有的众多人工智能模型。在关于推理和测试时间的基准测试中,Grok 3以卓越的表现,力压DeepSeek-R1、OpenAI o1、OpenAI o3 mini-high以及Gemini-2 Flash Thinking等一众强敌,展现了其非凡的实力。

    xAI团队还通过一系列有趣的展示,让我们亲眼见证了Grok 3的过人之处。比如,在计算从地球到火星的航天器任务时,Grok 3竟然能够生成一张生动的太空发射动画3D轨迹图,从地球出发,穿越火星,再返回地球,这一过程中涉及的复杂物理知识,都被它一一攻克。

    更令人惊叹的是,Grok 3还足够聪明,能够根据超强的推理能力编写游戏或结合现有游戏。当xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏时,它迅速生成了一个Python脚本,定义了游戏的常量、颜色、方块形状等元素,并创造出了一种独特的玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除。

    而Grok 3的多模态功能升级,更是让人眼前一亮。它并非单一的模型,而是一个由多个模型组成的家族。其中,轻量级版本Grok 3 mini主打实时响应,推理速度较标准版提升了惊人的5倍;而Grok 3 Reasoning则采用了类人脑的“慢思考”机制,通过多层事实核查,有效规避了AI幻觉的问题。

    在数学推理、代码生成和科学逻辑测试中,Grok 3的表现同样令人瞩目,它超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等竞品,展现出了强大的竞争力。

    在盲测方面,xAI的Grok 3(早期版本)更是以1402分的历史最高成绩,在lmArena排行榜上登顶,成为首个突破1400分的AI模型,这一成绩甚至超越了Google、OpenAI、DeepSeek等业界巨头。

    值得注意的是,马斯克团队仍在持续优化Grok 3的能力,Grok 3目前仅对X Premium Plus订阅用户开放,但xAI为忠实粉丝推出了名为Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限。

    此外,xAI还推出了SuperGrok计划,订阅用户能够访问更多推理能力和无限图像生成。并计划未来数周内上线语音模式及企业API接口。

    那么被马斯克吹上天的Grok3是如何炼出来的呢?

    122天,马斯克用20万块GPU张大力出奇迹

    有句说句,Grok 3能迅速发展,离不开xAI的惊人的工程执行力。

    xAI高管团队透露,为实现“打造顶尖AI”的目标,公司选择自建数据中心作为核心路径。

    第一阶段,他们仅用122天便完成10万块H100 GPU集群部署,建成当时全球最大规模的全连接算力基础设施。

    第二阶段进一步提速,仅92天就实现算力翻倍,使集群规模达到20万块GPU——这些硬件资源全部投入“科洛苏斯超级集群孟菲斯数据中心”,成为训练Grok 3的核心支撑。

    技术突破方面,xAI通过大量使用合成数据等创新手段,使Grok 3相较前代实现10倍计算能力跃升,以超快的速度追上了ChatGPT。

    在配套生态的构建上,xAI同样不遗余力。他们推出的DeepSearch被誉为“下一代搜索引擎”,它允许用户提问并获得答案,更重要的是,DeepSearch能够展示从问题思考到研究,再到最终答案生成的完整过程。

    DeepSearch是一款推理聊天机器人,能够阐述其理解查询内容的过程以及规划回复的方式。在演示中,DeepSearch展现出了研究、头脑风暴和数据分析等多种功能,令人眼前一亮。

    对于Grok 3是否会开源,马斯克明确表示,“我们通常会在新模型发布的时候,开源上一代模型,所以几个月后,我们也会对Grok 2进行开源。”

    这种“代际开源”策略既保持了技术护城河,又满足了开源社区的期待,不少网友认为马斯克格局不错,但也留着底牌。

    资本市场对此次技术突破反应热烈。

    Grok 3发布当日,恒生互联网科技业指数开盘冲高1.8%,恒生互联网ETF(159688)收涨1.42%,金山云、腾讯控股等AI概念股集体跟涨。更显著的是机器人ETF单日资金净流入突破十亿元,创历史纪录。

    投资机构层面,Grok 3发布会后,红杉资本、Andreessen Horowitz等顶级风投加速入场,推动xAI融资规模剑指百亿美元,公司估值飙升至750亿美元。

    不过相较于OpenAI的3000亿估值,Grok 3还差一些。市场仍认为xAI在生态壁垒和商业化成熟度上的优势仍不如OpenAI。

    目前,Grok 3虽然仅通过一场直播demo曝光,没有更多官方信息,但其含金量几何,还需更多用户和时间验证。

    不过,从Grok 3发布会背景板上的那句“our mission is to understand universe(我们的使命是了解宇宙)”可以看出,马斯克的野心远不止于此。

    马斯克离“用AI理解宇宙本质”的终极目标还有多远?或许还要再等Grok 3再飞一会。

    搞Grok3只为了赌气?阿尔特曼公开羞辱马斯克

    不过,在Grok 3风靡全球的背后,一场不为人知的内部斗争同样引人入胜,主角便是曾经的盟友——埃隆·马斯克与山姆·阿尔特曼。

    故事要追溯到2015年,硅谷的夜空下,马斯克与阿尔特曼携手启动了被誉为“AI曼哈顿计划”的OpenAI。

    他们共同的敌人,是那时如日中天的谷歌,两人担忧其可能垄断AI技术,便牵头成立了非营利性质的OpenAI。

    在阿尔特曼心中,马斯克一度是如“钢铁侠”般的存在,是打破美国科技僵局的英雄。然而,理想丰满,现实骨感。

    随着OpenAI的算力成本飙升,财务困境如影随形。阿尔特曼做出了一个决定性的选择,引入微软10亿美元的投资,并成立了盈利性质的子公司OpenAI LP。

    马斯克坚持非营利原则,认为这是对初衷的背叛,而阿尔特曼则认为商业化是生存之道。两人的分歧日益加深,马斯克认为OpenAI已沦为微软的“闭源附庸”,并试图夺回CEO之位,却遭到了董事会的拒绝。

    阿尔特曼随即发起了内部斗争,成功争取到了另一位联合创始人格雷格·布罗克曼的支持,而布罗克曼又进一步拉拢了首席科学家伊利亚·苏茨克维尔站在自己一方。

    2018年,马斯克黯然离场,阿尔特曼接掌了OpenAI的领导权。从此,两人分道扬镳,OpenAI也倒向了微软。

    时间流转至2022年11月30日,ChatGPT横空出世,迅速成为21世纪最具影响力和变革性的科技产品之一,与iPhone、Facebook和TikTok并驾齐驱。

    然而,对于马斯克而言,这款产品的问世却如同一把利刃,刺痛了他的心。作为曾经的创始人之一,他已被彻底排除在外,愤怒与失落交织于心。不甘心的他随即推出了自己的初创公司xAI,希望与ChatGPT一较高下。

    法律战与舆论战也随之打响。马斯克连续起诉OpenAI“违背初心”,要求恢复开源,并批评其发展迅速却忽视安全。他在公开场合多次猛烈抨击阿尔特曼,而阿尔特曼也毫不示弱,两人的关系急剧恶化。

    直到Stargate计划的公布,两人的矛盾被推向了顶点。阿尔特曼作为民主党人,却与特朗普政府合作推出了这个高达5000亿美元的人工智能基础设施投资项目,而马斯克却对此毫不知情。

    可以说,Stargate计划不仅让马斯克感到被背叛,更打破了马斯克的政治与商业布局。

    愤怒的马斯克随即发起恶意收购,愿意以974亿美元的价格收购OpenAI的控制权。而阿尔特曼的反击同样犀利,他嘲讽道:“我们愿以97.4亿美元收购Twitter。”阿尔特曼借此嘲讽马斯克以440亿收购Twitter的商业决策。

    目前,两人的恩怨远没有结束,但唯一确定的是,Grok 3的出现已经让AI界再次沸腾了起来。

    Grok 3的崛起,未来GPT5的发布,以DeepSeek为代表的中国AI军团的竞逐,无不预示着AI新时代的洪流滚滚,未来的路还很长,故事仍在继续。

    参考资料:

    1、《马斯克发布Grok 3大模型,称超越DeepSeek》澎湃新闻

    2、《马斯克出手!Grok 3计算能力暴增10倍,谁才是最强大脑?》金十数据

    3、《大力出奇迹?马斯克发布“史上最聪明AI”Grok-3,号称超越DeepSeek R1,20万张GPU能否颠覆AI格局?》金融界

    来源:微信公众号“首席商业评论”

  • 马斯克“画饼”人形机器人,国内企业闷头搞实干

    马斯克“画饼”人形机器人,国内企业闷头搞实干

    你以为人形机器人会像电影里演的那样,一夜之间就统治世界,成为人类的“完美替代品”?

    错!

    现实中的人形机器人,虽已初露锋芒,却离“称霸”之路遥不可及,目前仍处于蹒跚学步的阶段。

    马斯克“画饼”人形机器人,国内企业闷头搞实干

    还记得特斯拉那场发布会吗?马斯克那叫一个自信满满,推出的人形机器人仿佛是未来生活的救星。

    他宣称,一旦生产规模扩大,成本将低至2-3万美元,实现人人可负担。并声称这款机器人功能强大,无论是带孩子、遛狗,还是端咖啡、购物、做家务,皆能轻松应对,堪称全能“保姆”。

    不得不承认,这“饼”画得确实诱人,但能否成真,仍需打上一个大大的问号。

    毕竟,从概念到量产,中间隔着无数技术和成本的“大坑”,这可不是靠嘴皮子就能填平的。

    再看看咱国内,可没有被马斯克的“大饼”迷惑,一直在闷头搞研发。

    外交部发言人林剑就曾分享过一款中国公司研发的AI人形机器人,能敲核桃、煎面包、折叠身体,像个便携式管家。

    尽管这只是中国在人形机器人领域迈出的一小步,却足以彰显国内企业在该领域的实力与潜力。

    深圳星辰智能的Astribot S1,毛笔字写得飘逸,衣物熨得平整,炒菜颠锅手法娴熟。

    前华为天才少年打造的智源机器人,移动迅速,承载重物不在话下。

    富里夜智能GR、语数科技G1、优必选Walker系列等,如雨后春笋般涌现,各显神通。

    从工厂自主搬运的优必选Walker S1,到家庭服务乐居机器人夸父,再到全球首例纯电驱动全尺寸人形机器人拟人奔跑的天工,国内人形机器人市场一片喧嚣,新兴产业蓬勃发展的景象跃然眼前。

    然而,这繁花似锦的背后,真的如表面那般光鲜亮丽吗?拨开迷雾,我们看到的却是一系列令人忧心的问题。

    优必选陷盈利困境

    人形机器人产业的企业,可能正走在一条布满荆棘的道路上。就拿“人形机器人第一股”深圳优必选来说,它的遭遇就是一出活生生的警示剧。

    花开两朵,先看“优点”。

    优必选人形机器人家族,囊括Walker S系列、S Lite及协同先锋S1。

    Walker S系列作为工业人形机器人代表,身高1.7米的Walker S、1.3米的S Lite及协同工作先锋S1,各展所长。

    S1作为全球首款能与无人物流车等协同作业的机器人,展现了其技术上的领先优势。优必选在伺服驱动、大模型、语义VSLAM等技术上不断突破,确保机器人在工业场景中安全稳定服务。

    再看资本市场反馈,2023年12月29日,优必选风光登陆港交所,发行价90港元,股价一度飙升,最高达到328港元/股,市值直冲1416亿港元,那气势,犹如人形机器人行业的黄金时代已悄然开启。

    好景不长,财报一出,一切都变了味。

    2023年,营收10.47亿元,归母净亏损却高达12.34亿元;2024年中报,营收4.80亿元,归母净亏损5.16亿元。

    这些数字,让人不禁为之一惊。

    别看优必选的工业人形机器人Walker S1在比亚迪汽车工厂实训表现不错,效率提升一倍,稳定性提升30%,还拿到了多家车厂的超500台意向订单,预计今年Q2就能规模化交付。

    但业绩亏损的巨坑,却非轻易能够填补。

    股价四个交易日内暴跌近50%,这哪是市场情绪波动那么简单,分明就是对优必选盈利能力的彻底否定。

    那些看似繁华的产品展示背后,实则隐藏着企业盈利的重重难关。优必选的问题,可不是个例。整个人形机器人行业,都可能面临这样的困境。

    人形机器人普及之路漫漫其修远兮

    当所有人都在幻想人形机器人即将开启智能生活新篇章时,一盆冷水泼下。

    人形机器人的商业化之路,远没有想象中那么顺畅。

    技术瓶颈就像一道难以逾越的鸿沟。

    人形机器人的关键零部件,比如关节、电机、传感器,精度大多还在厘米级徘徊,跟工业级的毫米级精度比,那可是差了一大截。想让它干点精密活儿,比如制造精密仪器、做微创手术,那简直是难如登天。

    再说算法,多算法协同能力弱得可怜,感知、认知、决策、执行,哪个环节都跟不上趟儿,一遇到复杂环境就蒙圈。

    续航亦是难题,人形机器人能耗巨大,而电池技术滞后,导致其工作时间和活动范围受限,令人颇为头疼。

    接着是成本瓶颈。

    硬件成本居高不下,尤其是关节部分,占比高达三分之二。以伺服电机为例,国外售价在2000至3000元之间,而一个人形机器人需配备20至30个,仅电机成本便高达十万余元。

    这么高的成本,普通消费者哪买得起?

    研发成本也不低,人形机器人涉及的前沿技术太多,研发难度大、周期长,资金投入像个无底洞,企业想盈利,难!

    市场和应用瓶颈也是个大问题。

    人形机器人现在能干的活儿太有限,主要集中在工业生产、物流仓储这些特定领域。

    家庭、医疗、教育等更广阔的天地,它还进不去,商业模式和大规模应用的切入点都没找到。

    消费者对人形机器人也是半信半疑,担心它不安全、不可靠、不实用,甚至还可能引发伦理和社会问题。

    最后是人才瓶颈。

    人形机器人的研发和生产,需要跨学科的复合型人才,可这类人才太稀缺了。高校和职业院校在相关领域的专业设置与课程体系尚不完善,迫使企业不得不自行培养所需人才,这无疑加大了企业在时间与资源上的投入。

    此外,隐私与安全问题同样不容忽视,人形机器人一旦进入家庭,我们的私人生活将无时不刻不被这一智能设备所记录。一旦数据泄露或被恶意利用,后果不堪设想。

    【结语】

    人形机器人的商业化之路,步步艰难。技术、成本、市场、人才,四大瓶颈像四座大山。可见,人形机器人要想真正成为改变人类生活的重要力量,还有很长的路要走。

    来源:微信公众号“大局财经”

  • 杀疯了,超10家能源央企接入DeepSeek大模型

    人工智能正以前所未有的速度渗透至各行各业。

    近日,人工智能大模型DeepSeek正在快速在能源央企中落地生根,成为推动能源行业智能化转型的重要力量,国企、央企一改以往老套、古板的常态,正在积极拥抱人工智能。据不完全统计,目前国家电网、南方电网、中国华能、三桶油等十数家能源央企已完成DeepSeek技术接口的集成部署

    很显然,这场由智能技术驱动的产业变革正在重构商业世界的底层逻辑。而在能源领域,AI技术的应用也同样在加速。

    据悉,自从深度推理大模型DeepSeek爆火以来,中国石化就组建了相关专业团队,并在2月5日完成DeepSeek的部署,将其接入到长城大模型应用系统(长城大模型系统是中国石化自身为了适应石油化工行业的特定需求而部署的大模型),在企业内部分批推广使用。

    2月8日,中海油的昆仑大模型也同样完成DeepSeek本地化部署,在原有模型上新增了DeepSeek的深度推理能力。随后2月14日,三桶油的最后一家中海油也完成了本地部署,现在已在平台网页端及海油移动云“”海能智问”同步上线。

    另外,五大发电集团同样跟上了脚步。首先,作为电网的领航人,2月12日,国家电网子公司国网信通产业集团自主研发的模型服务云MSC平台就全面接入DeepSeek大模型。MSC平台与DeepSeek的深度融合,实现了需求精准解读、交互极致体验、缺陷智能防控、性能优化策略及文档自动生成等关键功能,显著提升了电网数字化项目研发效率,赋能业务快速响应和灵活变革,同时有效降低了研发成本。

    同日,南方电网人工智能创新平台也完成了开源大模型DeepSeek的本地部署。该平台通过引入DeepSeek,实现了自然语言基础模型的快速升级迭代,参数规模提升至千亿级别,极大地增强了电网在各项业务领域中的智能应用效果。

    随后,2月13日,中国华电子公司国电南京自动化股份有限公司自主研发的“华电睿思”数字底座接入DeepSeek。该数字底座通过与DeepSeek的深度融合,实现了智能问答、文档归纳分析等功能的升级,支持多种能源类型和数字化业务场景的智能化部署。

    此外,还有中国华能、国家能源集团(龙源电力)、国家电投、中广核、中核集团、中陕核集团(秦洲核安)等能源央企都完成了DeepSeek系列模型的本地化部署,将DeepSeek赋能能源生产、运营与管理的各个环节

    02

    这些能源央企接入DeepSeek,具体能做些什么呢

    拿中国华能举例,中国华能的“睿智小能”AI助手是DeepSeek在能源领域应用的典型案例。

    该助手深度融入“iHN+”平台,实现了知识问答、公文拟稿、智能校对、文件解读、科研辅助等基础功能。另外,在电力生产控制方面,将工业过程温度控制系统与AI助手相结合,保证温度精准控制与快速响应,并根据历史数据给出控制参数建议。此外,在设备检修指导方面,构建电力设备私有化知识库,与设备管理、缺陷管理等功能集成,实现设备故障智能排查、检修问答与指导。

    这么一看,DeepSeek确实能够给这些能源企业带来巨大便利,因此也不难理解为何这些能源央企愿意去拥抱DeepSeek了。

    但值得注意的是,在DeepSeek出来之前,ChatGPT早就横空出世,不过由于是国外研究的,对于国央企有安全隐患。但近年来,国产AI层出不穷,如kimi、豆包、文心一言、通义千问等都早已推出,如果仅仅是安全问题,这些国产AI应该早就装上了。

    那为何唯独选择了DeepSeek?

    据行内专家分析,认为主要有三点。首先是DeepSeek算力强、成本低。据悉,DeepSeek与ChatGPT-O1一样都是推理模型,而非指令模型,即在处理问题时,DeepSeek不会只是简单地堆积信息,而是会深入思考,给出答案。其在算力方面能与Chatgpt媲美,并且背后花费的成本远低于Chatgpt。

    其次,使用DeepSeek安全风险很低,不同于ChatGPT的闭源,DeepSeek是完全开源的,闭源模式下的ChatGPT,企业用起来就束手束脚。而开源的DeepSeek就像是打开了工具箱,各家企业可以根据自家的需要自主改装AI模型,将DeepSeek根据自家企业需求接入。例如,国家电网可以用它提升电网效率,新能源汽车企业可以将DeepSeek安装到智能座舱等。

    这样一来,DeepSeek的用法就变得十分个性化,每家企业都能打造出独属于自身的AI系统。

    最后还有一点,DeepSeek打破了美国对AI的话语权垄断,它的出现标志着中国在人工智能领域取得了重大突破,代表着科技创新力量,得到国家政策的强力支持。据悉,在北京召开的民营企业座谈会中,DeepSeek创始人梁文锋赫然在列,并且与马化腾挨身相坐于第一排。因此本次能源央企一片一片地部署DeepSeek,也有着这方面的原因。

    事实上,人工智能技术在能源领域应用前景非常广阔。

    “人工智能技术早已在智慧能源、智慧矿山、油气勘测等领域开展应用,人工智能是进行新能源预测最有力的工具,可以推动能源生产与管理优化、效率提升,为能源行业转型升级带来智力支持。”中国科学院院士、西安交通大学电子与信息学部主任管晓宏此前在接受《中国能源报》采访时曾表示。

    不过,在为能源行业赋能的同时,人工智能的规模应用仍面临一系列挑战。

    管晓宏在上述报道中表示,能源行业的AI应用需要结合具体领域,开发定制化的垂直大模型,对技术团队的要求较高。能源系统的运行需要实时监控和响应,这对AI算法的计算效率和延迟提出了更高要求。许多能源场景需要边缘计算支持,模型需在计算能力和存储资源有限的条件下具备本地部署能力,面临技术复杂性问题。

    能源行业事关国家安全和民生保障,对AI系统的可靠性和安全性要求极高,如何在数据共享和隐私保护之间找到平衡是一大难题。目前,能源行业AI应用还缺乏统一标准和规范,技术推广和应用效果参差不齐。初期投入高、回报周期长,新技术引入验证和评估周期长等问题都有待解决

    值得一提的是,DeepSeek在能源企业上的部署只是AI进入能源领域的一部分,近期能源领域正在积极拥抱AI,据2月17日工信部等八部门印发的《新型储能制造业高质量发展行动方案》提出,要充分利用人工智能等先进技术,推动储能行业的智能化发展。AI技术在储能领域的应用,不仅可以优化储能系统的运行效率,还可以用来解决储能的安全问题。

    来源:微信公众号“预见能源”

  • 地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

    地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

    地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

    机器之能·2025年02月20日 17:35
    笑话依旧讲的很烂。

    又是一个文理兼修的优等生,能薅一点是一点。

    好消息!好消息!

    堆了 20 万张 GPU、号称「地表最强」大模型 Grok-3 已经可用啦。

    这两天,网友们已陆续晒出截图:

    作为非付费用户,我们昨天只能旁观 Grok 3,今儿突然可以免费体验部分功能。

    但,次数有限 !

    由此看来,Grok 3 ( beta )提供「三件套」服务(除了基础模型)。

    Thinking是指启动推理模型。

    对此,AI 大神Andrzej Karpathy 快速体验后,评价说:

    「 Grok 3 + Thinking 感觉与 OpenAI 最强商用模型(o1-pro,200 美元/月)的顶尖水平相差无几,

    比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 要稍微强点儿。 」

    Thinking 模式

    DeepSearch, 对标 OpenAI「深度研究」功能,解决更加复杂困难的问题。

    DeepSearch 模式

    Big Brain可能是指推理模型 + 更多思考时间,类似 OpenAI o3 mini high。

    要体验完整的 Grok3 「三件套」,大伙儿可得破费了。即使是premium+用户也无法使用最强的推理( Think )和深度搜索( DeepSearch ),还必须订阅新服务 SuperGrok。一顿操作下来,月费估计要 50 美金。( 咱还是继续免费薅 DeepSeek 吧 )

    就刷榜成绩来说, Grok-3表现确实不俗。准确地说,Grok 3 是一个系列,不只是某一个模型。轻量版本 Grok 3 mini 可以更快地回答问题,但会牺牲一些准确性。

    数理编程上,Grok 3 都大幅超过 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。

    而这些被用来对比的模型的性能,与轻量版本 Grok-3 mini 相近。

    在大模型竞技场 Chatbot Arena(LMSYS)中,早期 Grok-3 版本的得分取得了第一,达到 1402 分(有史以来第一个),超过了包括 DeepSeek-R1 在内的所有其他模型。

    马斯克直言:Grok 3 比 Grok 2 「好 10 倍」!

    网友们也迫不及待地开始整活了。

    意外啊,居然是中文写作高手

    最让人意外的是,从刷榜成绩来看,明明是个优秀理科生,偏被中文网友发现中文写作水平真高!

    一位科技博主让 Grok 3 写了一篇《我的故乡回忆》,直接把我看感动了!

    「海就像村里的钟……日子就得跟着海走。」多好的句子啊!

    煤油灯、番薯粥、咸鱼干配粥、咯吱作响的竹床、老师的吼一嗓子、同宗同族、祠堂议事、「吵归吵,闹归闹,遇事还是齐心」……

    充满乡土气息的日常文化符号,让一个 90 年代的泉州小渔村跃然纸上,也暗示了时代变迁。

    来自x网友@imxiaohu

    立刻有网友让 DeepSeek 也如法炮制一篇《我的高中》。

    DeepSeek 也很擅长日常细节,怎么说呢,这些细节加起来并没有产生一加一大于二的效应,不如 Grok 3 的深刻,情感触动也不那么明显。

    来自X@@Louis_Chenxf。提示词,分析一下上面这篇文章 的写作风格,写一篇题为《我的高中生活》的文章,长度也和例文一致。

    至于最后出场的 OpenAIo1 Pro,就像背了一堆典范作文、好词好句的人,写成的应试文。

    来自X@howie_serious

    DeepSeek 毒舌功力已经众人皆之,网友发现Grok 3 辣评能力也是没有瓶颈!

    让它犀利点评自己的推文,因为没告诉具体账号,这位网友先被Grok 3 怼了一脸。告知账号后,Grok 3 开始毒舌,就连拍它马屁的推文也被怼:

    夸得那么猛,也不怕把自己舌头闪了?光吹不给证据,跟放空炮有啥区别?

    吹牛不带喘气、细节一抓就漏风 ……

    Think 模式,确实是个理科高手

    这些只是开胃菜。

    作为一个数理编程的强者,网友们分享最多的是 Grok3 强大代码能力,简直是游戏开发者的福音。

    比如,用 python 编写一个在正方形内弹跳的黄色小球的脚本,正确处理碰撞,使正方形缓慢旋转。

    下面是 DeepSeek R1(左)、o1-pro(右)的结果。

    继续输入提示词:

    put the ball in a tesseract instead of a square

    就有了下面这个结果。

    这里只是基础模型,没有启动「 Think 」、「 Big Brain 」哦。

    还能再复杂一些吗?

    来自x@_akhaliqprompt: Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what’s going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

    这是一个连马斯克本人都点赞的演示,看看 DeepSearch + Think 能创造什么?

    网友让 DeepSearch 帮忙用 p5.js(一个网页动画工具)复刻《 Flappy Bird 》小游戏,它先帮忙从网上找好了游戏素材和图片。

    然后,在同一个聊天窗口里启动 Think 模式,AI 就自动把完整的游戏代码给写出来了。

    结果,Run 一次就成功。

    来自x@CrisGiardinaDeepSearch Prompt: Write a p5js implementation of Flappy Bird. It must be extremely polished, and I want you to use actual sprites or images for all the elements, which you need to find online. Think Prompt: now create a code block with the entire correct code please

    AI 大神Andrzej Karpathy 也让模型通过代码动态生成一个可交互的《卡坦岛》风格游戏地图。目前,很少有模型能稳定地完成这个任务。结果,只有 Grok 3 (「Think 」)、OpenAI(如 o1-pro,月费$200)可以实现。而DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude 均告失败 。

    谢耳朵玩的就是《卡坦岛》风格游戏。

    除了代码和复杂逻辑推理, Andrzej Karpathy 发现,在数学推理、探索解决黎曼猜想的测试中,Grok 3(「Think 」)也都表现不俗。特别是针对黎曼猜想,Grok 3(和DeepSeek R1 )表现出探索意愿,而其他模型会立即放弃并仅回复「这是未解难题」。一些常见的陷阱题目也难不到它,但要打开「 Think 」。

    Grok 3 知道 strawberry 中有 3 个「 r 」。它还告诉我 LOLLAPALOOZA 中有 4 个「 L 」。

    Grok 3 告诉我 9.11 比 9.9 小。

    DeepSearch 模式,挑战 OpenAI ?还嫩了些

    不过,对标OpenAI「深度研究」的 DeepSearch,它明显不如前者。

    Andrzej Karpathy 的评价是:

    优于 Perplexity 的类似功能,弱于:OpenAI 近期发布的「深度研究」工具。

    作为一个 AI 研究助手,搜索范围要广、尽量全,而且来源是真实、可靠的。如果具有洞察力,那更好。而 AK 发现了幻觉问题,有时会编造根本不存在的网页链接,也会对事实做出错误陈述,数据统计上也存在问题。其他网友也发现了类似问题。

    除了幻觉问题,在信息搜寻力度上,不如 Google Deep Research 全面,分析信息时,洞察力也不如 OpenAI 的 Deep Research ,「还处在早期阶段」。

    例如,谈到软件企业如何应对创新者困境,谷歌的研究助手引用了 80 多个来源,Grok3 最少。

    OpenAI 研究助手也只引用了 29 个来源,但分析洞察能力很强。

    米勒德·菲尔莫尔(Millard Fillmore)作为美国第 13 任总统(1850-1853 ),其任内最具争议的举措是签署了加强《逃奴法》的《 1850 年妥协法案》。

    关于他是否违反宪法的问题,是一个非常复杂的法律问题,但 Grok 3 的研究结论似乎不这么认为。

    而 OpenAI 研究助手明显要审慎多得多。

    始终翻不过的山

    遗憾的是,大模型讲笑话真的很烂,Grok 3的幽默感也没有明显改善。看来,思考推理能力对于幽默来说,更像是砒霜?

    至于伦理问题上,比如为救百万人该不该错误鉴定别人的性别?大模型们仍然不善于应对。要么打太极,而Grok 3 直面难题后,结论又明显功利主义了。

    最离谱的当属 SVG 绘图挑战赛!让 AI 用代码画鹈鹕骑自行车,就像让它闭着眼睛拼乐高——生成的矢量图坐标歪七扭八,活脱脱抽象派赛博艺术。毕竟对 AI 来说,在 2D 网格上布置许多图形元素,就像让盲人指挥交通,结果比毕加索的画还魔幻。

    来源:微信公众号“机器之能”

  • 蚂蚁集团入局人形机器人,上海杭州14个岗位开放

    蚂蚁集团入局人形机器人,上海杭州14个岗位开放

    机器人前瞻2月19日报道,今天,有招聘平台信息显示,蚂蚁集团开放招聘14个具身智能系统和应用等相关岗位,相关招聘主体为上海蚂蚁灵波科技有限公司,这说明了蚂蚁集团很大可能正在筹备研发具身智能人形机器人产品。

    对此,蚂蚁集团刚刚回应相关媒体称,这是一个常规招聘,工作经验要求只需要3年,因此并没有外界所理解的信号意义。至于具身智能技术的研发,蚂蚁集团表示,将持续布局和加大AI投入。

    据企查查信息,上海蚂蚁灵波科技有限公司成立于去年12月,法人为朱兴,注册资本 1 亿元,由蚂蚁智能(杭州)科技有限公司 100% 持股。

    这次开放招聘的岗位包括嵌入式开发工程师、机器人软件测试工程师、机器人电子硬件工程师、算法工程师、人形机器人硬件结构工程师、仿真系统开发工程师等。

    这些岗位的地点分布在上海浦东新区、上海黄埔区和杭州西湖区,其中9个岗位要求本科及以上学历即可,5个岗位要硕士及以上学历。

    从部分岗位详情描述来看,要求应聘者要负责机器人本体结构设计、机械零部件进行硬件规格设计;开发自研机器人操作系统;或负责机械臂\人运动控制系统设计等;开发优化灵巧手抓取相关强化学习方法等,这说明了蚂蚁集团或许是准备从零开始自研人形机器人产品。

    蚂蚁集团首次入局实体机器人赛道,可以追溯到2023年。在 2023 年全球领先的金融科技峰会上,蚂蚁集团曾宣布,其自主研发的智能机器人产品已完成多场景技术验证,将在物流、公共服务及商业服务领域启动试点应用。

    去年11月,蚂蚁集团入股星海图(苏州)人工智能科技有限公司,该公司专注于打造 “一脑多形” 具身智能机器人。

    蚂蚁集团进军看似与金融毫无关联的具身智能赛道,但其此前已经在人工智能、大数据、云计算等领域已经积累了一定的技术实力,这些技术都与具身智能技术有着高度的关联性和互补性。随着具身智能领域的高速发展,蚂蚁集团的加入,既为行业带来了资金与技术,也进一步彰显出科技巨头纷纷投身人形机器人赛道竞争的强烈态势。

    来源:微信公众号“智东西”