分类: 行业资讯

提供AI行业的最新资讯、市场动态和趋势分析,帮助用户及时了解行业发展情况,把握市场机遇。

  • AI时代,电力为王

    AI时代,电力为王

    AI时代来临,最先爆发的可能是电力板块?

    近期电力股股价持续上扬,国家电网、南方电网两大电网公司2024年投资6000亿元,创下新高,成为相关概念股股价坚挺的因素之一,同时中国制造提速和AI算力提升,尤其是近期DeepSeek大火,带动AI领域的火爆,对电力需求大增,供需端的巨大变化,让资本市场对电力系统持续看好。

    国家电力系统在2024年交出了不俗的答卷,建成投运3项特高压工程,累计建成“22交16直”38项特高压工程,同时全年投产110千伏及以上线路4.38万公里,电网高质量发展进程全面加快。其中全年超6000亿元的投资,特高压交直流工程建设、电网数字化智能化升级等。

    日前国家电网表示,2025年将进一步加大投资力度,投资金额将超过6500亿元,聚焦优化主电网、补强配电网、服务新能源高质量发展,推进重大项目。南方电网2025年将安排固定资产投资1750亿元,也将创下历史新高。

    业内人士指出,电网投资是稳增长的重要方式,也是逆周期调节的重要环节,既能满足日益增长的电力需求,给产业链上下游企业带来发展机遇,又为跨省跨区电力交易提供保障,对建立全国统一电力市场发挥积极作用,同时为AI领域保驾护航,成为中国制造和中国智造重要推手。在投资金额大幅提升以及市场供需两旺的情况下,电力系统2025年或将迎来大爆发。

    中美电力大比拼谁先慌了?

    电力是一个国家和地区发展的晴雨表。我国在此前一直有“电力弱国”的标签,1989年,我国的发电总量方才达到美国1953年的标准,我国电力发展相较于美国存在较大的历史差距,人均用电量一度不到美国的十分之一。经过多年的发展,2003年我国发电量达到美国的一半。

    中美科技战背后则是能源领域的比拼。为此新任美国专门成立了新能源委员会,旨在推动美国在人工智能领域的主导地位。而最近十余年中美电力地位的互换也成为中美经济发展的重要参考。

    2011年,中国的年发电量达到47306亿千瓦时,首次成为全球最大的发电国家,发电装机容量也在这一年成为世界第一。

    2014年,美国发电量为40935万千瓦时,同比增长0.7%。同期中国发电量为55495万千瓦时,同比增长3.8%。中国发电量是美国的1.36倍。这一年中国GDP为10.48万亿美元,美国GDP为17.61万亿美元,中国GDP为美国的59.5%。但在随后几年,中国的电力装机容量增长更快。2014年到2021年,中国建造的跨区域电网容量是美国的80倍。

    当年美国的电力结构以天然气和其他气体发电为主,占比42.4%,其次是煤炭发电(27.8%)和核能发电(8.9%)。风能和光伏发电的增长显著,分别占比5.6%和0.9%。中国的电力结构虽然未具体提及,但中国的高效建设和快速能源生产速度表明其电力结构也在不断优化和现代化。‌

    2024年,中国发电量为9.4亿千瓦时,美国总发电量为4.3亿千瓦时,中国发电量为美国的2.2倍。总装机量中国为26亿千瓦时,美国为13亿千瓦时,美国总装机量为中国的一半。

    (中美以及欧盟2023年发电量对比)

    2024年的数据显示,美国煤炭发电的比例仍占15%以上,甚至超过了所有可再生能源的总量。风电占11%,水电和太阳能加起来才10%。这样的比例远落后中国,中国的新能源发电比例接近50%,风电、光伏发电的利用率更是达到95%以上。中国的新能源不仅有规模,还有效率。2024年,全国新增发电量中,有近八成都来自可再生能源。

    2024年美国GDP为29.2万亿美元,同比增长2.9%,中国GDP为18.94万亿美元‌,增速为5%。中国GDP是美国的65%,但除去汇率因素,真正差距并没有这么大。中国经济的迅速发展,以及缩小和美国的差距,电力功不可没。

    没电力不算力

    AI如今如火如荼,可很少有人知道AI算力需要海量的电力支撑,这个行业是不折不扣的耗电大户。数据显示全球数据中心的电力消耗约占全球总用电量的1%-2%。而随着AI算力需求的增加,这一比例预计将显著上升。

    人工智能从业者王安然介绍称,AI算力的耗电量非常巨大,尤其是在训练和运行大规模深度学习模型时。随着AI模型的规模不断扩大(如GPT-3、GPT-4等),其对计算资源的需求呈指数级增长,从而导致电力消耗急剧上升。

    “AI算力分为训练阶段和推理阶段,训练大规模AI模型需要大量的计算资源,通常使用高性能GPU或TPU集群。训练过程中需要反复迭代,计算量巨大,耗电量极高。训练GPT-3这样的模型可能需要数周甚至数月的时间,消耗数十万度电。推理阶段(即模型实际应用时)的计算量相对较小,但由于用户规模庞大,总体耗电量仍然很高。ChatGPT等AI应用每天处理数百万次请求,需要持续运行大量服务器。后期数据运营中心的计算设备、冷却系统以及相关网络设备都耗费大量电力。”王安然认为现阶段的AI算力能效很难降低,但降低能效是未来发展的必然趋势。

    目前,GPT-3拥有1750亿参数,训练过程消耗了约1287兆瓦时(MWh) 的电力。这些电力足够121个美国家庭使用一年,ChatGPT一次训练造成相当于3000辆特斯拉电动汽车共同开跑、每辆车跑20万英里的耗电量。而GPT-4的规模更大,训练耗电量预计是GPT-3的数倍。

    具体数据尚未公开,但估计可能需要数万兆瓦时的电力。ChatGPT的每个请求耗电约2.9瓦时,现阶段,ChatGPT每天需要响应1.95亿次请求,每天耗电约564兆瓦时,ChatGPT每天用电量相当于1.7万个美国家庭的用电量,是典型的电老虎。

    “AI深度训练需要大量的数据输入,依赖于高端图形处理器(GPU)或定制的人工智能处理器来提升计算速度。数据量的增长直接导致计算任务的增加,使得这些高性能的计算组件消耗大量电能。大量的内存访问和计算操作也引发更高的能源消耗。”王安然解释了AI算力为何如此耗电。“降低能耗只能通过优化算法以减少计算需求、开发专门的AI芯片以提高能效、利用可再生能源为数据中心供电等。现阶段各家都在尝试,但效果并不明显。”

    AI反哺电力

    电力助力AI算力的发展,AI则反哺电力。通过AI算法可以在发电侧精准供需,智能发电控制系统能够精细调整发电机组的运行参数和优化控制策略,从而显著提升发电效率与系统稳定性。同时在电网侧实现风险管控。借助AI算法,智能电力调度系统能够实时监测电网运行状态并进行优化调度,确保电力供需始终保持平衡,同时提升整个电网的运作效率。在用人侧则实现了降本增效,大大降低人力成本,这些反哺直接体现在电力股的财报之上。

    国家电网旗下的国电南瑞在2024年前三季度营收323.1亿元,同比增长12.97%;归母净利润44.73亿元,同比增长7.53%。其中营收增长为近三年同期新高。2021年至2023年,国电南瑞营收分别为424.1亿元、468.3亿元和515.7亿元,同比增长10.15%、10.42%和10.13%;归母净利润分别为56.42亿元、64.46亿元和71.84亿元,同比增长16.30%、14.24%和11.44%,连续亮眼的业绩表现让国电南瑞2024年全年股价涨幅17%,跑赢了大盘,不过进入2025年,国电南瑞股价至今跌幅约7%。

    值得注意的是国电南瑞此前三年的净利润增幅均高于营收增幅,得以净利率的提升。2021年至2023年,国电南瑞的毛利率整体波动不大,分别为26.88%、27.04%和26.80%,但同期净利率逐年提升,分别为14.25%、14.74%和14.83%。净利率的稳步提升带来净利润的增幅高于营收增幅。

    也不是每家电力股的业绩都如此出色,国网英大业绩就陷入波动之中。据财报显示,2021年至2023年,营收94.85亿元、108.6亿元和109亿元,同比增幅为17.22%、14.51%和0.32%,呈不断放缓趋势。而归母净利润更是波动较大,同期净利润分别为12.24亿元、11.01亿元和13.64亿元,同比增幅为40.66%、-10.07%和23.96%。往前6个完整财年,国网英大的净利润增幅均出现增长一年接着下滑一年的情况。

    2024年前三季度国网英大营收76.94亿元,同比增长4.64%;净利润14.52亿元,同比增长26.26%。相比上一年同期1.85%的营收增幅,增幅明显提升,只是相比上一年39.78%的净利润增幅,增幅又出现明显下滑。国网英大整体利润提升较大,2024年股价涨幅也达18%,但进入2025年,股价回跌8%。

    (国网英大2024年三季报)

    从行业整体上看,这两年电力股整体业绩表现向好,AI算力在反哺电力系统上不只表现在业绩之上,智能电网优化能够通过分析历史数据和天气等因素,提升电力需求预测的准确性,帮助电网更好地平衡供需。在可再生能源整合上也较为出彩,通过风光预测,AI提高风能和太阳能的发电预测精度,帮助电网更好地管理这些间歇性能源。同时储能优化做到充放电最优化策略,提升可再生能源的利用率。在供给端、管理侧、网络安全以及设备管理与维护中,AI都有较大优势,在提升客户服务和使用体验上也具备一定的优势。

    总之,AI在电力系统中的应用广泛,从优化电网运行到提升可再生能源利用率,再到增强网络安全和用户服务,AI正在推动电力系统向更智能、高效、可持续的方向发展。而如今中国AI算力的蓬勃发展同样离不开中国电力的支持,毕竟AI时代,电力为王已经是不争的事实,2024年中国发电量和装机量继续稳坐全球第一,保障了AI发展的电力需求,AI领域的发展也为电力企业的创新发展和降本增效带来了技术支持,两者相辅相成,形成共同发展的局面,在今年6500亿元资金的投资下,电力系统的发展或更值得期待。

  • 打工人拥抱DeepSeek,从买课开始

    打工人拥抱DeepSeek,从买课开始

    “2025年普通人怎么用DeepSeek Ai?”

    “一人公司,DeepSeek+自媒体杠杆”

    “DeepSeek拓客,美业如何用来变现?”

    谁也无法否认,DeepSeek这把火正越烧越旺,甚至已经从B端应用,逐渐蔓延至C端用户。普通人每天似乎只需要抬眼一睁,就能从周边接触和自网络了解中,轻易发现DeepSeek的身影。

    当AI开始重塑人们的日常,一般人想到的可能是,自己可以通过使用这些带着AI标签工具,来让工作和生活变得更加高效快捷。而另一部分人却觉得,自己应该跟上这趟时代快车,抢先布局以迅速对接更美好的“钱景”。

    于是,瞄准后面这部分人群所透露出来的迫切需求,技能培训赛道的诸多角色闻风而至。直播间、互联网社群、线下培训班……这群“卖铲子”的人,不断从各个渠道拉人头,借用“错过这个风口,留给打工人的时间就不多了”“不要等着AI来主动淘汰你”等话术,都想把课卖给那些正倍感焦虑的普通人。

    从几分钱的学习资料,到几百元的线上教学,再到几千元的线下实操,似乎已经成为每个新领域、每种新技术在火爆之后的一大掘金范式。

    此前,锌刻度曾做过数个有关技能教学培训的调查内容,包含个人IP点金术、60天速成月入过万的写手、轻松获得高薪的烘焙培训、学习20天就能接单的手办课……跟这一次的DeepSeek培训热潮相比,其实大家没什么两样。

    买课为了走捷径

    “这样最方便啊,而且老师手把手地教,跟着操作就行。”问起王依愿意花299元购买DeepSeek线上教学课的原因,她的回复很直接。

    自年后就待业在家的王依,庆幸自己赶上了好时候,“这两年大家都知道未来是属于AI的,但是除了那些定向培养出来的行业人才,一般人根本想不到有什么渠道可以抓住这个机遇。尤其是跟我差不多的人,之前从事的行业已经不行了,再找同类型的岗位来干结果也就那样。眼看着一个更有发展前途的行业就要起来了,又怎么会不心动呢。”

    在王依眼里,AI这个词在很长一段时间,其实都是隐于自己工作之外的,只有在使用市面上那些搭载了AI大模型的应用服务时,才能从中察觉到一股由全新技术浪潮带来的改变。

    DeepSeek带来的技术焦虑

    “就比如前段时间那么火的AI爆改影视剧,假如做自媒体起号,看起来只需要自己想好一个剧本创意,直接用AI生成画面和声音再组合起来就行,但要保证流量和收益就需要不断输出内容,而这种生成技术的多次服务是要收费的。”王依还在做办公室文员的时候就考虑过要干点副业,可在实操时又因为各种投入和收益的不确定而被劝退。

    随着DeepSeek开源打破了技术垄断,AI似乎也不再是大佬们的专属。

    最直观的反馈,就是它开始将各种AI应用的服务价格给打下来了。在各行业接入DeepSeek后,当一些AI工具开始宣布免费,几乎是在瞬间就打破了普通人的刻板印象,即那些原本与AI、大模型等高端词汇挂钩的技术和成本等,相当于布局新赛道的隐形门槛。

    在思考了一番未来的可能性后,王依更加笃定了,“只需要付出一笔买断课程的钱,就能试着跟老师学着怎么更好地使用AI,实操课还会教本地部署,相当于培养一个完美适配自己需求的智能助手,这样算怎么都不会亏的。”

    DeepSeek直播卖课

    “我主要是想提升一下自己在职场上的含金量,也想试试看以后能不能借助它找到更好的跳槽机会。”常林,一个自DeepSeek火爆全球那天起,就开始四处搜罗“DeepSeek+”教程的“90后”,目前最焦虑的事情是怕自己用不好AI工具。

    “不能解决实际问题的AI是没有意义的,重点是一般人根本就不懂这个症结在哪里。”常林认为,尽管人人都能使用DeepSeek,但想要成为跟上技术浪潮的第一批人,必须先要明确自己的需求所在。

    但作为一个实打实的门外汉,只要涉及到AI具体应用项目的选择,以及对目标市场在AI加持下的布局规划时,自己脑海里所有的设想都是空洞的,“说穿了,就是缺乏实际情况的指导和一些具体的参考案例。”

    而现在,几乎各个渠道都能轻而易举找到他想要的。从直接买份资料,到在直播间上课,再到找个线下培训班,就看常林舍得为此付出多少钱了,“目前只花几块买了一套资料合集,先自学着,顺便弄清楚我的具体需要,下一步再看看要不要报个班。”

    卖课都是“割韭菜”

    “到网上四处扒点相关的资料,很多都是免费分享出来的,打包好直接挂上车卖就行。”申留,一个标准的二道信息贩子。

    当锌刻度问到,这样做难道就不担心消费者不满而投诉吗?申留的回复意味深长,“卖资料的时候我们并没有承诺包教包会,相当于只是做资源的有偿分享。”

    他给出了具体的解释:一般虚拟商品不支持退货,即使有人看不懂想要退、退不了还打差评,实际影响不了下一个有需求的人购买。要是平台因为投诉或举报把商品链接下架了,那也可以四处散发资料信息,把需求用户引流到社交平台上一对一交易。而另一部分人则纯粹觉得这就是一两块的事情,即使自己没用上也没那个必要非要追着要求退货。

    锌刻度发现,只要在各大社交平台搜索“DeepSeek教程”等关键词,就能找到卖课的链接和渠道,价格从一分钱到几十块不等。

    一个颇为魔幻的剧情是,前段时间由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队,所撰写的一份专业文档《DeepSeek:从入门到精通》,原本是免费分享的,如今却成了“申留们”在网络上铺得最广的一份货源。

    其中,有一家小店挂出来的商品链接,单价为1.12元一份,至今已卖了2.2万单,该链接还附带有另一个包含上述文档和全套玩法的选项,价值6.88元且标明了有万人购买,那么粗略估算一下,即使是用这条链接的最低价来算,不扣除平台分成的前提下,已经为商家带来了24640元的营业额。

    这份无本的买卖,“申留们”做得异常顺手。毕竟在相关购物平台上,这份文档的付费链接早已刷屏,哪怕只卖一毛钱,对其背后的商家来说,那也是空手套白狼的好事情。

    原本免费的资源被摆上货架

    针对看了资料也学不明白,却还想赶在第一时间吃上这碗饭的那一批人,几百至几千元的技能培训班就成了他们更好的选择,只看消费者自己愿意付出的预算是多少。

    不过,相关技能培训班因“割韭菜”,在这段时间迎来了媒体的大规模曝光。来自“大皖新闻”的调查报道称,一些线下培训机构存在具体培训内容含糊不清、老师的专业性也无资质证明等情况。

    对于线上的培训班,锌刻度更是在网上看到不少消费者发声质疑:“所谓的技巧毫无指向性,换个其他技术、其他赛道依然可以套用”“稍微对比一下你就会发现,这些所谓的专业课程,老师的独门指导,在网上搜索关键词几乎都能找到对应的内容”……

    知识付费不是万灵丹

    此前,锌刻度曾做过数个有关技能教学培训的调查内容,几乎都是同一个套路:夸大宣传未来靠技术赚快钱的可能性→吸引消费者付费学习→在学习过程中或谋求变现时发现被骗→培训班不包售后消费者求助无门。

    现阶段这股铺天盖地的“DeepSeek搞钱”之风,依然是从“DeepSeek15天教程:从入门到精通”“万字长文教会DeepSeek”“DeepSeek爆火,大量网红即将消亡”等营销话术开始,全都围绕着技术焦虑、业绩翻番、财富自由之类的议题展开。

    短期内课程销售额破万的不少

    他们最终的目的是,让不懂AI但又想学习的用户心甘情愿掏钱买课,他们造成的结果是,这种将技术严重功利化的做法会让用户陷入短视。

    当整个技能培训赛道一窝蜂开始拥抱新热点,他们只求短期利益,因而整个课程内容设计也充斥着“如何快速变现”等内容和观念,教学只重皮毛不重内核,所带来的不仅是高价收费与课程内容实际价值不匹配,受此教育的学员们也在这一过程中,或主动或被动地加重对新技术的功利心,全然只想如何能找一份高薪工作,甚至借此实现财富自由,他们对新技术之于未来的想象,自此被彻底禁锢起来。

    整个技能培训链条所关联的人,其实从没有真正理解过像DeepSeek这样的新技术,到底拥有怎样的内在逻辑、技术魅力,也没想过在此基础上进行拓展与创新。

    如此一来,这些所谓的AI教育,全都沦为了面子功夫

    一切正如轩睿基金总经理盖宏所说,“从ChatGPT的兴起到Sora,再到DeepSeek,之所以能被投机分子利用,实际上是他们在利用信息差、焦虑和流量来收割消费者。在大家热议的时候,消费者应该对新技术有个客观的了解,保持理性。”

    遗憾的是,有些人还没开始使用DeepSeek,就轻易相信了那些卖课的人。

  • DeepSeek引爆国产适配的前夜,「硅基流动」已完成亿元融资

    DeepSeek引爆国产适配的前夜,「硅基流动」已完成亿元融资

    有人预料到DeepSeek能引爆全球吗?至少,DeepSeek-V3发布前,在大模型战场前线“卖铲子”的袁进辉心里也是打鼓的。

    1月28日,他在社交媒体上回忆起一个故事:DeepSeek爆火前一个月,梁文锋曾建议硅基流动部署DeepSeek-V3,至少准备20台H800,80台最好。袁进辉迅速算了算账,一个月80台H800服务器就要支出五六百万的算力成本,这些机器还不一定能用满。“风险太大了,就没下注。”

    随后DeepSeek火爆全球,汹涌的流量让其官网和App很快崩溃,热情的用户急于找到能正常使用DeepSeek的渠道。袁进辉感慨:“现在DeepSeek这么火,决策失误,欲哭无泪。”

    很快,这种懊悔转变成强大的行动力。苦于算力不足的硅基流动找到华为,全力完成DeepSeek-R1 & V3在昇腾芯片上的适配工作。整个春节期间,硅基流动团队没有休息过一天。

    他们的动作够快,承接住了第一波流量。2月1日,硅基流动首发了基于华为昇腾算力的满血版DeepSeek-R1 & V3,迅速吸引了大批开发者和个人用户。

    △图源:SimilarWeb

    这是一次巧妙的合作,一举扫清市场对于国产芯片性能瓶颈的疑虑,证明了在国产芯片上部署DeepSeek,也可以获得持平全球高端GPU部署模型的效果。同时,这次合作无意间触发了一场国产替代的狂欢。

    硅基流动也借此证明了自己的AI Infra实力。“尤其这次上线DeepSeek R1 & V3之后,涌过来的合作线索,暂时都看不过来。”袁进辉说。

    就在硅基流动爆火之前, 《智能涌现》获悉,硅基流动(SiliconFlow) 在2024年底 就已完成亿元人民币Pre-A轮融资,由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投,华兴资本担任独家财务顾问 。

    值得注意的是,本轮融资之前,硅基流动已引入美团作为战略股东。

    2024年8月,《智能涌现》曾采访过创始人袁进辉,当时硅基流动正好成立一周年,刚发布MaaS平台SiliconCloud。

    你可以将SiliconCloud想象为一个“大模型API超市”,开发者只需要注册账号,选择自己想要的模型,就可以开发应用,免去购买服务器的负担。甚至,经过硅基流动适配和优化后的模型,还能做到比原厂模型响应更快、推理成本更低。

    在这一年间,硅基流动经历了起码十倍的市场增长。SiliconCloud已经获得了超三百万的用户,日均调用上千亿Token——去年刚上线时,这个数字还是日均百亿。

    △图源:硅基流动

    在开发者圈子中,硅基流动有着良好的口碑,因提供亲民价格和优异性能的模型服务被称为“赛博菩萨”。现在,SiliconCloud已经上线了包括满血版DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice等在内的上百款主流模型,也提供模型训练、微调、托管到部署的全套工具,满足开发者及企业客户的不同应用场景需求。

    2024年7月,硅基流动也推出了一款新产品:基于ComfyUI的云节点插件BizyAir。

    BizyAir是一款图像生成工具,能够让AI开发者与创作者无需考虑显卡和环境限制,即可直接使用云计算资源完成生图任务。截至目前,BizyAir支持数十种模型,支持ComfyUI本地节点混跑,已经获得了近万名用户。

    △图源:硅基流动

    硅基流动在这一年间也开始了To B商业化扩展,与华为、亚马逊云科技、英伟达等顶级云厂商、芯片厂商、大模型公司及应用公司建立了合作伙伴关系。

    企业服务方面,硅基流动已经在大语言模型、文生图、视频生成等多个场景,有标杆客户案例的落地。硅基流动目前提供四种服务模式,包括专属实例、算力纳管、私有版 MaaS、基于华为昇腾910系列NPU的一体机。

    毫无疑问,DeepSeek已经一扫2024年大模型领域的阴霾,一场宏大征程的序幕已经展开。2024年,袁进辉曾对《智能涌现》表示,在GPT-4o出来后,大模型的语言能力、知识能力方面的限制都解决得比较好了,除了逻辑推理能力。

    OpenAI o1、DeepSeek R1的出现,意味着大模型在“逻辑能力”这个问题上前进了一大步,这对应用市场是巨大利好。

    “可以预期,国内外基于DeepSeek的应用将爆发,这一天终于要到来了。”袁进辉说。

    以下为《智能涌现》与创始人袁进辉的问答:

    《智能涌现》 :上一轮融资之后,硅基流动在产品方面有什么节点性的进展?关键性能提升的程度如何?

    袁进辉 :主要是适配了华为昇腾芯片、开源了ComfyUI云节点 BizyAir,以及持续上线最新模型,并且上线了模型微调、托管等功能。

    底层推理框架的性能依然保持业内领先,性能优化是一项需要长期、持续性投入的工作。

    《智能涌现》 :推出相关产品后,市场都有怎样的反馈?商业落地上有什么关键性进展?

    袁进辉 :SiliconCloud获得了爆发式增长,目前平台有超三百万用户,日均调用超千亿 Token;BizyAir在没做什么推广的情况下获得了近万名用户。

    商业落地方面,尤其这次上线DeepSeek R1 & V3之后,涌过来的合作线索暂时都看不过来。

    《智能涌现》 :去年7月硅基流动上线了 BizyAir,为什么会推出这个产品?战略定位是什么?

    袁进辉 :BizyAir 是一个意外惊喜。起初,这是一个试验性项目,其实还是帮助用户用高性价比的推理服务资源,更方便地进行生图。在BizyAir之前,我们开源的图片/视频生成推理加速组件OneDiff,由于性能好、灵活、支持模型丰富,已经有较好的口碑。在做OneDiff的过程中,我们了解到生图用户的常见痛点,包括出图慢、工作流组合繁琐、上手门槛高等,所以我们尝试开发了 BizyAir,发布后受到了不少用户的喜爱以及自发传播。

    《智能涌现》 :去年你说,大模型的语言能力、知识能力方面的限制都解决得比较好了,除了逻辑。Deepseek V3之后,是不是逻辑能力也做得足够好了,2025年会迎来现象级的应用吗?

    袁进辉 :那时还没有OpenAI o1、DeepSeek-R1。它们的发布已经展示出模型的强大逻辑推理能力,并且DeepSeek-R1把思考过程完整地展示了出来,看上去更像是一个有思辨能力的人在思考。

    现在,开发者基于标准API可以做很多很酷的应用了,可以预期,国内外基于DeepSeek这样的开源模型的应用将爆发,这一天终于要到来了。

    《智能涌现》 :最近硅基流动迅速基于昇腾上线了DeepSeek,春节期间也有大量开发者涌入,你们在前线看到的情况是怎么样的?

    袁进辉 :我原本以为我们能接住这波用户,但市场对DeepSeek-R1 & V3的需求量太大了,目前不得不对免费用户进行限流,当然,我们也在积极扩展资源,希望能让用户敞开用。

    我们作为一个面向开发者与企业客户的API平台,但是光官网的Playground就有几十万日活,可见DeepSeek需求量之大。

    《智能涌现》 :很多第三方企业宣布接入DeepSeek-R1 & V3 ,但为什么实际能提供满血版的企业很少?

    袁进辉 :一方面,部署满血版DeepSeek R1 & V3需要的算力资源非常大,用80台H800来部署,每月需要五六百万的算力成本,一般企业与其自己本地部署,显然接入硅基流动SiliconCloud这样的云服务 API 更划算;

    另一方面,要部署DeepSeek R1 & V3这样的MoE模型技术挑战很大,需要专业的AI Infra团队才能部署成功且把性能优化得很好,硅基流动SiliconCloud曾是国内最早部署上线 DeepSeek 模型的第三方平台,也是首个在国产芯片上适配部署DeepSeek-R1 & V3的AI Infra公司。

  • DeepSeek、Grok对医生能有多大的帮助?

    就在医疗界热火朝天地讨论如何应用DeepSeek时,北京时间2025年2月18日,埃隆·马斯克的人工智能公司xAI推出了Grok 3,马斯克将其描述为“地球上最聪明的人工智能”。

    除了这大胆的说法,Grok 3在推理、编程和特定领域理解等方面的进步,确实有可能使其成为一些领域游戏规则的改变者。

    ChatGPT4、DeepSeek- R1和Grok 3的相继推出,对于那些使用人工智能的医生、药物研发者、影像公司来说,这实际上意味着什么?这些变得越来越优秀的AI在医疗健康行业终究会扮演什么角色?

    No.1 Grok 3带来什么冲击?

    埃隆·马斯克的Grok 3,得益于神经网络升级、训练数据扩展,以及增强的计算基础设施,据称在数学推理、科学逻辑推理和代码写作等能力表现超过或媲美DeepSeek、ChatGPT等对手,尤其是Grok3的推理模式令人称道。

    LabNews Media的一篇文章中指出,在医学领域Grok 3在一些方面的确表现出了显著的优势。

    首先对医疗数据的处理,Grok 3可以独立生成和完善训练数据,这在敏感的医疗领域尤为重要,它可以提高患者数据分析的准确性,同时减少诊断中的潜在隐患。

    其次,在分析大型生物医学数据集方面, Grok 3表现出特殊优势。它可以检测研究数据中的复杂模式,并支持新疗法的开发,尤其是它处理不同类型的数据的能力,将使其在药物研究和临床试验有望成为宝贵的工具。

    第三,在诊断技能方面,Grok 3的高级图像分析功能允许解释各种医学成像程序,如X射线、PET扫描和核磁共振图像。

    另外,Grok 3的实时数据处理允许直接分析和解释医疗信息,这对于在危急医疗情况下的快速决策特别有价值。

    然而,尽管诸多优点加身,试用过的医生和研究人员还是表示,Grok 3诊断医疗能力有限。

    美国一家非营利性科学研究机构研究人员Derya Unutmaz博士,是Grok的测试者之一,就对媒体指出,“必须对Grok的提示进行调整才能得到正确答案。”

    对此,马斯克在X上的一篇文章中称,这仍处于早期阶段,但它已经相当准确,并将变得非常好。

    乳腺放射科医生、深度学习研究员Laura Heacock在社交媒体帖子中说,她使用了她以前测试GPT4的相同乳房的X光检查、超声波和核磁共振作为基准,“比ChatGPT4稍微好一点,但没有一个诊断是正确的。”她预计,未来性能会变好。

    这些测试暴露出人工智能的限制性,强调了人工智能可以被视为支持性工具,而不是专业人员的替代品。

    No.2 让DeepSeek参加一场医师考试

    一个德国研究团队让DeepSeek-R1参加了一场美国医师执照考试(USMLE)。

    在这场考试中,DeepSeek-R1不仅通过了USML三个阶段的考验,还顺带着和ChatGPT硬扛了一把。

    不出意料,在这场比试中,DeepSeek进一步证明了人工智能系统在回答医学问题、模拟临床推理等方面实现了近乎专家的表现。这个由德国杜伊斯堡-埃森大学医学人工智能研究所(IKIM)、德国亚琛工业大学附属医院组成的研究团队,将该研究的预印本于2月6日发布在medRxiv上。

    研究者发现,DeepSeek-R1在基于事实的回忆和临床知识检索方面表现出色。

    USMLE有三个考试环节,第一阶段主要考基础医学,如微生物、病理、药理等;第二阶段考临床知识,含内科、外科、妇产科、小儿科等;第三阶段考的是临床实习后对于医学知识的进一步应用。

    研究人员称,DeepSeek在第一、二阶段中,其精确匹配性能明显超过ChatGPT。这也表明DeepSeek作为医学教学工具有很大潜力。

    不过在第三阶段临床决策方面,无论是DeepSeek,还是ChatGPT都出现力有不逮的状况。

    该研究显示,在需要综合多种临床因素的复杂患者病例中,例如为慢性疾病重叠的患者选择最佳管理策略,DeepSeek可能无法考虑患者偏好、症状演变或非典型表现等细微差别;在高风险场景中,ChatGPT可能给出听起来合理,但医学上不合适的治疗计划。

    无论是对DeepSeek,还是Grok的测试,都表明目前人类医生的专业经验还是至关重要,人工智能适合扮演最佳助手的角色。

    也就是说,将人工智能作为工具,集成到医疗工作流程中可以让医疗健康体系更高效,并且人类专业知识和人工智能支持的结合,对提高诊断准确性和治疗效果将是一场幸事。

    还需注意的是,众多人工智能的集中问世,也让一些问题更突出,也更紧迫。

    Grok的数据来源就引发了隐私问题的讨论。2024年10月,马斯克在他的X社交媒体平台上公开要求Grok的用户,上传他们的医疗图像并生成诊断结果。

    通过社交媒体平台上收集医疗数据的举动,让 Grok招来欧洲隐私监管机构的质疑,可能违反欧盟法规《通用数据保护条例》。

    在步入一个满屏都是讨论AI的时代,最好的、最坏的可能都会发生。如北京朝阳医院一位信息工作人员对《财经》所说:“AI在病历质控、自动生成等已有探索性的应用。现在都还在探索阶段,还需看后面落地的实际应用。”

  • DeepSeek冲击波,阿里、小米、字节上演AI人才争夺“三国杀”

    周四,美国苹果和谷歌应用商店都放开了对TikTok的下载限制,重新上架了这款应用。几周前,两家平台根据美国相关禁令下架了TikTok。在DeepSeek出圈火爆全球后,国内互联网与科技大厂加快了AI人才争夺。继小米和字节跳动相关动作之后,《科创板日报》了解到,阿里AI To C业务近期开启大规模人员招聘,开放招聘岗位达到数百个,集中在AI大模型相关的产品、技术研发岗位。

    近期阿里在AI和云计算方面动作频频。在确认与苹果的手机AI合作后,而马云也在近期多次露面,上周现身夸克所在的阿里智能信息事业群办公区后,又于2月17日在北京出席了民营企业座谈会。

    据悉,此次阿里对外招聘岗位数量达数百个,其中AI技术、产品研发岗位占比达到90%,主要主要分布在AI产品和AI技术研发方向,将重点投入到文本、多模态大模型、AI Agent等前沿技术与应用的相关工作中。

    小米、字节与阿里巴巴上演AI人才争夺战

    在 AI 领域蓬勃发展的当下,人才成为各企业竞争的关键资源。近期,小米挖角 DeepSeek 天才少女罗福莉的消息引发广泛关注。罗福莉,这位 95 后 AI 新星,本科毕业于北京师范大学计算机专业,硕士深造于北京大学计算语言学专业。其学术成绩斐然,在国际顶会 ACL 上一次性发表 8 篇论文,其中 2 篇为第一作者,提出的词义消歧方法和文本风格转换框架在业界引发轰动。

    就在昨天,字节跳动也向《科创板日报》记者证实,在谷歌工作长达17年的“Google Fellow”吴永辉已离开谷歌,正式入职字节跳动。吴永辉在字节跳动将担任大模型团队Seed基础研究负责人,专注大模型基础研究探索、AI for science等偏长期的研究探索工作,汇报给字节跳动CEO梁汝波。

    DeepSeek在资金与人才并不显优势的情况下,取得全球性轰动效应,让所有的大厂都受到了震动。梁汝波在字节跳动新一期全员会上称,DeepSeek R1创新点之一的长链思考模式不是业界首创。去年9月OpenAI发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但跟进速度不够,如果当时及时关注到,有机会更早实现。 他提出2025年重点目标:追求 “智能”上限。

    相比之下,阿里在引进AI人才方面一直不手软。2月初,全球顶尖人工智能科学家、前Salesforce集团副总裁许主洪出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。内部人士透露,许主洪目前正在筹备规模超百人的顶级AI大模型研究团队,推动前沿科研成果向实际应用解决方案的转化。

    阿里巴巴在AI领域布局多年,但过去主要集中在B端业务。2024年第三季度财报显示,阿里云整体收入296.1亿元,同比增长超过7%,经调整EBITA利润达到26.61亿元,同比增长89%。阿里云的业绩由公共云业务的双位数增长带动,其中包括AI相关产品采用量的提升,AI 相关产品收入连续五个季度实现三位数的同比增长。

    从去年年底开始,阿里在AI To C业务发力,把阿里旗下AI应用“通义”并入阿里智能信息事业群,由该部门扛起阿里AI To C的重任。就在上周,阿里巴巴创始人马云现身还现身夸克办公区,与员工打招呼交流。

    “AI驱动”战略下阿里全力由电商拥抱科技

    近期,阿里方面还确认了与苹果的合作,将为苹果在中国的iPhone用户开发新的AI功能。除了手机外,阿里也在推动通义系列大模型落地AI眼镜,包括与消费级AR品牌雷鸟创新RayNeo签约,为其AI眼镜提供独家定制的技术支持。天猫精灵团队也与夸克产品团队在融合工作,探索AI眼镜等新硬件方向。

    在云基础设施方面,阿里云今日宣布墨西哥数据中心正式开服,这是阿里云在拉美区域的首个数据中心,标志着进军南美的重要一步。去年五月,阿里云宣布新一轮全球基础设施扩建计划,将在泰国、墨西哥、马来西亚、菲律宾和韩国投资新建数据中心。目前,阿里云在全球29个地域覆盖87个可用区。

    2月20日,阿里巴巴将公布2025财年第三季度业绩。摩根士丹利发表报告称,预计财报中将提及未来的资本支出计划和公共云收入展望,如果阿里巴巴宣布将加大AI相关投资,将进一步提升整个数据中心行业的新订单预期。

    对于阿里而言, 与苹果的合作其提出“AI驱动”战略以来的一次重要商业突破。谈及阿里与苹果的合作前景,Countpoint相关分析师认为,未来苹果在中国可能会倾向于采用多供模式,会引入更多的大模型服务商。但阿里作为此次合作的先行者,将享有一定时间的独家合作,随着市场的不断发展,百度、字节跳动、DeepSeek 等公司也可能成为潜在的供应商。“我们预测支持中文的 Apple Intelligence,也是首个支持非英文的版本将在2025年内正式发布。”

    艾媒咨询CEO张毅对《科创板日报》表示,与苹果合作后,未来阿里的AI产品都有了与C端用户亲密、直接的接触以及真实的应用场景。这些对于阿里未来的商业转化具有较大的价值。此外,阿里不只是电商平台,其背后也有强大的生态,比如高德、文娱等,如果能与苹果的相关数据形成共振,特别是数据资源方面的商业合作,有巨大的想象空间。

    不单单是阿里,跟阿里同根的蚂蚁集团近期也动作频频。近日,有招聘平台信息显示,蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位。蚂蚁集团相关人士表示,蚂蚁集团去年注册成立了蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发。“蚂蚁集团在持续布局和加大AI投入。 ”

  • 马斯克的Grok3背后还藏着哪些华人AI大牛?

    马斯克的Grok3背后还藏着哪些华人AI大牛?

    北京时间2月18日中午,马斯克为xAI亲自现身站台的Grok-3发布会上,两位坐在“C位”的华人研究员引人注目。对“老马”来说,这场直播有些“复仇”OpenAI的意味——马斯克在直播中花式强调,“Grok-3研究18个月就追上甚至超越了OpenAI做了五六年的成果”。

    “Jimmy Ba,Leading research(首席研究员)”“Tony,working on the reason team”——两幅华人面孔的自我介绍堪称轻描淡写。

    《职场Bonus》据公开资料检索到,马斯克一旁的“Tony”(下图右2),是xAI的联合创始人之一 Yuhuai Wu (吴宇怀)。2021年多伦多大学博士毕业后,吴宇怀在斯坦福大学进行博士后研究。他曾是Google AI的研究员,个人的研究兴趣是“building machines that can reason”(制造会推理的机器) [1] 。

    ● Grok-3发布会

     

    ● xAI团队里的已知华人大牛

    值得一提的是,吴宇怀博士期间曾先后在OpenAI实习过4个月,谷歌DeepMind实习过11个月。而他现在没有留在任何一家公司,自己选择了创业,追寻自己向往的AGI。

    ● 吴宇怀的X主页,xAI联合创始人,关注推理

    而图左边第二座那位更是领域的带头人。 Jimmy Ba 是“深度学习三巨头之一”。他硕博都就读于多伦多大学,是AI“教父”、诺贝尔物理学奖获得者Geoffrey Hinton的学生。不仅如此,他也是多伦多大学计算机科学系助理教授,相当于也是吴宇怀的老师。更有趣的是,Jimmy Ba也曾在谷歌DeepMind实习。

    同时,他们两位也都是xAI团队的创始成员。

    ● Jimmy Ba的X主页,xAI研究负责人,从事软件与研究

    据麦克罗波洛智库的报告 [2] ,在美国顶尖人工智能人才中,来自中国的研究人员占38%,美国占37%。中国在人工智能领域的人才培养上已超过美国,成为全球最大的AI研究者输出国。

    在xAI团队中更是体现了这一点:

    · 创始团队12人中有5位华人,占比超40%;

    · 图像团队4人中有2位华人;

    · 核心研究团队持续有优秀华人加入。

    2023年7月,马斯克高调官宣xAI创始团队12人,其中有五位都是华人,占比超40%。除了吴宇怀和Jimmy Ba之外,还有Greg Yang(xAI数学家)、Guodong Zhang、Zihang Dai。另外还有一位负责AI硬件和半导体研究的华人高管,Xiao Sun。

    ● xAI创始团队

    从他们的教育背景来看,既有清华、北大、浙大国内顶尖高校的毕业生,也有哈佛、耶鲁、多伦多等世界名校的深造经历。几位科学家也都在各自的领域颇有建树。

    Greg Yang (杨格)是一位对数学有着超高热情的数学家。他是湖南人,初中就开始去美国学习,本硕毕业于哈佛大学数学系,2018年还曾获得本科生数学领域最高荣誉Morgan Prize。毕业后经推荐进入微软雷蒙德研究院,担任研究员。此前也参与过微软与OpenAI在大模型上的合作。现在正专注开发一个用于了解大型神经网络的框架,“Tensor Programs”(张量编程)。

    ● Greg Yang

    Guodong Zhang (张国栋)本科毕业于浙江大学信息工程专业,博士毕业于多伦多大学,师从Roger Grosse,专注于培训、调整和对齐大语言模型。曾获得2022年苹果博士奖学金、2015年全国大学生数学建模竞赛一等奖(1.5%)等。

    ● 张国栋,xAI创始成员

    Zihang Dai (戴子航)本科毕业于清华大学,硕博毕业于卡耐基梅隆大学。曾在网易实习一年,而后在2013年入职百度,担任百度深度学习研究所的工程师。读研期间,也曾在美国的百度实习。读博期间在谷歌实习,专注语言处理。博士毕业后在Google Brain就职研究员4年,来到xAI。

    ● 戴子航,xAI创始成员

    Xiao Sun,前IBM T.J. Watson Research Center(托马斯·J·沃森研究中心)研究员、Meta研究科学家。Xiao Sun是耶鲁大学博士,师从T. P. MA Group教授,本科就读于北京大学。毕业后他在IBM度过了六年多的职业时光,专注于机器学习硬件与算法的研究。2023年9月加入xAI。

    ● Xiao Sun,xAI高管,关注AI硬件和半导体研究

    不仅创始团队中华人占多数,据《新智元》消息, Grok 发布的文生图模型 Aurora,采用当下最为前沿的 MoE 架构。其团队在短短 6 个月的时间里,便实现了从0到1的搭建。而团队仅有4人,其中就有两位华人:Haotian Liu和Lianmin Zheng(郑怜悯)。

    其中, Haotian Liu 本科毕业于浙江大学,2024年5月博士毕业于威斯康星大学麦迪逊分校,师从Yong Jae Lee。Haotian Liu对计算机视觉和机器学习感兴趣,参与开发Llava,Grok-1.5V和Grok-2,最近的重点是构建可进行的大型模型。

    ● Haotian Liu,文生图团队成员

    郑怜悯 本科毕业于上海交通大学ACM班,2024年博士毕业于加州大学伯克利分校,导师是Ion Stoica和Joseph E. Gonzalez。郑怜悯的研究兴趣包括机器学习系统,大型语言模型,编译器和分布式系统。

    ● 郑怜悯,文生图团队成员

    除此之外,xAI中还有很多华人研究员,如:

    曾在微软、推特、脸书、字节等任职过,硕士毕业于上海交通大学的 Xiaobin Wu ,有着多年 Backend Engineering/Engineering Manager/Engineering Director(后端工程/工程经理/工程总监)开发和管理经验。

    ● Xiaobin Wu,xAI技术人员

    毕业于清华大学,曾在谷歌任职近8年的 Yunlong Liu 。 2017年于约翰霍普斯金大学博士毕业,攻读计算机生物物理学。在谷歌时主要负责Core ML complier(核心机器学习编译)/Runtine (OpenXLA/PjRt) Large-scale ML systerm(运行大规模机器学习系统)。现在在xAI负责大规模AI Infra和LLM Pretraining。

    ● Yunlong Liu

    毕业于台湾大学,曾在Linkedin任职近3年的 Pin-Lun (Byron) Hsu 。Byron目前在xAI负责full stack of ML system(ML系统全栈)工作。曾经领导过领英增长最快的开源项目“Liger-Kernel”项目的Kernel optimization(核心优化),并负责过领英SGLang项目的Inference Optimization(推理优化)。

    ● Pin-Lun (Byron) Hsu

    马斯克的xAI团队晚成快赶,18个月追逐OpenAI。在AI这个快速发展的领域,人才的流动与聚集将持续改变着行业格局。

    这种”后发制人”的赶超,很大程度上得益于团队的人才结构。一方面,经验丰富的决策者必不可少。正如xAI从谷歌、微软等头部公司吸纳了很多经验丰富的顶尖科学家,来带头领路。

    另一方面,xAI也吸引了像郑怜悯、Haotian Liu这样充满创造力的毕业生。正如最近爆火的DeepSeek创始人梁文峰在采访中所说,他们的团队中有相当一部分是刚毕业的学生。这些”新生力量”虽然工作经验有限,但往往能带来意想不到的创新突破。

    在这场人才迁徙中,顶尖科学家们追求的已不仅是优厚的薪酬待遇,更看重”共同的愿景”。能在热爱的领域充分施展才华,往往是企业对人才最具吸引力的因素。

    也折射出人才迁徙的一个深层规律:年轻的人重在找到热爱,而有经验沉淀的人重在忠于热爱。

  • 第一批DeepSeek开发者,已经开始逃离了

    第一批DeepSeek开发者,已经开始逃离了

    在DeepSeek服务繁忙的回复背后,不只是普通用户的焦急等待,当API接口响应突破临界阈值,DeepSeek开发者的世界,也出现了持续震荡的蝴蝶效应。

    1月30日,接入DeepSeek的base北京的AI开发者林森,突然收到程序后台报警,还没来得及为DeepSeek的出圈高兴几天,林森的程序便因为无法调用DeepSeek,后台被迫瘫痪了3天。

    一开始,林森以为这是因为在DeepSeek的账户余额不足导致的。直到2月3日春节假期过后返工,他终于接到了DeepSeek暂停API充值的通知。此时,尽管账户内余额充足,他也无法再调用DeepSeek了。

    林森接到后台通知的第三天,DeepSeek官方于2月6日正式对外发布公告,宣布暂停API服务充值。近半个月过去,截至2月19日,DeepSeek开放平台的API充值服务仍未恢复正常。

    图注:DeepSeek开发者平台仍未恢复充值 图源:字母榜截图

    在意识到后台瘫痪是由于DeepSeek服务器过载,而自己作为开发者,长达数天,却没有收到任何提前告知,更没有任何售后维护服务时,林森有种“被抛弃”的感觉。

    “就像家门口有一家小店,你是老顾客,办了卡,一直和老板相处很好。突然有一天,小店被评为米其林餐厅,老板把老顾客抛在一边,之前办的卡也不认了。”林森形容道。

    作为2023年7月开始部署DeepSeek的第一批开发者,林森为DeepSeek的出圈感到振奋,但如今,为了维持运转,他只能切换至ChatGPT,毕竟“ChatGPT虽然贵一点,但至少稳定。”

    当DeepSeek从口口相传的小店变成网红打卡的米其林餐厅,更多和林森一样调用无门的开发者们,纷纷开始逃离DeepSeek。

    2024年6月,小窗AI问答机在产品早期阶段就接入了DeepSeek V2,让小窗合伙人娄池颇为惊艳的是,那个时间点,DeepSeek是唯一能全文背诵《岳阳楼记》不会出错的大模型。因此,团队用DeepSeek承担了产品最核心的功能角色之一。

    但对于开发者而言,DeepSeek虽好,稳定性却始终有所欠缺。

    娄池告诉字母榜(ID:wujicaijing),春节期间,不仅是C端用户访问繁忙,开发者们也时常无法调用DeepSeek,团队决定选择几个已经接入DeepSeek的大模型平台同时调用。

    毕竟,“现在已经有几十个平台有满血版DeepSeek R1了。”用这些大模型平台的R1,配合Agent和Prompt,也能满足用户的需求。

    为了争抢DeepSeek外溢而出的开发者群体,有头部云厂商开始面向开发者频频举办活动,“参与活动就免费送算力,如果不大批量调用,小开发者几乎能免费使用。”易标AI技术总监杨惠超表示。

    不过,DeepSeek热度当前,在第一批开发者们出逃之际,更多开发者仍在蜂拥而至,希望蹭到前者的流量红利。

    郗鉴创业的项目,是通过调用DeepSeek的API来进行角色扮演的AI陪伴APP,2月2日上线首周就获得了约3000名的活跃用户。

    尽管有用户反馈DeepSeek的API调用时有报错,但已经有60%的用户希望郗鉴尽快推出安卓版。在郗鉴的社交媒体后台,每天都有至少几十个用户私信要下载链接,“搭建在DeepSeek上的AI陪伴平台”,无疑成了APP出圈的新标签。

    经字母榜统计,在DeepSeek官网内收录的接入DeepSeek的各类APP名单,2025年前APP名单仅有182行,如今已经扩展到了488行。

    一面是DeepSeek成为“国产之光”爆火出圈,7天涌入1亿用户,另一面,则是第一批部署在DeepSeek上的开发者,正因为过载人流导致的服务繁忙,而纷纷转投其他大模型。

    对开发者而言,长时间的服务异常不再是简单的故障,而演变成为代码世界和商业逻辑间的裂缝,他们被迫在迁移成本下进行生存演算,无论是涌入,还是逃出,开发者们都需要面对DeepSeek爆火带来的余震。

    A

    春节期间小程序后台被迫瘫痪三天后,至大年初六,为了保证程序正常运转的林森,离开已经部署一年多的DeepSeek,转回了ChatGPT。

    即使API调用价格高了近10倍,但此时保证服务的稳定,成了优先级更高的选项。

    值得注意的是,开发者离开DeepSeek转向其他大模型,并不如用户在APP内切换调用模型一般轻松。“不同的大语言模型,甚至是同一个语言模型的不同版本,对于提示词的反馈结果都有细微的差别。”即便林森仍在持续调用ChatGPT,将所有关键节点从DeepSeek迁移ChatGPT,并保证稳定且高质量的内容反馈,仍然花了他半天多的时间。

    切换这个动作本身也许只需要两秒钟,但“更多开发者,换一个新模型要花上一个星期反复调整提示词,并重复测试。”林森告诉字母榜,

    在林森这样的小开发者们看来,DeepSeek服务器不足可以理解,只是如果能提前通知,能避免许多损失,无论是时间成本,还是APP维护成本。

    毕竟,“登录DeepSeek开发者后台需要手机号注册,只需要一个短信,就可以提前告知开发者。”如今,这些损失将由曾在DeepSeek默默无名时就开始支持他们的开发者自己承担。

    当开发者和某个大模型平台深度耦合,稳定性无疑成了不必宣之于口的契约,一个频繁波动的服务接口,足以让开发者重新审视对平台的忠诚度。

    就在去年,林森在调用Mistral大模型(法国头部大模型公司)时,因为Mistral账单系统错误而重复付费,在他发出邮件后,Mistral不到1小时就纠正了问题,并附上了100欧元的代金券作为赔偿。这样的应对,也让林森产生了更多信任。如今,他也将一部分服务迁回到了Mistral。

    易标AI技术总监杨惠超则在DeepSeek V3 版本发布之后,就开始酝酿一场逃离。

    不用DeepSeek来写诗或者吐槽,如果用DeepSeek来写标书呢?负责公司内AI标书项目的杨惠超,在DeepSeek推出V3版本后已经着手寻找替代方案。对他来说,在标书这样的专业领域,“DeepSeek稳定性越来越不足。”

    DeepSeek R1版本火出圈的推理能力,并不吸引杨惠超。毕竟,“作为开发者,软件主要的推理能力是靠程序和算法,并不是太依靠模型的基础能力。底层即便用最老的GPT 3.5,依靠算法纠正都可以产出一个很好的结果,模型只要回复答案稳定就可以。”

    在实际调用过程中,DeepSeek在杨惠超眼中,似乎更像是一个聪明却会偷懒的“好学生”。

    升级V3版本后,杨惠超发现,DeepSeek对一些复杂问题有了更高的回答成功率,但稳定性却也攀升到了难以接受的程度,“现在问10条问题,至少有一条输出不稳定,在要求生成的内容之外,DeepSeek往往喜欢自由发挥,额外生成和问题无关的内容。”

    比如,标书内不允许出现错误字符,同时,大模型返回的结果,开发者们往往指定用Json 结构(用指令每次调用大模型使得稳定返回固定字段)去输出数据,便于后续函数调用,但出现错误或者不准确,都会导致后续调用失败。

    “DeepSeek R1,或许相对此前的V3版本,推理能力提升了很多,但是稳定性达不到商业化的水准。”在@生产力Mark账号内,杨惠超提到。

    图注:DeepSeek V3生成过程中出现乱码 图源:@生产力Mark账号

    作为2024年初,DeepSeek-coder时期就加入的第一批用户,杨惠超并不否认DeepSeek是一个好学生,只是如今,为了保证生成标书的质量和稳定性,杨惠超只能将目光转向国内其他更偏B端用户的大模型企业。

    毕竟,曾经被称为AI界拼多多的DeepSeek,正是凭借着性价比的标签,迅速聚集起一批中小AI开发者。但现在想直接稳定地调用DeepSeek,就必须进行本地部署。“部署一个 DeepSeek R1,需要 30万 ~ 40 万元的成本,如果用线上的 API计算,30万元我一辈子都用不完。”

    既不够便宜,又不够稳定,调用无门的杨惠超们,正在批量离开DeepSeek。

    B

    曾经,林森们是第一批坚定选择DeepSeek的人。

    2024年6月份,林森在开发自己的AI 小程序少年听世界时,曾经对比了当时国内外几十家大模型平台。他需要用大模型每天处理数千条新闻,并且筛选、排序,找出适合青少年听的科技、自然新闻,并且对新闻文字进行处理。

    这不仅要求大模型聪明,还得便宜。

    涉及到每天数千条的新闻处理,对token的消耗极大,对独立开发者的林森来说,ChatGPT模型很贵,只适合处理核心环节,对大量文本的快速筛选和分析,还要靠别的价格更低的大模型做支持。

    同时,无论是国外的Mistral、Gemini ,还是ChatGPT,调用都很繁琐:你需要在国外有一个具体的服务器,还要做中继站,同时需要用国外的信用卡购买token。

    林森便是通过英国朋友的信用卡,才能在ChatGPT账户完成充值。而一旦服务器在海外,API 响应速度也会有所延迟,这都让林森将目光投向国内,寻找一款ChatGPT平替。

    DeepSeek让林森颇为惊艳。“当时DeepSeek并不是最有名的,但却是反馈最稳定的。”以每10秒请求一次API调用为例,其他国内大模型100次内可能有30%的时候,不返回任何内容,但DeepSeek次次返回,并都能维持不逊色ChatGPT和BAT们大模型平台的回复质量。

    而相比起ChatGPT和BAT们的大模型API调用价格来说,DeepSeek真的太便宜了。

    林森将大量新闻阅读和初步分析的工作交给DeepSeek后,发现DeepSeek的调用成本10倍低于ChatGPT。经过指令优化后,每天调用DeepSeek的成本低到2-3元,“可能跟 ChatGPT相比,它不是最好的,但DeepSeek的价格是极低的,对于我的项目来讲,它的性价比非常高。”

    图注:林森用大模型收录新闻并分析(左) 最终呈现在少年听世界小程序(右) 图源: 林森提供

    性价比,成了开发者们选择DeepSeek的首要原因。2023年,杨惠超一开始将公司的AI项目从ChatGPT 切换到了Mistral,主要便是为了控制成本。随后2024 年 5月份DeepSeek推出V2版本,将API打到了2元每百万token,这无疑是对其他大模型厂商的降维打击,这也成了杨惠超将公司做AI标书工具的项目切换到DeepSeek的缘起。

    同时,经过测试后,杨惠超发现,国内早已靠云服务在B端吃下市场的BAT们,“平台太重了”。

    对于易标AI这样的初创公司来说,如果选择BAT,会面临云服务的捆绑消费。对于只是简单调用大模型服务的杨惠超来说,无疑DeepSeek的 API 调用更加省事。

    在迁移成本上,DeepSeek也胜了一筹。

    无论是林森还是杨惠超,初始的APP开发都是基于OpenAI 的接口形式,如果切换到BAT们的大模型平台,都要把底层重新开发一遍。但DeepSeek兼容 OpenAI like接口,切换大模型只需要修改平台地址,“1分钟无痛切换。”

    小窗AI问答机正式销售的第一天就搭载了DeepSeek,并将5个核心角色中语文和作文指导的角色交给了DeepSeek进行构建。

    作为合伙人,娄池也在去年6月就被DeepSeek惊艳到。“DeepSeek在中文理解上能力很棒,是那个时间点唯一全文背诵《岳阳楼记》不会出错的大模型。”娄池告诉字母榜,相比起其他大模型中规中矩、班味十足的文档式输出,用DeepSeek教孩子写作文,往往赢在了写作的想象力上。

    在社交媒体风靡用DeepSeek写诗、写科幻小说之前,DeepSeek的华丽文风,就让小窗AI团队眼前一亮。

    对于开发者们来说,他们仍在期待DeepSeek恢复调用,眼下无论是迁移到BAT们部署了满血版DeepSeek R1的平台,还是转向其他大模型厂商,都似乎是“菀菀类卿”。

    C

    但竞争对手正在努力追平DeepSeek深度推理的出圈特长。

    国内,近期百度、腾讯都陆续在自研大模型中加入深度思考能力;国外,OpenAI也在2月紧急上新“Deep Research”,把推理大模型的思考能力用于联网搜索,并将对Pro、Plus和Team用户开放。谷歌人工智能实验室(Google DeepMind)也在2月发布了Gemini 2.0模型系列,其中2.0 Flash Thinking实验版本则是一款增强推理能力的模型。

    值得关注的是,DeepSeek仍然以文本阅读为主,但不管是ChatGPT还是Gemini 2.0,在支持深度思考之余,都已经将推理能力引入多模态,支持视频、语音、文档、图片等多种输入模态。

    对DeepSeek来说,在追赶多模态之余,更大的挑战还来自竞争对手在价格上的逼近。

    在云平台部署侧,一众头部云厂商都选择接入DeepSeek,一边分食流量,一边靠云服务绑定客户。对DeepSeek大模型的调用,某种程度上甚至成了绑定企业云服务的“赠品”。

    百度创始人李彦宏近期提出,在大语言模型领域,“每12个月,推理成本就可以降低90%以上。”

    在推理成本下降的趋势下,BAT们的API调用价格持续走低已成必然,DeepSeek的性价比优势,正在迎来大厂新一轮价格战的压力。

    不过,大模型API价格战只是起步,面向开发者,大模型厂商们还拼起了服务。

    林森接触过大大小小众多的大模型平台,让他印象深刻的是,某科技大厂会有专门的客户经理进行对接,无论是不稳定还是出现技术问题,都会主动和开发者联系。

    而尽管作为一个开源的大模型平台,目标是为开发者提供更普惠的AI支持,DeepSeek甚至在官网没有面向开发者出具发票的入口。

    “每次API充值完,不像其他大模型平台一样可以直接在后台开发票,DeepSeek需要绕到官网外,添加客服企业微信开具发票。”杨惠超告诉字母榜,无论是价格还是服务,DeepSeek“性价比”的标签,似乎都有点立不稳了。

    某头部大厂AI产品经理告诉字母榜,有的互联网公司leader坚持用DeepSeek替换原有大模型,完全不管替换模型重新调整Prompt所耗费的时间。同时,即便满血版的DeepSeek R1,也有不少通用能力如‌Function calling等并不支持。

    相比起用云服务跑通了B端服务场景的BAT们,在便捷度上,DeepSeek仍然差着AI大厂一截。

    只是DeepSeek的流量效应暂未褪去,赶潮人依然众多。

    有部分公司宣称接入DeepSeek,只是开始调用API,充值了几百块。有的公司公告部署了DeepSeek模型,但其实只是让员工看了看B站教程,下载了一键安装包。在这波DeepSeek热潮里,泥沙俱下,鱼龙混杂。

    潮水终将褪去,但DeepSeek要做的功课显然更多了

  • 只花30分钟,我真用DeepSeek磕出了一款游戏,能去大厂了吗?

    只花30分钟,我真用DeepSeek磕出了一款游戏,能去大厂了吗?

    “让人始料未及的是,哪怕游戏业早已将AIGC奉为圭臬,但变革当头,我们仍会懊悔过去对AI的想象竟如此贫瘠。”

    把时间拉回到数天前,或许是受到国产AI大模型DeepSeek触动,心动CEO Dash    (黄一孟)在X上分享了现阶段对AI应用场景的一些看法。

    他提到:“理论上从现在开始,    公司里不应该有任何人的工作与AI无关。无论工作内容是否由AI产出,至少工作结果要由AI检查一轮。”在笔者印象中,这似乎是自蔡浩宇、冯骥之后,又一位行业大佬公开表示对AI的强烈看好。

    需要注意的是,这段时间众多游戏人下场力挺DeepSeek,只是当代AIGC大流行的一处缩影。在过去一个月时间里,被冯骥评为国运级科技的DeepSeek,正不断冲刷游戏人对AI技术的固有认知。

    例如在最为活跃的民间应用层面。明明该技术出圈还没过多久,    但诸如“小白两天从0到1做出3D射击游戏”、“DeepSeek+AI全家桶研发游戏”、“0基础靠嘴皮子做游戏”、“DeepSeek+Unity3分钟生成完整游戏代码”等由玩家主导的教程视频,却如同雨后春笋般冒出。

    而其中让我感触颇深的是,相关视频的评论区正构成一幅戏剧性拉满的“绝景”:

    一边是游戏爱好者兴奋地摩拳擦掌,另一边却是打工人苦涩的自我解嘲。在35岁笑话的无可奈何中,去年蔡浩宇曾提到的“99%的普通游戏从业者不妨转行”暴论,似乎正一步步映入现实。

    毫无疑问,不断进化的AIGC技术,已经为整个游戏行业蒙上一层患得患失的雾霾。但身处风云骤变的大盘环境之中,更加注重当下的基层游戏人,脑海中萦绕的无非还是那个老套的话题——

    在DeepSeek火爆全网后,“机器吃人”的故事,距离我们还有多远?

    真变天了?AI游戏成本骤降90%

    近期关注DeepSeep的朋友可能会发现,在业界大肆吹捧DeepSeep有多牛逼之余,大众的注意力还会似有似无地往另一个话题偏移——    过去两年里,AI迭代的速度到底有多快?

    一个案例可以说明这点。在B站斩获超120万播放的《我让DeepSeek做射击游戏!他杀疯了!我沉迷了…》视频中,这位博主曾提到一个有关AI迭代速度的有趣观察。

    他发现,半年前的大模型死活只愿意用Pygame这种简单的框架去推进游戏研发。但半年之后,AI已经将Unity列入首选项。而AI所能实现的效果,也从最初的4399简陋版小游戏,跨越至如今更为复杂的3D大作。

    视频最后他也强调,“我相信如果再给AI一点时间,以后我们每个人想玩什么游戏,你说句话就能生成出来了。”虽然如今的AI技术要想达到“三生万物”的境界还比较遥远,但这位博主的发言也揭示了AI目前最令人胆寒的特性——它的迭代速度已经来到一个夸张的地步。

    就拿眼下已经成为2月主线的DeepSeek来说。    要论这些年AI最为显著的技术进步,那么”使用成本”与”内容精度”,无疑是最具说服力的两大板块。

    首先在困扰无数厂商的成本方面。在DeepSeek之前,市面上传统大语言模型的使用成本其实并不便宜。

    以去年行业颇为出圈的《1001夜》为例。作为一款对话式AI驱动的产品,玩家每次通关流程不长的《1001夜》,开发者都要为此付出1元的AI使用成本。面对每位玩家动辄4到5次的通关次数,迫于成本压力,团队只能暂时给游戏设置一个每天可游玩的额度上限。

    (当时《1001夜》只是一个流程不长的Demo版本,成本压力就已经如此之大……)

    在大语言模型已然成为创作领域必备工具的当下,《1001夜》所面临的成本挑战,也同样是AI深度游戏化进程中亟待突破的瓶颈。然而这一局面在2023年5月迎来转机——随着DeepSeek等新一代推理模型的问世,这项技术为长期困扰内容创作者的开发成本难题提供了全新解法。

    简单来说,去年DeepSeek就通过独创的MLA架构和MoE稀疏结构,让训练显存占用降至传统模型的5%-13%,最终实现推理成本低至每百万Token仅1元人民币。放在当时,这个价格仅是Llama3的七分之一,GPT-4 Turbo的七十分之一。

    恰巧,Open AI创始人Altman前不久刚露过一次面。据Altman提到,GPT-4在2023年初的使用成本,相比GPT-4o在2024年中期,其每个token的价格已经下降约150倍。这无疑是一组相当夸张的数据。

    考虑到圈外人对这些弯弯绕绕不太敏感,一位熟悉AI行业的华南游戏人告诉我:    “最初AI还比不上人工时,要想生成10万字可用的剧情脚本,成本足够养活两个文案策划。但现在同量级任务交给DeepSeek,只够买杯奶茶。”

    从某种程度上看,眼下不断降低的AI使用成本,已经揭示了游戏行业未来即将由AI主导。毕竟仅仅只是过了2年时间,AI技术的成本曲线就能以十倍乃至百倍的斜率不断下探,甚至还能用“奶茶”为单位去丈量个别职能岗位。可想而知,在强调“降本增效”的游戏行业面前,    没有任何一家公司能够抵挡“性价比”本身所带来的极致诱惑。

    例如前不久3D AI乙游《如意情探》的Jaz就在游戏茶馆的采访中透露:“DeepSeek现在的调用成本大概是我们之前使用模型成本的1/20。按照以前的商业模式,只有中氪和高氪玩家才能获得的最佳体验,但现在低氪或零氪也有机会享受得到。”

    面对这种烈度的技术迁移,2025年的游戏开发者恐怕早已站在历史性的拐点之上——无论行业是向上还是向下,这堵名为AI的钢铁巨幕,将始终屹立在道路两旁。

    (图源:阿里巴巴AI大模型通义千问)

    游戏大厂全都坐不住了

    如果说越来越低的使用成本,只是帮助AI通往游戏行业腹地的入场券,那么上文提到的AI第二项跨越式进步——“内容精度”,就是DeepSeek撬动游戏行业的关键杠杆。

    在过去,无论是首先引发AI热潮的ChatGPT,还是后来广泛应用于游戏研发的AI美术工具,其痛点一直都绕不开“答非所问”、“直出不能用”,“需要大量时间精调”这几组关键词。

    归根结底,这些缺陷所折射出来的核心问题,实际上直指AI没有共情能力、AI无法理解创作这几项致命短板。    但时过境迁,在DeepSeek身上,我发现“AI破解创作”这件事情并非毫无可能。

    例如在一篇来自github的《LLM    (大型语言模型)创意故事写作基准》报告中,DeepSeek R1成功挤掉了霸榜长达7月的Claude,晋升LLM创意故事写作榜第一。

    在此次创意故事写作测试中,测试规则不仅对AI笔下的故事流畅度提出挑战,同时它还要求AI强制嵌入十项核心叙事要素    (包括角色设定、背景构建、动作动机等)以验证AI的创作性能。而DeepSeek正是凭借出色的创意和规则贴合度,在共计500次创意故事写作中斩获270次第一    (54%),一举领先Claude、Gemini等大语言模型。

    在DeepSeek登顶背后,DeepSeek也让游戏从业者看到AI在内容精度和创作趣味性上的巨大潜力。

    不过其中最让行业感到兴奋的,无疑是Deepseek在测试中所展现的惊人“共情能力”和“互动性”——这正是包括米哈游、腾讯、网易等头部大厂目前迫切需要的。

    (图源:B站UP主途淄)

    早在数年前,头部游戏大厂就早早围绕“AI互动能力”展开极其深度的布局以及研究。例如在2023年前后,一家名为MiniMax的初创公司,就引得米哈游、腾讯在内的游戏巨头争相投资。

    据了解,Minimax是由前商汤科技副总裁、通用智能技术负责人闫俊杰成立的人工智能公司,目前旗下的主力产品是提供AI聊天服务的社交软件Glow,估值已超12亿美元。

    在这款产品中,用户可以选择创造属于自己的“智能体”,通过设定基础的性格、背景故事等人物特征,培养一位擅长聊天对话的智能AI,进而让用户体验跟虚拟人物聊天的乐趣。

    而MiniMax引动一众大厂跟投的原因也不难理解——与DeepSeek类似,Glow所拥有的AI智能技术能够给玩家带来身临其境的互动体验。这项技术的关键之处在于,它不同于传统AI的预设性对答,而是凭借模型本身自带的“即兴创作”属性,去主动模糊AI与真人玩家的互动边界。

    单凭这一点,有着较高共情能力的AI技术,就无疑能让强调情绪价值和社交属性的二次元、乙女、MMO等品类如焕新生。    因此,布局“强互动型AI”早已成为行业共识。

    以米哈游为例,早在2023年4月,《崩坏:星穹铁道》的制作人大卫就曾透露内部在NPC行为和台词中尝试投入过AI技术,让一直以来较为模式化行动的NPC显得更加自然。

    而同一时间,在与《女神异闻录》制作人的对谈中大卫也曾提到,希望AIGC技术能够将“不会重复回答台词的NPC”变成可能,从而给玩家提供更多新奇的游戏体验。

    既然包括米哈游、腾讯在内的顶尖大厂都被强互动AI迷得神魂颠倒,那么中腰部的游戏企业自然更不用说。

    举几个近期的例子,去年游族就在少年系列游戏中实装了面向玩家的首款AI产品——AI玩伴小游酱。据了解,小游酱不仅能够为玩家提供客服答疑和游戏攻略,还能在陪玩与倾听中,提供丰富的情绪价值。

    而就在几天前,游族也正式宣布小游酱将接入满血版的DeepSeek,计划在情人节当天与旗下的二次元手游《绯红回响》一起,为玩家带来别样的惊喜。

    与之相似的案例,还有来自幻境游戏CEO张筱帆再创业的“自然选择”公司。

    在去年10月12日,与幻境游戏(旗下《奇点时代》)互为兄弟的自然选择官方,在B站发布了AI伴侣《EVE》的首支预告PV,并在两天内收获了超过110万播放量。

    当然,有关AI伴侣的实际应用仅是这项技术最直接的落地方式。我们不妨试想,当高共情、强互动的AI能够感知玩家动机,即兴创建故事脉络时,游戏世界便从预设的剧本牢笼中挣脱,进而成为能够动态生长的内容生命体。

    (网易《逆水寒手游》也同步接入包括DeepSeek在内的诸多国产大模型)

    这种由强互动性催生的“叙事涌现”,或将颠覆延续数十年的关卡设计逻辑,让一款强调情绪价值的游戏具备前所未有的长青价值。我想,这或许才是DeepSeek眼下最值得游戏行业参考学习的能力之一。

    对打工人而言,是福?是祸?

    聊完DeepSeek所代表的AI技术两大变迁,我们也是时候回归最初的疑问——在DeepSeek火爆全网后,“机器吃人”的故事,距离我们还有多远?

    相信不少从业者也会和我一样深有同感——    每当AIGC取得突破,“又要裁员了吗?”,这个幽灵般的质问总会在行业群聊中复活。但现实可能要比想象复杂得多。

    对比贯穿2023年到2024年的AIGC恐慌,本质是市场下行所引起的“降本增效”,恰好跟AIGC爆发的“技术奇点”整上了一轮火星撞地球。

    但当时间进入2025年,情况正在发生变化:版号常态化发放、小游戏赛道爆发、头部爆款频出……行业进入复苏期后,“优化”不再是唯一命题。    更别提,DeepSeek代表的“生成即服务”模式,正在为游戏行业的工作模式带来全新的变化。

    过去我们常说,AI技术的加入只是让“流水线工人”变成“创意决策者”。一位从外包原画师转型AI美术的从业者,就向我描述了他亲身经历的行业变迁:

    “过去我每天画12小时铠甲花纹,现在80%的重复劳动交给AI,剩下时间全用在和策划吵‘这套衣服该用凤翅兜鍪还是交脚幞头?’。”他告诉我,在AI介入他的生活之后,日常工作反而变成了真正的创作。

    这种趋势在文案领域可能同样显著。一位总是活跃在各大群聊的MMO文案表示,前段时间他试水了DeepSeek的内容生成功能,它可以将耗时数月的“全门派技能描述”压缩到一周完成,而自己得以转而投入核心主线剧情的情绪张力打磨。“AI就像给每个人配了实习生团队,关键看你怎么用。”

    杀死“牛马”的,从来不是工具。回看游戏史,每一次技术革命都会引发“机器吃人”的恐慌,但最终被淘汰的从来不是人类,而是固守旧范式的工作方式。

    当DeepSeek们扛起“脏活累活”,从业者反而有机会回归创意本源——就像印刷术没有消灭作家,Photoshop没有杀死画家,真正的创作者永远能找到与新工具和平共处的方式。

    或许某天,当AI能独立开发出《原神》级产品时,游戏圈需要新的生存法则。但至少在今天,Deepseek更像是行业集体跃升的弹簧板。

    我们现在需要做的,只是踩准它的力量,而不是恐惧它的阴影。

  • 1个顶5个!机器人开始抢饮品打工人的活儿了

    1个顶5个!机器人开始抢饮品打工人的活儿了

    还记得在春晚扭秧歌的机器人吗?它们在全国甚至全世界观众面前大出风头。

    但你可能不知道,机器人早已入侵饮品业,干起茶饮店员和咖啡师的活儿,甚至“一个机器人就能开一家店”。

    AI时代,机器人要取代饮品打工人了?

    做冰淇淋、做咖啡

    机器人正在抢饮品店员的活

    今年春晚捧红了“机器人”。    迈着小碎步,灵活地转手绢,跟着音乐扭秧歌,引发全民热议。

    最近,春晚“顶流”机器人火到饮品行业,    “机器人做冰淇淋/奶茶/咖啡”等视频正在网络走红。

    在一条“机器人做冰淇淋”的热门视频中,一个机器人手臂捏着蛋筒,准确地放在冰淇淋机下,有节奏地小幅度扭动几下,一个形状完美的冰淇淋便做好了,并“贴心”地递到顾客面前。

    春晚机器人和网友分享的“机器人做冰淇淋”

    该视频收获9000多点赞,网友表示“它扭得那几下,我一辈子都学不会”,甚至连海底捞国际版账号也留言发问“可以来捞面吗?”

    事实上,机器人“入侵”饮品行业已经有一段时间了 ,与上春晚的人形机器人不同,它们大多是“自动化饮品设备+机械臂”的形态,代替店员制作饮品:

    • 库迪旗下茶饮品牌茶猫开业时,一度将“机器人做奶茶”作为宣传卖点;
    • 去年,北京地铁19号线就出现许多机器人奶茶亭;
    • 哈工大食堂、西安、南昌等地的博物馆和科技馆,都有机器人做咖啡;
    • 深圳、合肥、北京等地的独立咖啡馆,引入机器人拉花、做手冲咖啡
    • ……

    机器人的应用热潮更是催生出许多主打“智能化”的饮品品牌,比如freshcube鲜饮站、HOOLOO呼噜咖啡、茉茶理等。

    HOOLOO呼噜咖啡

    当机器人开始做饮品,会对从业者带来什么影响?

    一个机器人  ,就能开一家店?

    饮品机器人有多智能?目前行业应用到什么程度了?

    我联系睿尔曼智能科技有限公司进行了解,这是一家专注于超轻量仿人机械臂研发生产的高新技术企业,在打造智能通用机器人方面经验丰富。

    其新餐饮事业部销售总监张悫告诉我,目前国内用于服务饮品行业的机器人技术较为成熟,产品形态主要有两种:

    一种是“开放式”,将机械臂设计与饮品店吧台融为一体;另一种“封闭式”,即“机器人饮品亭/站”,实现“一个机器人就能开一家店”。

    后者相对主流。以机器人咖啡站为例,通过集成方式联结一台全自动咖啡机、1或2条机械臂、落杯器、制冰机、粉料机、水箱、奶箱等模块,    占地三四平米左右,从点单到出餐全流程智能化。

    楷这样一家店,相当于代替一家传统饮品店四到五人的配置。

    一般来说,系统会提供十几种咖啡选项。顾客在点餐屏下单后,落杯器自动脱落一个纸杯,机械臂将其拿到全自动咖啡机下,按照设定程序萃取咖啡液,加牛奶等物料。

    做好之后,盖盖将咖啡放到指定位置,通过窗口“推送”到顾客面前,机器人还会发出“饮品已做好,请取餐”的语音提示。

    一杯出品时间在1分半以内,如果是美式或操作更简单的饮品,用时更少。

    机器的电子屏动态展示品牌宣传内容、咖啡豆产地信息以及当前制作状态等。不少顾客表示,    制作过程有一定视觉吸引力    ,等待期间不无聊。

    机器人还具备    智能统筹能力    ,遇到连续出杯的情况,会一边接牛奶,一边准备下一杯的咖啡液或冰块,提高效率。

    有的机器人    还有“打标签”功能    ,可为饮品贴标签,应对多杯和线上点单场景。

    咖啡店的一些常见问题,机器人也能“从容”应对。比如某杯制作时出现瑕疵,    机器人会自动倒进垃圾桶,重做一杯。

    如果设备故障导致机器人无法正常工作,工程师可以远程操作修复,顾客也可以拨打电话联系退款。

    机器人能做得越多,人要做得越少。

    “只需营业前添加物料、开机,营业结束后清洗、关机即可。”张悫说。

    经营者可在后台实时监控,比如做了多少杯、是否有异常、物料是否充足等,不在店也能“管好生意”。

    与常规门店相比,机器人咖啡亭对选址要求不高,保持通电即可正常运行。一次装满物料,可出100~150杯。

    由于“开店”相对灵活,一定程度上可以解决淡旺季的问题。

    “平时可以放在学校,假期挪到商场、景区等客流量高的地方。”    张悫说,尤其是景区、博物馆等地的顾客对效率要求不那么高,而且机器人做咖啡自带噱头和打卡属性,往往很受欢迎。

    我还了解到,许多城市已经为包括机器人饮品站在内的全自动设备现制现售饮品企业,办理了食品经营许可证。 “北京、深圳等一线城市普及度较高。”

    机器人会取代饮品店打工人吗?

    近年来,各大连锁门店相继用上了全自动泡茶机、奶茶机,明显感觉到,饮品行业的智能化进程加速。

    从操作上来说,机器人已经替代部分人力。甚至相比开一家传统奶茶店需要五名员工,一个机器人就能开一家店,那么未来饮品店员会被取代吗?

    多位业内人士持保留意见。

    店员正在使用佳泽泡茶机制茶

    首先,成本是最关键的因素。

    我了解到,机器人机械臂每条至少两三万,为了保证饮品的多样性和稳定性,往往需配套价格不菲的进口咖啡机,整体“开店”价格在15~35万之间。

    “造价高,长期的维修成本也要考虑,整体拉高了使用门槛”,成都Auncel Coffee称咖啡的主理人蔡元凯说。

    其次,现制饮品的丰富程度和更新频率,让机器人“有心无力”。

    “机器人生产商的技术创新往往集中于硬件和软件,产品研发属食品专业人员的工作范畴。”张悫说,“未来或催生一批专门负责机器人食品研发的工程师,但目前还未形成气候。”

    哪怕是机器人最擅长的流程化操作,实际落地过程中也面临诸多挑战。

    “流水线”咖啡

    “做一杯饮品看起来简单,其实流程非常繁杂,比如奶茶仅备料这件事机器人就操作不了。如果无法完全脱离人工,就没有太大的意义。”蔡元凯说。

    “ 由于没有后厨,出品多,补料会很麻烦;出品少,投入和回报不成正比。”某设备供应商说。

    最后,消费者是否愿意持续为机器人饮品买单,目前存疑。

    消费者可能会为了噱头尝鲜,但长期看来,“一杯机器做的饮品,如果价格不占优势,相比即饮咖啡或者动辄9块9的现制咖啡,仍缺乏一定竞争力。”蔡元凯说。

    他还提到,现制饮品的顾客喜好千人千面,至少目前的机器人无法精准满足客制化需求。

    最根本的是,消费者对于一杯饮品的需求,也绝不仅仅是饮品而已,与店员的互动、手作的价值感等都是不可或缺的消费体验。

    基于这些,包括张悫在内的多位业内外人士认为,机器人的最佳角色是“人机协作”提高效率 ,比如代替店员处理水果,协助咖啡师手冲、出杯,而非取代人力。

    尽管机器人在短期内很难代替打工人,但其所代表的“智能化”趋势依然值得关注。

    蔡元凯说:“行业对于智能化设备有持续需求,供人使用的高效、简单的新型高科技设备是长期发展方向。”

    结语

    人类面对新质生产力时,总会无法抑制地对自身存在产生忧虑。

    但就像DeepSeek所说,AI不会取代人类,就像望远镜不会取代天文学家。

    AI时代到来,给饮品人带来的真正危机是,如何在效率和服务之间做好平衡,让每一杯饮品在流水线的速度中,依然流淌着手作的温度。

  • Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

    Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

    AI搜索“老大哥”Perplexity,刚刚也推出了自家的Deep Research——

    随便给个话题,就能生成有深度的研究报告。

    先来划个重点:免费向所有人开放!

    具体来说,非订阅用户每天最多可查询5次,Pro用户每天可查询500次。

    然后啊,效果是酱紫的。

    例如给出一个问题:

    What should I know before the market opens?开市前我该知道些什么?

    在Deep Research加持下的Perplexity先是会查找海量的资料

    接下来是推理过程,用Perplexity的话来说就是专家级别的分析

    对原始材料进行充分评估之后,Perplexity就会将所有研究综合成一份清晰而全面的报告

    最后,你还可以把Perplexity写好的专业报告一键导出,格式包括PDF、Markdown和Perplexity Page:

    性能方面,Perplexity官方也给出了他们的测试结果。

    他们采用的基准,是最近考验AI推理能力大火的Humanity’s Last Exam(人类的最后考试),准确率达到了20.5%

    (注:“人类的最后考试”涵盖100多个科目、包含3000多个问题,涉及数学、科学、历史和文学等领域。)

    从成绩上来看,是优于Gemini Thinking、o3-mini、o1、DeepSeek-R1和其他许多主流模型。

    在另一项SimpleQA(一个包含数千个测试事实性的问题库)的测试中,Perplexity Deep Research的表现更是明显远超领先模型,达到了93.9%的准确率。

    更重要的一点是,Perplexity的Deep Research有够快——平均在3分钟内可以完成大多数研究任务。

    对此,Perplexity的CEO(Aravind Srinivas)公开致谢DeepSeek

    这是因为DeepSeek是开源的,又便宜又快。

    其实在10天前的一条推文中,Aravind Srinivas其实已经有所剧透:

    在推文下方的评论中,我们也看到了不少关于DeepSeek的身影:

    不得不说,DeepSeek的含金量还在上升

    实测Perplexity的Deep Research

    Perplexity新功能的操作方式也是极其简单。

    只需在搜索框下方的选项中pick一下Deep Research即可:

    从官方展示的案例来看,Deep Research擅长在金融、市场营销和技术等领域的深度研究,并且在健康、产品研究和旅行计划等领域作为个人顾问同样有用。

    例如在默认搜索和Deep Research下,同时问:

    What’s the best strategy for advertising at the Super Bowl? Analyze the ROI of each major advertiser at the 2025 Super Bowl. Which brands were the biggest winners and losers? What ad techniques were most and least effective? If I wanted to advertise at the 2026 Super Bowl, what should I do to maximize success?在超级碗(Super Bowl)投放广告的最佳策略是什么?分析2025年超级碗上每个主要广告商的投资回报率(ROI)。哪些品牌是最大的赢家和输家?哪些广告技巧最有效和最无效?如果我想在2026年超级碗上投放广告,我该怎么做才能最大限度地取得成功?

    可以看到,Deep Research给出的答案更像是一个专业的报告

    先是以类似论文“摘要”的形式,把问题的核心亮点全部提炼、总结出来,然后再撰写并展开包括Introduction在内的更多内容。

    同样的,让Deep Research完成撰写“黄仁勋传记”,从输出内容和格式来看,是更加清晰且一目了然:

    现在,也有很多网友开始在网上po出自己实测的效果。

    例如让Perplexity做下面这个任务:

    compile a research report on how has retail industry changed in the last 3 years.编写一份关于过去3年零售业变化的研究报告。

    然后这位网友还总结了一下Deep Research和普通AI搜索功能的区别:

    普通搜索为简单的查询提供快速的、表面的信息。它适用于查找基本事实或获得简短的摘要。另一方面,Deep Research是为需要深入分析的复杂、多层次的查询而设计的。

    正常的搜索通常会在几秒钟内产生结果。Deep Research是一个更耗时的过程,需要5到30分钟才能完成。

    但,好多“Deep Research”啊

    除了效果之外,对于Perplexity发布的Deep Research,网友们还有另外一个热议的焦点——名字

    例如有网友就直接提出了自己的困惑:

    Deep Research是你们能想到的唯一的名字了吗?

    其实这也不怪网友们提出这样的质疑。

    因为……现在有太多叫Deep Research的产品了……

    2024年12月,谷歌发布Deep Research

    2025年2月,OpenAI发布Deep Research

    2025年2月,Perplexity发布Deep Research

    AI的问题,我们就让AI来回答。

    Perplexity在回答中总结出了一个表格:

    CEO对此也给出了自己的答案,一言蔽之,就是“快好省”,不过他顺便还阴阳了一波OpenAI:

    我们每月不用200美元。

    最后,CEO还预告了一则消息,下周Perplexity还有一个很cool的东西要发布。