标签: DeepSeek

  • DeepSeek:人工智能领域的沃尔玛

    DeepSeek:人工智能领域的沃尔玛

    • DeepSeek 已经可以与 OpenAI 的 ChatGPT 相匹敌了,而且成本只是 OpenAI 的一小部分。
    • 这改变了游戏规则,让规模较小的参与者也有机会在AI的舞台上亮相。
    • 这对市场产生了巨大的影响,并彻底重塑了 AI 市场。

    图片来源:Alex Shuper Unsplash

    DeepSeek是中国公司推出的一款新的开源人工智能模型,它正在以一种引人注目的方式改变着游戏规则。我会用通俗的语言解释一下当下正在发生的事情,以及纳斯达克指数暴跌的原因。

    DeepSeek表示,他们的人工智能与OpenAI的ChatGPT一样好,甚至可能更好。关键是,他们只花了一小部分成本。当其他公司花费 1 亿美元或更多来构建 AI 模型或“大脑”时,DeepSeek 仅以 600 万美元就完成了这项工作。这个消息导致所有大型 AI 股票暴跌。英伟达的市值损失了大约 6000 亿美元。

    最疯狂的是,美国的科技封锁旨在减缓中国的发展速度,但这种做法似乎起到了相反的作用。由于缺乏高级芯片,DeepSeek找到了更聪明的方法,用他们能买到的更便宜、更慢的芯片来工作,并扭转了局面。这不仅仅是DeepSeek的胜利,也是在压力下进行创新的胜利。

    1. 便宜的人工智能

    技术方面,DeepSeek没有使用英伟达的尖端H100芯片,而是用略微受限的H800芯片来训练人工智能。这些芯片不如 H100 那么快,但 DeepSeek最终找到了方法来获得令人难以置信的结果。他们已经证明,你并不总是需要最新最好的硬件来构建顶级人工智能。例如,在棒球比赛中,裁判要求你用一只手击球,你不抱怨,也不发牢骚,而且你做得很好。

    这改变了小型参与者的游戏规则。这意味着以前负担不起人工智能的国家、公司甚至创造者现在都有机会了。例如,泰国电影业可以使用这样的工具为东南亚市场制作尖端的特效,或为东南亚市场实现故事的自动化,所有这些都不需要花费巨额资金。成为领导者对更多人来说变得更加负担得起了。

    2. 人工智能领域的沃尔玛

    这里有一些更深层次的问题需要考虑。DeepSeek可能会成为人工智能领域的沃尔玛(Walmart),将低成本普惠带给一个由高价选项主导的行业。OpenAI每百万字收费60美元,而DeepSeek只需55美分,比OpenAI低95%。

    ChatGPT Plus的费用是每月20美元,在美国,这是一个非常合理的费用,一般美国人不会抱怨价格高,除非他们考虑ChatGPT Pro,用户可以无限制地使用OpenAI的模型和工具,每月200美元。然而,撒哈拉以南非洲地区的人均年收入约为750美元,20美元相当于一个月工资的三分之一。在美国,这就像每月支付1800美元来访问ChatGPT。DeepSeek能提供高质量的人工智能,每月费用约为1美元。对于非洲的大学生来说,这仍然是相当昂贵的,但DeepSeek开源了他们的模型,让非洲的开发人员可以利用它,并想办法让它以更低的成本运作。

    就像沃尔玛改变零售业一样,这可能会彻底重塑人工智能市场。依赖高额费用和大量订阅的美国公司可能会感受到压力。如果DeepSeek坚持这一策略,他们将迫使其他公司重新思考人工智能的定价和销售方式。这是一件好事,当价格大幅下降时,使用量就会增加。更多用户参与其中,新的市场就出现了。计算和互联网的成本也在不断下降,天从来没有塌下来。

    3. 人工智能的新时代

    DeepSeek证明了人工智能游戏不仅仅是关于谁花的钱最多,而是关于谁更聪明,并相信不可能的事情是可能的。这一突破意味着人工智能将比以往任何时候都更容易获得,为创造者、小企业,甚至想要建立自己技术的国家打开大门。这对美国来说是一个警醒,不要再依赖其主导地位来主导市场,是时候接受美国例外论了。

    老实说,这真是一场好戏,看着这些曲折的剧情展开,感觉就像一场终极真人秀。国家和公司相互竞争,试图比对方更聪明,这种事情甚至比泰勒·谢里丹(Taylor Sheridan)最疯狂的剧本都要好。这就像一部电影,一个来自穷苦家庭的孩子克服了所有困难,击败了富家子弟,击败了癌症,击败了一切,成为有史以来最伟大的球员。你怎么能不为他欢呼呢?

    人类,一如既往地混乱和聪明,总是会给人惊喜。这不正是整个故事最精彩的部分吗?

    来源:互联网

  • DeepSeek加速AI智能体落地

    DeepSeek加速AI智能体落地

    从大模型到AI Agent(智能体),是AI真正走向落地应用的关键一步。相比大模型,智能体更像是拥有自主决策和执行能力的“AI助手”,能主动分析、规划,并根据不同场景提供更精准、实时的服务。

    市场咨询机构Gartner将AI Agent列为2025年十大战略技术趋势之首。业界认为,2025年有望成为AI Agent的商业化应用元年。

    DeepSeek的横空出世大大加速AI Agent的落地速度,不到一个月,一场深刻的科技变革悄然展开。

    大模型“入行”难

    尽管舆论对智能体的成熟速度呈现出越来越乐观的态度,但业内人士仍普遍认为,智能体应用发展仍处于早期阶段,即业务场景探索和技术验证阶段。

    泛微副总裁杨国生在接受《IT时报》记者采访时表示,当大模型应用到企业的垂直产品领域时,精准度显得尤为关键,“很多业务场景并不是简单的问答模式,而是需要更复杂的业务逻辑和场景化需求。这需要大量的工程技术介入,才能确保其真正实现企业级应用的效果。”

    杨国生说,ChatGPT等通用大模型虽然在基础知识应用、数学运算和代码生成等方面展现了强大的推理能力,但当这些模型应用于垂直领域时,其稳定性却难以令人满意,“当推理某个结果时,今天的表现可能令人满意,但明天就会出现波动,甚至效果下降。这是大模型通用性与垂直精度之间的矛盾所带来的挑战,且常常伴随‘幻觉’等问题”。

    此外,算力资源的限制也是当前智能体应用的一大瓶颈。在企业级应用中,由于大模型需要处理海量的参数,企业直接部署这样的模型面临巨大的算力成本压力。尤其在当前的经济环境下,许多企业无法投入大量预算购买专用的算力卡,这成为制约企业级大模型应用的基础性障碍。

    因此,出于成本、精度等多方面的考虑,相较于针对个人用户的AI助手,初创企业更愿意针对垂直领域开发有针对性的行业应用垂类模型。

    DeepSeek正是行业“及时雨”

    短短一个春节,DeepSeek不仅大幅降低AI大模型部署的技术门槛与成本,还加速了AI的商业化进程,推动应用场景的大规模崛起,甚至大大提升AI的普及速度。AI产业的经济价值,正在从“卖水人”转向应用端。

    越来越多的企业开始接入DeepSeek,更多垂直领域人工智能公司尝试或升级自己的AI Agent。

    作为一家专注于能源大模型的企业,达卯智能近期接入DeepSeek,并推出最新产品——能源小达DeepSeek-R1671B。达卯智能CTO刘净在接受《IT时报》采访时表示,DeepSeek的推理能力是其最为突出的亮点之一。

    刘净表示:“相比传统的大模型,DeepSeek在推理能力上实现了质的飞跃,甚至在用户体验上,它可能优于OpenAI的o1模型,甚至o3模型。”

    对于像达卯智能这样的垂类能源应用企业而言,DeepSeek的推理能力填补了此前的空白。刘净进一步解释:“我们公司并不开发基座大模型,之前我们一直依赖国产自主可控的开源大模型,但为了更好地满足客户需求,我们迫切需要具备强大推理能力的模型,因此选择了DeepSeek的V3版本,并迅速接入。”

    在实际使用中,刘净表示,DeepSeek提供了全链条的推理过程,真正实现从数据输入到最终用户反馈的完整闭环,“DeepSeek不仅展示了推理过程,还能将整个推理流程呈现给最终用户,极大提升了用户体验。通过结合我们的行业知识库和DeepSeek的强大推理能力,用户可以得到一个全面的解决方案,这种全新的体验之前是无法实现的。”

    例如,在电费账单分析和电费解析方面,DeepSeek的推理深度相比之前的产品有了质的飞跃。

    从“生成”到“做事”

    同样近期接入DeepSeek的达观数据CEO陈运文告诉《IT时报》记者,DeepSeek改变了AI Agent的发展路径。在技术路线上,它没有一味依赖大模型和大算力,而是通过优化模型和蒸馏技术降低对算力的需求,让AI Agent能在边缘设备进行轻量化推理。

    开发模式上,DeepSeek的开源降低了开发门槛,吸引了更多开发者参与,加速AI Agent从实验室研究向工业级应用的转变,推动了多主体协同开发,开发者的关注焦点也从注重“语言生成”转变为更重视“任务执行”,让AI Agent“实际做事”的价值更受关注。

    陈运文认为,在功能上,DeepSeek能实现多模态交互,理解复杂指令,还能在复杂场景里生成最优路径;应用场景也拓宽了,在金融、医疗、制造、媒体娱乐等多个领域都能构建智能Agent,比如智能投顾、诊断辅助、供应链优化、内容创作等;协作集成方面,它预置了常用API,降低了集成成本,还支持多Agent分工协作,适用于供应链管理、智慧城市这些场景。

    “强大+便宜”推动模型“平民化”

    LogenicAI联合创始人李博杰告诉《IT时报》记者,随着DeepSeek的出现,AI Agent领域发生了两方面的重要变化:首先是成本显著降低,其次是许多人的心态发生改变。

    李博杰指出,要实现真正有效的AI Agent,能够解决实际问题并达到商业需求,需要像R1或更高级别的模型。但以往,如OpenAI等模型成本非常高,比如OpenAI的o1模型,每100万个Token的成本为60美元,而现在,DeepSeek-R1的成本仅为2美元100万个Token,缩减30倍,大幅降低成本。

    对于OpenAI来说,这无疑是一个挑战,因为它长期以来锁定自己的技术,并通过高价盈利,但现在DeepSeek的出现迫使OpenAI调整策略,甚至降低o3Mini版本的价格,这表明推理模型的成本正在普遍下降。

    值得一提的是,2月13日凌晨,OpenAI首席执行官萨姆·奥尔特曼公布了GPT-4.5和GPT-5的最新消息。奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3模型,并应用于聊天机器人ChatGPT以及API平台,此外,更重要的是,免费版ChatGPT能在标准智能设置下无限制地与GPT-5进行对话。

    李博杰还提到,成本的降低让AI Agent类应用得以普及,过去由于模型能力不够强大,效果并不理想。如今,借助DeepSeek或OpenAI o3等更强大的模型,AI Agent能够帮助解决更复杂的问题。

    李博杰认为,DeepSeek的成功不仅在于技术的突破,还在于它的开源模式,这使得其对更多开发者开放,打破了以往AI技术需要巨额投入的“迷思”。OpenAI的收费体系一直较高,且最先进的模型也只限特定合作伙伴使用,而DeepSeek的出现让这些技术变得平民化,带来了根本的认知变化。

    这种变化尤其体现在投资者的态度上。金沙江创投主管合伙人朱啸虎曾明确表示,他不会投资中国的AI大模型创业公司。然而,随着DeepSeek的出现,朱啸虎的看法发生180度转变,表示“大开眼界”“DeepSeek让我开始相信AGI的可能性”。

    与其“做模型”,不如“接入生态”

    提到个人智能助手,许多人最先想到的可能是科幻电影《钢铁侠》中的贾维斯。然而,要拥有属于普通大众自己的“贾维斯”,所需要的远远不止一家能够生产“贾维斯”的公司。

    在杨国生看来,未来的AI Agent几乎会渗透每一个软件,支撑着每个功能的实现。如今,我们通常通过编写代码来开发程序,并经过测试和调试来实现功能,但未来,很多功能可能不再依赖传统的编码方式,而是由智能体自动完成。例如,计算每月的良品率,未来可能由智能体自动处理,而无需我们手动编写和调试代码。

    陈运文坦言,AI Agent的全民普及仍面临瓶颈。大众对其功能和价值的理解不深,接受度较低,且专业人才匮乏,尤其缺少既懂技术、产品,又熟悉商业和生态的复合型人才。在伦理、法律与安全方面,AI决策往往缺乏可解释性,责任归属不清晰,且存在隐私泄露和被攻击的风险。未来的技术突破方向主要包括:优化模型,提高准确性、泛化能力和可解释性,减少算力需求;发展多模态技术,促进更自然的多模态融合;强化学习与自主决策能力,使AI Agent能够在复杂环境中自主学习和决策。

    从技术角度看,AI模型可能面临偏差风险。例如,算法歧视可能导致不公平结果,训练数据不足或应用不当也可能导致模型失效。此外,网络安全问题也不容忽视,DeepSeek曾遭遇过DDoS攻击,因此,加强大模型的安全防护至关重要。

    李博杰以雷军和小米公司举例,在移动互联网的早期阶段,尽管有数百家公司涉足手机行业,但最终,只有小米等少数公司取得了成功,最终市场上的主流手机品牌依然是那些早期就有基础的公司。

    对于从事AI行业的人来说,并不一定需要像OpenAI那样打造基础大模型。与其直接与巨头竞争,不如选择像小米的空气净化器或插线板这样的生态链产品,在AI应用领域找到特定的突破口,与巨头形成互补关系。例如,OpenAI投资了多个垂直领域的公司,如语音学习应用Speak、编程教育平台Canvas、法律应用等,这些公司专注于特定行业,与OpenAI的基础模型形成互补,而不是直接竞争。

    李博杰强调,未来AI行业需要更多的人愿意深入垂直领域。许多创业者往往只关注大模型,但那些看似“小”的垂直领域应用,恰恰是AI技术实现商业化的重要突破口。

    来源:微信公众号“IT时报”

  • 强过DeepSeek?马斯克放大招

    强过DeepSeek?马斯克放大招

    就在18号,被马斯克狂吹为“地球上最聪明AI”的Grok 3聊天机器人现世了。

    马斯克携手xAI(其投资创建的AI企业)的工程师们通过直播的形式,向世界展示了Grok 3的实力——在减少AI幻觉、提升逻辑一致性、联网获取实时信息以及深度搜索等方面,Grok 3都展现出了可能超越OpenAI和DeepSeek等大模型的能力。

    马斯克在发布会上激动地说,Grok 3的能力相比其前身Grok 2,强大了一个数量级。这番言论,让Grok 3迅速成为全球科技与资本市场的热门话题。

    而且马斯克还为Grok3整了一个更有逼格的定位:“our mission is to understand universe(我们的使命是了解宇宙)”。

    而迅速推出Grok 3的背后,也藏着马斯克与阿尔特曼(OpenAI创始人)之间的复杂恩怨。两人曾携手创立OpenAI,誓言用开源技术挑战谷歌的AI霸权。可如今两人却分道扬镳,甚至在某些场合针锋相对,上演了一出出“背叛”与“反击”的戏码。

    那么,这个由马斯克倾尽心血的Grok 3,能否让马斯克在阿尔特曼面前争一口气?它是否能够重塑AI聊天机器人的格局?而资本市场又是否会给予它足够的支持呢?

    Grok3超越DeepSeek和ChatGPT?

    美国科幻大师罗伯特·海因莱因的小说《异乡异客》中,有一位在火星上长大的角色叫作“Grok”,它代表了对某事物全面且透彻的理解。

    马斯克表示,xAI 团队之所以将其聊天机器人命名为Grok就是源于这个初衷。

    作为xAI正在精心打磨的杰作,Grok 3最引以为傲的便是突破性的“思维链”推理能力和多模态功能的全面升级。

    虽然Grok 3是一款聊天机器人,但其“推理”能力却不容小觑。它不仅能与用户进行流畅的自然语言互动,更能逻辑性地测试其响应并进行严格的事实核查。

    马斯克和他的团队自豪地宣布,Grok 3测试版的推理能力甚至可能已经超越了现有的众多人工智能模型。在关于推理和测试时间的基准测试中,Grok 3以卓越的表现,力压DeepSeek-R1、OpenAI o1、OpenAI o3 mini-high以及Gemini-2 Flash Thinking等一众强敌,展现了其非凡的实力。

    xAI团队还通过一系列有趣的展示,让我们亲眼见证了Grok 3的过人之处。比如,在计算从地球到火星的航天器任务时,Grok 3竟然能够生成一张生动的太空发射动画3D轨迹图,从地球出发,穿越火星,再返回地球,这一过程中涉及的复杂物理知识,都被它一一攻克。

    更令人惊叹的是,Grok 3还足够聪明,能够根据超强的推理能力编写游戏或结合现有游戏。当xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏时,它迅速生成了一个Python脚本,定义了游戏的常量、颜色、方块形状等元素,并创造出了一种独特的玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除。

    而Grok 3的多模态功能升级,更是让人眼前一亮。它并非单一的模型,而是一个由多个模型组成的家族。其中,轻量级版本Grok 3 mini主打实时响应,推理速度较标准版提升了惊人的5倍;而Grok 3 Reasoning则采用了类人脑的“慢思考”机制,通过多层事实核查,有效规避了AI幻觉的问题。

    在数学推理、代码生成和科学逻辑测试中,Grok 3的表现同样令人瞩目,它超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等竞品,展现出了强大的竞争力。

    在盲测方面,xAI的Grok 3(早期版本)更是以1402分的历史最高成绩,在lmArena排行榜上登顶,成为首个突破1400分的AI模型,这一成绩甚至超越了Google、OpenAI、DeepSeek等业界巨头。

    值得注意的是,马斯克团队仍在持续优化Grok 3的能力,Grok 3目前仅对X Premium Plus订阅用户开放,但xAI为忠实粉丝推出了名为Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限。

    此外,xAI还推出了SuperGrok计划,订阅用户能够访问更多推理能力和无限图像生成。并计划未来数周内上线语音模式及企业API接口。

    那么被马斯克吹上天的Grok3是如何炼出来的呢?

    122天,马斯克用20万块GPU张大力出奇迹

    有句说句,Grok 3能迅速发展,离不开xAI的惊人的工程执行力。

    xAI高管团队透露,为实现“打造顶尖AI”的目标,公司选择自建数据中心作为核心路径。

    第一阶段,他们仅用122天便完成10万块H100 GPU集群部署,建成当时全球最大规模的全连接算力基础设施。

    第二阶段进一步提速,仅92天就实现算力翻倍,使集群规模达到20万块GPU——这些硬件资源全部投入“科洛苏斯超级集群孟菲斯数据中心”,成为训练Grok 3的核心支撑。

    技术突破方面,xAI通过大量使用合成数据等创新手段,使Grok 3相较前代实现10倍计算能力跃升,以超快的速度追上了ChatGPT。

    在配套生态的构建上,xAI同样不遗余力。他们推出的DeepSearch被誉为“下一代搜索引擎”,它允许用户提问并获得答案,更重要的是,DeepSearch能够展示从问题思考到研究,再到最终答案生成的完整过程。

    DeepSearch是一款推理聊天机器人,能够阐述其理解查询内容的过程以及规划回复的方式。在演示中,DeepSearch展现出了研究、头脑风暴和数据分析等多种功能,令人眼前一亮。

    对于Grok 3是否会开源,马斯克明确表示,“我们通常会在新模型发布的时候,开源上一代模型,所以几个月后,我们也会对Grok 2进行开源。”

    这种“代际开源”策略既保持了技术护城河,又满足了开源社区的期待,不少网友认为马斯克格局不错,但也留着底牌。

    资本市场对此次技术突破反应热烈。

    Grok 3发布当日,恒生互联网科技业指数开盘冲高1.8%,恒生互联网ETF(159688)收涨1.42%,金山云、腾讯控股等AI概念股集体跟涨。更显著的是机器人ETF单日资金净流入突破十亿元,创历史纪录。

    投资机构层面,Grok 3发布会后,红杉资本、Andreessen Horowitz等顶级风投加速入场,推动xAI融资规模剑指百亿美元,公司估值飙升至750亿美元。

    不过相较于OpenAI的3000亿估值,Grok 3还差一些。市场仍认为xAI在生态壁垒和商业化成熟度上的优势仍不如OpenAI。

    目前,Grok 3虽然仅通过一场直播demo曝光,没有更多官方信息,但其含金量几何,还需更多用户和时间验证。

    不过,从Grok 3发布会背景板上的那句“our mission is to understand universe(我们的使命是了解宇宙)”可以看出,马斯克的野心远不止于此。

    马斯克离“用AI理解宇宙本质”的终极目标还有多远?或许还要再等Grok 3再飞一会。

    搞Grok3只为了赌气?阿尔特曼公开羞辱马斯克

    不过,在Grok 3风靡全球的背后,一场不为人知的内部斗争同样引人入胜,主角便是曾经的盟友——埃隆·马斯克与山姆·阿尔特曼。

    故事要追溯到2015年,硅谷的夜空下,马斯克与阿尔特曼携手启动了被誉为“AI曼哈顿计划”的OpenAI。

    他们共同的敌人,是那时如日中天的谷歌,两人担忧其可能垄断AI技术,便牵头成立了非营利性质的OpenAI。

    在阿尔特曼心中,马斯克一度是如“钢铁侠”般的存在,是打破美国科技僵局的英雄。然而,理想丰满,现实骨感。

    随着OpenAI的算力成本飙升,财务困境如影随形。阿尔特曼做出了一个决定性的选择,引入微软10亿美元的投资,并成立了盈利性质的子公司OpenAI LP。

    马斯克坚持非营利原则,认为这是对初衷的背叛,而阿尔特曼则认为商业化是生存之道。两人的分歧日益加深,马斯克认为OpenAI已沦为微软的“闭源附庸”,并试图夺回CEO之位,却遭到了董事会的拒绝。

    阿尔特曼随即发起了内部斗争,成功争取到了另一位联合创始人格雷格·布罗克曼的支持,而布罗克曼又进一步拉拢了首席科学家伊利亚·苏茨克维尔站在自己一方。

    2018年,马斯克黯然离场,阿尔特曼接掌了OpenAI的领导权。从此,两人分道扬镳,OpenAI也倒向了微软。

    时间流转至2022年11月30日,ChatGPT横空出世,迅速成为21世纪最具影响力和变革性的科技产品之一,与iPhone、Facebook和TikTok并驾齐驱。

    然而,对于马斯克而言,这款产品的问世却如同一把利刃,刺痛了他的心。作为曾经的创始人之一,他已被彻底排除在外,愤怒与失落交织于心。不甘心的他随即推出了自己的初创公司xAI,希望与ChatGPT一较高下。

    法律战与舆论战也随之打响。马斯克连续起诉OpenAI“违背初心”,要求恢复开源,并批评其发展迅速却忽视安全。他在公开场合多次猛烈抨击阿尔特曼,而阿尔特曼也毫不示弱,两人的关系急剧恶化。

    直到Stargate计划的公布,两人的矛盾被推向了顶点。阿尔特曼作为民主党人,却与特朗普政府合作推出了这个高达5000亿美元的人工智能基础设施投资项目,而马斯克却对此毫不知情。

    可以说,Stargate计划不仅让马斯克感到被背叛,更打破了马斯克的政治与商业布局。

    愤怒的马斯克随即发起恶意收购,愿意以974亿美元的价格收购OpenAI的控制权。而阿尔特曼的反击同样犀利,他嘲讽道:“我们愿以97.4亿美元收购Twitter。”阿尔特曼借此嘲讽马斯克以440亿收购Twitter的商业决策。

    目前,两人的恩怨远没有结束,但唯一确定的是,Grok 3的出现已经让AI界再次沸腾了起来。

    Grok 3的崛起,未来GPT5的发布,以DeepSeek为代表的中国AI军团的竞逐,无不预示着AI新时代的洪流滚滚,未来的路还很长,故事仍在继续。

    参考资料:

    1、《马斯克发布Grok 3大模型,称超越DeepSeek》澎湃新闻

    2、《马斯克出手!Grok 3计算能力暴增10倍,谁才是最强大脑?》金十数据

    3、《大力出奇迹?马斯克发布“史上最聪明AI”Grok-3,号称超越DeepSeek R1,20万张GPU能否颠覆AI格局?》金融界

    来源:微信公众号“首席商业评论”

  • 杀疯了,超10家能源央企接入DeepSeek大模型

    人工智能正以前所未有的速度渗透至各行各业。

    近日,人工智能大模型DeepSeek正在快速在能源央企中落地生根,成为推动能源行业智能化转型的重要力量,国企、央企一改以往老套、古板的常态,正在积极拥抱人工智能。据不完全统计,目前国家电网、南方电网、中国华能、三桶油等十数家能源央企已完成DeepSeek技术接口的集成部署

    很显然,这场由智能技术驱动的产业变革正在重构商业世界的底层逻辑。而在能源领域,AI技术的应用也同样在加速。

    据悉,自从深度推理大模型DeepSeek爆火以来,中国石化就组建了相关专业团队,并在2月5日完成DeepSeek的部署,将其接入到长城大模型应用系统(长城大模型系统是中国石化自身为了适应石油化工行业的特定需求而部署的大模型),在企业内部分批推广使用。

    2月8日,中海油的昆仑大模型也同样完成DeepSeek本地化部署,在原有模型上新增了DeepSeek的深度推理能力。随后2月14日,三桶油的最后一家中海油也完成了本地部署,现在已在平台网页端及海油移动云“”海能智问”同步上线。

    另外,五大发电集团同样跟上了脚步。首先,作为电网的领航人,2月12日,国家电网子公司国网信通产业集团自主研发的模型服务云MSC平台就全面接入DeepSeek大模型。MSC平台与DeepSeek的深度融合,实现了需求精准解读、交互极致体验、缺陷智能防控、性能优化策略及文档自动生成等关键功能,显著提升了电网数字化项目研发效率,赋能业务快速响应和灵活变革,同时有效降低了研发成本。

    同日,南方电网人工智能创新平台也完成了开源大模型DeepSeek的本地部署。该平台通过引入DeepSeek,实现了自然语言基础模型的快速升级迭代,参数规模提升至千亿级别,极大地增强了电网在各项业务领域中的智能应用效果。

    随后,2月13日,中国华电子公司国电南京自动化股份有限公司自主研发的“华电睿思”数字底座接入DeepSeek。该数字底座通过与DeepSeek的深度融合,实现了智能问答、文档归纳分析等功能的升级,支持多种能源类型和数字化业务场景的智能化部署。

    此外,还有中国华能、国家能源集团(龙源电力)、国家电投、中广核、中核集团、中陕核集团(秦洲核安)等能源央企都完成了DeepSeek系列模型的本地化部署,将DeepSeek赋能能源生产、运营与管理的各个环节

    02

    这些能源央企接入DeepSeek,具体能做些什么呢

    拿中国华能举例,中国华能的“睿智小能”AI助手是DeepSeek在能源领域应用的典型案例。

    该助手深度融入“iHN+”平台,实现了知识问答、公文拟稿、智能校对、文件解读、科研辅助等基础功能。另外,在电力生产控制方面,将工业过程温度控制系统与AI助手相结合,保证温度精准控制与快速响应,并根据历史数据给出控制参数建议。此外,在设备检修指导方面,构建电力设备私有化知识库,与设备管理、缺陷管理等功能集成,实现设备故障智能排查、检修问答与指导。

    这么一看,DeepSeek确实能够给这些能源企业带来巨大便利,因此也不难理解为何这些能源央企愿意去拥抱DeepSeek了。

    但值得注意的是,在DeepSeek出来之前,ChatGPT早就横空出世,不过由于是国外研究的,对于国央企有安全隐患。但近年来,国产AI层出不穷,如kimi、豆包、文心一言、通义千问等都早已推出,如果仅仅是安全问题,这些国产AI应该早就装上了。

    那为何唯独选择了DeepSeek?

    据行内专家分析,认为主要有三点。首先是DeepSeek算力强、成本低。据悉,DeepSeek与ChatGPT-O1一样都是推理模型,而非指令模型,即在处理问题时,DeepSeek不会只是简单地堆积信息,而是会深入思考,给出答案。其在算力方面能与Chatgpt媲美,并且背后花费的成本远低于Chatgpt。

    其次,使用DeepSeek安全风险很低,不同于ChatGPT的闭源,DeepSeek是完全开源的,闭源模式下的ChatGPT,企业用起来就束手束脚。而开源的DeepSeek就像是打开了工具箱,各家企业可以根据自家的需要自主改装AI模型,将DeepSeek根据自家企业需求接入。例如,国家电网可以用它提升电网效率,新能源汽车企业可以将DeepSeek安装到智能座舱等。

    这样一来,DeepSeek的用法就变得十分个性化,每家企业都能打造出独属于自身的AI系统。

    最后还有一点,DeepSeek打破了美国对AI的话语权垄断,它的出现标志着中国在人工智能领域取得了重大突破,代表着科技创新力量,得到国家政策的强力支持。据悉,在北京召开的民营企业座谈会中,DeepSeek创始人梁文锋赫然在列,并且与马化腾挨身相坐于第一排。因此本次能源央企一片一片地部署DeepSeek,也有着这方面的原因。

    事实上,人工智能技术在能源领域应用前景非常广阔。

    “人工智能技术早已在智慧能源、智慧矿山、油气勘测等领域开展应用,人工智能是进行新能源预测最有力的工具,可以推动能源生产与管理优化、效率提升,为能源行业转型升级带来智力支持。”中国科学院院士、西安交通大学电子与信息学部主任管晓宏此前在接受《中国能源报》采访时曾表示。

    不过,在为能源行业赋能的同时,人工智能的规模应用仍面临一系列挑战。

    管晓宏在上述报道中表示,能源行业的AI应用需要结合具体领域,开发定制化的垂直大模型,对技术团队的要求较高。能源系统的运行需要实时监控和响应,这对AI算法的计算效率和延迟提出了更高要求。许多能源场景需要边缘计算支持,模型需在计算能力和存储资源有限的条件下具备本地部署能力,面临技术复杂性问题。

    能源行业事关国家安全和民生保障,对AI系统的可靠性和安全性要求极高,如何在数据共享和隐私保护之间找到平衡是一大难题。目前,能源行业AI应用还缺乏统一标准和规范,技术推广和应用效果参差不齐。初期投入高、回报周期长,新技术引入验证和评估周期长等问题都有待解决

    值得一提的是,DeepSeek在能源企业上的部署只是AI进入能源领域的一部分,近期能源领域正在积极拥抱AI,据2月17日工信部等八部门印发的《新型储能制造业高质量发展行动方案》提出,要充分利用人工智能等先进技术,推动储能行业的智能化发展。AI技术在储能领域的应用,不仅可以优化储能系统的运行效率,还可以用来解决储能的安全问题。

    来源:微信公众号“预见能源”

  • DeepSeek的列车,有人准备躺上去了

    据说,全国的大城市,都在为错过DeepSeek彻夜难眠。

    江苏省委机关报《新华日报》旗下“交汇点”在2月7日晚、8日上午连发三篇专稿文章《DeepSeek为什么会出现在杭州?》《为什么南京发展不出“杭州六小龙”?》《杭州有DeepSeek,南京有什么?》

    深圳的自媒体集体反思:这里没有诞生DeepSeek,是不是深圳不行了。还有部分科技企业动了心思:接下来要不要搬到杭州去?

    下情上达,深圳立马宣布:全面接入入DeepSeek,“AI公务员”上岗。

    但,个别自媒体仍然紧追不放,喊出“拿来主义救不了深圳”。

    之前,四大一线城市在互联网科技领域长期“三强一瘸”,北京有字节、美团,上海有拼多多,深圳有腾讯、华为,广州是那“一瘸”。

    诞生了阿里等互联网公司的杭州,一直奋起直追,但也仅仅是对“第四席”广州形成威胁。

    直到DeepSeek出现,所有城市都露出了紧张感。

    因为,很多城市和公司都吃过经济转型升级、“移动互联网”代替PC的痛。现在,全互联网行业都把AI当作了另一次“移动互联网”大潮。

    因移动互联网来临而面临死亡的公司:国美、苏宁、天涯、人人、九城、易趣……

    后来出现的互联网巨头,字节、拼多多、美团、腾讯、滴滴、淘宝,每一个长大的土壤都是移动互联网。

    每一次大潮来临,都会诞生一批巨头,也会有一批企业死去。一家公司的死亡是小事,但在整个产业革新中没有上车,错过的可能是一整个时代。AI时代的到来也会一样。

    没有人想错过未来。因此,AI必争。

    而DeepSeek就是打破平衡,AI路上最快的那趟列车

    01 

    “造车”很难,但地产行业有一个非常形象的词,用来形容拿到红利:上车。

    他们把房价的飞速上涨比作一辆列车,只要你买房上了车,躺着就可以吃到涨价的红利。

    在价格红利之外,还有一种普通人很难看到的红利:资本红利。用股市举例,最直接的吃红利方式就是蹭热点概念股,把低估值资产向高估值领域转移。

    因此,由“上车”思维延展,在公司运作层面又有了:搭车、挂车、套牌车的逻辑。

    如何“搭车”DeepSeek,上周居然智家完美演示了一次。2月10日至14日五个交易日内,居然智家市值从214.9亿元,暴增至347亿元,增加132亿元。原因是公司接入了Deep Seek,拥抱AI。

    在股价暴涨期间,2月12日,元宵节,居然智家董事长汪林朋再次讲话说:新一年有几件重要的事情:第一、3月要参加英伟达GTC大会;第二、推出家装行业的自有大模型;第三、成立智能家居研究院;第四、推动家装AI设计样板间落地;第五、打造北京最大的新能源汽车交付中心。

    简要明了,AI、新能源全部击中。

    地产企业曾经也深谙其道。听说,有几家地产公司正在打听:如何接入DeepSeek?

    地产企业上一次对互联网这么兴奋,还要追溯到“互联网+”时期。

    在“互联网+”概念火热的那几年,大量上市地产企业也纷纷“+互联网”。鑫苑做云和机器人,SOHO中国做共享办公,花样年、乐生活做社区O2O,当代地产做众筹买房……万科、碧桂园、恒大们,每家都有几个与当时热门产业关联的业务线。

    一个“研习知识”的地产公号说,他们做得好是因为:“善用杠杆享尽市场红利”。“杠杆”不仅包括资本杠杆,还有“品牌杠杆”。

    所谓的“品牌杠杆”,就是把高度再拔一拔

    02

    有的地产企业不在明处搭车,而是暗中“挂车”。

    2017年9月,佳兆业斥资17.58亿收购A股上市公司明家联合21.25%的股权,成为其控股股东。

    佳兆业入主后,“明家联合”改名“佳云科技”,由郭英成之子郭晓群担任董事长。

    佳兆业曾计划将旗下互联网、大健康等产业资源注入佳云科技,推动其从互联网营销向“互联网+”综合服务转型,担当郭英成家族在境内的上市、融资平台,但因政策及市场环境变化未果。

    佳云科技只是一个样本。2015年前后,开发商通过互联网、大健康、金融、汽车等曲线寻找境内上市、融资平台的案例比比皆是。

    如今,翻开碧桂园、万科等企业上市体系外的“影子公司”,还能看到一个庞大、密集、错综复杂的资产网——每一个公司,都有其注册成立的直接目的。

    营销天才史玉柱曾经说过:实业家创造社会财富,资本家优化社会财富。

    不过,很多企业家自动把自己归到了“资本家”一档,并把社会财富向自己进行“优化”。

    当创造财富,把企业业务做强做大太艰难,他们就开始“走捷径”,创造概念,搭车热门概念。

    而DeepSeek、机器人,就是眼下最热门的概念。一群企业跟风而上,跟风而“接(入)”。

    对此,小栖的一位朋友评价:“都在找机器人要估值:现在很多机器人公司跟风研发,重点展示走路,其实机器人走路不走路无所谓的,重点研发方向应该是手,因为人类正是因为有了灵巧的手,才能制造各种工具,以及解决日常生活的各种问题。但是走路的机器人展示效果很好,毕竟看上去更像人。”

    对于这个问题,DeepSeek自己回答:

    全球经济不确定性下,科技赛道成为资本避风港。AI与机器人作为“硬科技”代表,容易获得政策扶持和融资,导致企业通过概念包装获取资源。但这场竞赛的本质,是对产业痛点的敬畏之心与工程化能力的终极考验。

    来源:微信公众号“未来可栖”

  • 微信接入DeepSeek后,腾讯正在把产品all in AI

    微信接入DeepSeek后,腾讯正在把产品all in AI

    腾讯CEO马化腾曾表示:

    对于工业革命来讲,早一个月把电灯泡拿出来,在长时间跨度上来看是不那么重要的。

    从Chat GPT出现,再到DeepSeek赋能中文互联网。

    眼下观望已久的腾讯终于决定出手了。

    腾讯正在把产品all in AI

    为什么说在2025年的开年阶段,腾讯正在将旗下产品和团队精力all in AI。

    在腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群)后,搜狗输入法、QQ浏览器、ima等产品和应用也正式转入了CSIG,共同构成了腾讯向大模型时代挥出的“组合拳”。

    站在产品角度上进行观察,我们会发现资历老、用户多是搜狗输入法和QQ浏览器在AI时代的核心优势。它们的应用场景不仅可以无痛嵌入AI写作、AI搜索等大模型应用方向,其成熟的用户和内容积累,更是帮助腾讯省去了推广、培养用户使用习惯的成本。

    而ima作为腾讯内部在2024年10月孵化的AI原生应用,其“智能工作台”的产品定位搭配同公众号、微信直接联动的接口优势,也为广大用户提供了“搜、读、写一体化”的全新体验。让腾讯在使用AI技术赋能既有产品的同时,拓展了旗下AI产品的辐射空间,实现了“老产品”和“新路径”的两手抓。

    无论是产品对AI概念的快速适配,还是团队组织架构的灵活调整,它们都在一定程度上让我们见到了腾讯布局AI生态的决心。

    从春节结束的那天起,元宝、腾讯文档、腾讯地图、QQ音乐等腾讯产品对AI的适配消息就未曾断绝。

    由此可见,在DeepSeek引发了中文互联网的技术升级后,腾讯已经结束了自己在AI时代的“观测阶段”并为不同的产品找到了不同的发力点。

    在接下来的时间里,腾讯内部大概率会在组织结构、资源扶持层面进一步发力,以此实现品牌、旗下产品对大模型时代的全面拥抱。

    弯道超车的关键是老树发新芽

    腾讯CEO马化腾曾表示:“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好。”

    这也就意味着,和AI相关产品的推出速度相比,腾讯内部更在意产品的使用体验,在意如何在现有、未来的应用场景中培养、维护用户的AI使用习惯。

    对腾讯而言,新赛道的开拓固然重要,但用新技术赋能老产品去实现“老树发新芽”的想法同样不能放弃。

    拿国民级APP微信举个例子。

    身为一款聊天软件,微信不是没有过挑战者。

    即时聊天、语音条互动等概念只能让它实现从0到1的变化,助其在“聊天软件”这个赛道里站下脚跟。

    若想实现从“应用”到“国民级应用”的转变,就要在不同的互联网产品周期里灵活运用“老树发新芽”战略去维持用户黏性,强化自己的产品地位。小程序、小游戏的出现如是,视频号、直播号的出现亦如是。

    在今天,历经多次“AI赋能”概念的冲击后。

    微信观望许久终于做出了接入DeepSeek的决定。

    相关报道显示,微信搜索在增加“AI搜索”功能后,整个公众号模块下的内容都将被纳入AI搜索的内容数据库。这样做除了可以帮助用户更好的解决问题外,还能让公众号推文的热度跨越传播周期,强化其以内容为导向的发展模式,进一步激活创作者的创作热情。

    最终让平台依托灵活、精准的AI推荐、解答机制,一举实现“用户、创作者”黏性的双重升级,完成平台正循环的量身定做。

    要知道,微信作为目前的国民级应用。

    它所做出的每一个决定、每一个更新,都会让腾讯本体迎来极高的关注度。而本次微信所展现出的高调态度,除了有为新功能造势的直观意向外,还通过对技术、用户体验的“双重押注”,一举击穿了外界对腾讯在大模型领域动作迟缓的错误印象,让自己成为了拥有后发优势的“冷静拳手”。

    谁会率先找到下一个杀手级应用

    随着词条“腾讯华为等接入DeepSeek每月亏超4亿”登上热搜,人们对大厂押注AI的行为也产生了一丝不解。

    相关内容显示,现在国内的大厂虽然纷纷接入了DeepSeek,但大家所采用的运营模式基本都是免费模式、低价模式。(满血版DeepSeek-R1每百万token仅收取16元)

    倘若企业每日输出1000亿token,则其每月基于DeepSeek服务的机器成本就高达4.5亿元,造成亏损4亿元;哪怕使用AMD芯片月收4500万,月机器成本下降至2.7亿元,也会有超2亿元的亏损存在。

    简单来说,当前大厂正陷入“用户越多,亏损越多”的商业怪圈。

    既然每个月都有亏损,那为什么目前没有一个大厂暂停布局AI的计划?

    因为大家都在搏那个“找到杀手级应用”的机会。

    虽然AI聊天机器人、AI搜索等功能代表了实现AI to C的重要诠释,但它们的本质都是各家公司探索AI潜力的不同方式以及用AI赋能自家产品的不同路径。直到今天,市面上一直没有出现真正意义上的“杀手级AI应用”。

    对那些布局AI赛道的大厂而言,他们的核心任务是坚定自己的AI转型步伐,因为市场、技术发展趋势均在暗示我们AI是下个商业版本的答案。在转型计划启动后,大厂的主线任务也就变成了发现、寻找用户真正想要的、能代表应用2.0体验的内容。

    正如微信押宝AI搜索那样。

    大家都在用自己的方式去抢夺AI时代的技术优势,去挖掘AI时代的用户所想。

    一旦领先他人实现了上述两点,那么未来的天平也将向自己全面倾斜。所以和主导未来的赛道话语权相比,眼下的亏损数字根本无法减缓大厂前进的步伐。

    参考:

    科创板日报:四大产品线合龙 腾讯跑步搭建AI应用矩阵

    证券时报:「e公司观察」超级应用接连联姻DeepSeek “技术共同体式”互联互通或成新趋向

    钛媒体APP:DeepSeek冲击下的互联网巨头:谁在崛起,谁在掉队

    来源:微信公众号“互联网那些事”

  • DeepSeek成BAT生死符,不接入就出局?

    DeepSeek成BAT生死符,不接入就出局?

    在自家云平台完成部署DeepSeek后,一众科技大厂又有了更为深入的新动作。

    先是阿里旗下的办公软件钉钉全面接入DeepSeek系列模型,随后微信搜一搜灰度测试接入DeepSeek R1满血版模型,百度搜索也官宣将全面接入DeepSeek,并且24小时内便全量上线。

    除了阿里外,腾讯和百度均将DeepSeek带到了自家最核心、流量最大的超级APP中,但百度引起的争议显然更大,其中除了对其如此迅速“缴枪”表示不理解外,更是对百度此前投入百亿All in AI的质疑。

    其实选择在自家主力APP中接入第三方大模型服务,是国内大厂的一次战略转变,也是一次对企业未来的押注。DeepSeek在行业中产生了一种化学反应,促使各玩家将点转向如何利用先进模型来赋能自家业务场景。

    从流量层面而言,DeepSeek就是当下最大的流量密码,从业务层面而言,DeepSeek不仅提供了强大的技术支持,在提升用户体验、优化业务流程方面也具备巨大潜力。

    微信和百度搜索的率先接入,无疑会将压力给到还未有主力APP接入的阿里系和字节系产品,但对于马化腾和李彦宏来说,拥抱DeepSeek也会带来新的考验。

    互联网巨头竞逐

    在互联网巨头中,腾讯拥抱DeepSeek的动作最为果断坚决。在微信最近的一次灰度测试中,上线了基于DeepSeek-R1的“AI搜索”功能,要知道此前腾讯自家的大模型都没有如此待遇。

    其中原因很大程度上是因为过往的大模型产品,不能给到微信用户像DeepSeek-R1这样的搜索体验的大幅升级。简单来说,对于在产品功能更新方面一向小心谨慎的微信来说,这种高调的操作,展现出了其积极拥抱优质AI的策略。

    作为一家具备极强产品基因的企业,腾讯坚持了应用体验优先的准则,在足够优秀的大模型体验出现之前,没有轻易投下自己手中的筹码。

    不止是火速接入微信,腾讯的果断还在于,其是目前唯一一个在自家大模型产品中直接接入DeepSeek大模型的互联网大厂。并且截至目前,腾讯地图、QQ音乐、腾讯文档等产品均已快速接入DeepSeek。

    ▲ 图/腾讯文档的AI文档助手

    腾讯施压之下,百度搜索跟进接入DeepSeek被看作是积极求变的信号。

    其实在百度搜索宣布接入DeepSeek之前,百度就改变了大模型发展路线,先是宣布文心一言将全部免费使用,后来直接一改闭源策略,开始拥抱开源路线,称未来几个月内推出的文心大模型4.5系列,将走向开源。

    而百度搜索接入DeepSeek一方面是应对微信搜一搜AI化带来的压力,另一方面则是为快速稳住搜索的基本盘,保证集团整体业务稳定。另外为了应对B端开发者流失的压力,与百度搜索接入DeepSeek同时宣布的,还有文心智能体平台将全面接入DeepSeek的消息,而在这之前百度智能云千帆大模型平台也已上线DeepSeek模型。

    显然,在对文心一言的执念和缓解用户流失压力的抉择中,李彦宏选择了后者。

    与腾讯和百度果断的将先进大模型上线业务侧产品不同,字节在是否接入DeepSeek的问题上给到了更为保守的答案。

    截至目前,字节系产品中,抛开云平台火山引擎不谈,字节系业务侧产品中,仅有飞书官宣上线了DeepSeek系列模型,且在实际操作后发现,其入口也极为隐藏,需要用户新建多维表格-添加列-搜索字段捷径后,才能找到DeepSeek R1的使用入口。

    最“保守”一定程度上也是“自信”的表现,毕竟在DeepSeek之前,豆包才是那个断层式领先的AI大模型,字节或许有足够的时间或者说相信自家研发人员在有限时间内,能让自研模型达到甚至超越DeepSeek的水平。

    DeepSeek的开源生态大大加速了AI场景落地进程,而面对DeepSeek异军突起带来的用户“涌现”,曾经在大模型探索道路上“故步自封的”互联网大厂,也不得不顺应趋势,做出改变。

    改变互联网格局

    大厂争先恐后接入DeepSeek,不仅仅是因为看到了技术趋势可能给行业带来的变化,也是想在AI这场持久战中建立阶段性优势。

    例如在云服务市场,DeepSeek带来的热度和低成本优势,成为打破市场价格战和吸引中小客户的突破口,谁能更快接入DeepSeek,就便能巩固现有市场,并且争取到那些为成本发愁的新客户。

    当然,这场“硬仗”的重点还是在于应用场景上。

    马化腾曾表示,“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地,目前(我们)还在做一些思考。我感觉现在有很多公司太急了,感觉是为了提振股价,我们一贯不是这种风格。”

    显然,这个过程中,是否有自研大模型或者说是否依赖第三方大模型可能并不重要,重要的是,如何将现有的核心场景进行AI化。

    AI搜索便是最具代表性的产物。

    在前两年大模型火热之后,搜索便成为所有AI玩家率先抢占的高地。但好在,这些AI搜索产品给出的答案不够准确,内容不够完善等原因,导致它们始终难以撼动谷歌和百度搜索地位。

    不过DeepSeek打破了AI搜索既有平衡,将用户体验向前推进一大步,并且腾讯毫不犹豫地打出了微信AI搜索的底牌,促使百度也跟进接入DeepSeek,引发了行业的轰动效应。

    两大巨头的两款国民级APP同时拥抱DeepSeek,是一场搜索入口的保卫战,也意味着AI搜索时代的真正到来。这一变革将深刻改变用户的搜索方式,也将对整个互联网行业产生广泛影响。

    无论是拥有巨量用户的腾讯还是深耕搜索的百度,一旦利用DeepSeek补足自身AI产品在深度推理等能力上的短板,便能帮助其APP获得更广泛的用户,从而抢先成为最具有想象力空间的AI超级应用。

    其实微信和百度搜索只是具有代表性的超级APP和DeepSeek的组合,不止在搜索领域,未来短视频平台、图文平台、社交平台等等,这些拥有巨量流量的地方,都是AI改造的重点。

    在这个过程中,用谁家大模型、借助怎样的AI技术,都不再是各家企业乃至用户们关注的重点,一个好用的大模型不会再是赚钱的手段,而成了留住用户的必要条件。各个大厂未来一段时间需要面对的问题也只有一个,如何将更出色的AI大模型落地到自家产品。

    AI生态下最优解

    过去两年中,大模型给传统应用带来的体验升级,让越来越多人开始认同一种观点,所有应用都值得用大模型重做一遍。从微信到百度搜索,超级APP加上DeepSeek这样先进技术的组合,也向外界展示着未来产品生态的可能性,即AI可能更有利于现有应用厂商,尤其是头部应用厂商。

    腾讯就是极具代表性的例子。通过让微信搜一搜、腾讯元宝、腾讯地图、QQ音乐、腾讯文档等产品快速接入DeepSeek,一举扭转了外界对其在大模型领域动作迟缓、战略不够清晰的判断,从一个大模型研发的跟随者成为了一个拥有后发优势的重要玩家。

    也印证了此前金沙江创投主管合伙人朱啸虎所说,在现有应用基础上,融入AI能力,是当下AI落地更实际的选择。未来,甚至不排除由DeepSeek输出技术,由科技大厂输出应用和场景的新模式出现。

    的确,业务范围更广的大厂可以借助更出色的开源模型,完成更快的私有化部署,弥补自身的技术短板、提升产品体验、尝试功能创新。例如微信和百度通过接入DeepSeek,在其原有的搜索功能之上,新增了深度分析能力,用有限的成本拔高产品价值,实现“四两拨千斤”式的产品升级。

    不过率先接入,也并非占据领先身位。例如搜索领域,从传统搜索进入AI搜索时代后,竞争既需要模型的处理能力、也需要优质的内容供给。当大家都向优质大模型抛出橄榄枝后,理论上中长期各家的搜索处理能力拉平,赛点便来到内容供给储备以及生态丰富度上。

    毋庸置疑,相比创业公司重构新的场景,大模型无疑更加利好行业中的头部玩家。对于具有丰富业务生态的大厂来说,以及已经拥有使用场景的玩家,很容易就能为自己的产品加上AI的功能,而这也能快速提高业务协同效率、创造差异化优势。

    不过需要注意的是,“DeepSeek接入潮”背后可能会存在技术同质化的问题。当相同行业、相同市场推出相似产品或服务时,用户侧难免会出现“用谁家都一样”的心态。而要避免这种情况发生,要么比同行更快,要么结合自身优势实行定制化、差异化的用户留存策略。而这个过程拼的便是企业在产品、在服务上的能力。

    这场由DeepSeek引发的AI变革中,互联网巨头们纷纷调整战略,试图在新的技术浪潮中占据一席之地。然而,这场变革并非只是技术的简单应用,更是对企业战略眼光、执行水平、产品能力和生态构建能力的全方位考验。只是站在技术涌现的十字路口,无论大厂如何做选择,都值得我们给予更多耐心。

    来源:微信公众号“新熵”

  • 500万高薪引才,DeepSeek“破圈”后,量化大厂不再“等”了

    DeepSeek爆火“出圈”已经一个多月了,而这个事件的影响力还在持续发酵。

    一个典型的变化是,部分曾经和梁文锋“摩肩接踵”过的量化大佬们,纷纷开始下场招聘人工智能人才。

    虽然,这个动作远比它们的产品业绩要“低调”,但在市场上开出的筹码已经显示大佬们的决心:

    必须招到人工智能核心人才。

    而且随着金融机构们普遍投身这个领域,AI(人工智能)大模型的相关人才貌似已经成为了这个领域里“有为机构”的标配。

    随着招聘动作的展开,一个开发AI、应用AI的热潮或许正在酝酿

    01 “500万”高薪岗位涌现

    对于量化圈来说,过往的大中型量化私募机构(管理规模超过50亿元),多数把招聘重心放在量化主业身上。

    热门岗位也围绕着投资策略开发展开:量化策略研究人员、系统开发工程师、量化实现工程师、数据专家等都是热门岗位。

    尤其是量化策略研究员,更是直接站在薪酬链条顶端。

    随着DeepSeek热潮开启后,部分机构开始重点“搜罗”人工智能领域的人才。

    第三方招聘平台信息显示:近日有金融高才的猎头人士,发布了特别的量化大厂招聘需求:AI Infra工程师负责人:年薪可达500万上下!

    这是近年来该平台罕见的高薪酬!

    02 工作经验须3年以上

    据悉,该岗位的工作地为:上海,面向相关岗位工作经验3-5年的专业人士。

    岗位薪酬范围非常“吸睛”:月薪10万-20万元的,一年“24薪”。据此推算,年薪范围在240万元-480万元。

    相关猎头人士还透露,上述职位的职责包括:

    负责AI基础设施相关系统架构设计与核心模块开发,进行AI计算框架和AI平台的系统性能与扩展性优化。

    显见得,有机构要高薪招聘人工智能人才“大干一番”。

    03 目标是“挖角”同行?

    来自另一个招聘渠道的信息显示,一家位于北京的一家头部私募机构也曾发布类似的岗位,而且岗位方向注明是训练推理,亦注明需要3-5年的工作经验。

    相关岗位职责包括:

    一,负责深度学习算法框架的架构设计、关键技术研究及研发落地。

    二,结合业务场景来推动算法框架的深度优化,提升框架稳定性、易用性,提高模型训练效率。

    三,促进框架和AI平台的结合。

    该招聘有意思的地方还在于,这家量化私募对工作年限的细节规定非常细致,结合其同样细致的岗位职责要求,最可能的人才来源就是:对AI有更深研究的同行。

    换言之,类似幻方这样在AI有深度积累的机构里的人才,可能更容易受到各方关注。

    04 重在训练大模型?

    难么量化机构大局招聘AI人才的用意何在呢?

    资事堂和业内机构沟通后,提出了几个方面的可能性:

    其一、就是结合功效不断提升的通用大模型,来训练出在投资市场有针对性的专用模型,甚至推动AI参与的量化投资策略。

    其二、在整个投研流程里,深度嵌入“人工智能模型”,以提高整条投研生产链条的产出。

    包括但不限于:利用AI推理技术协助从海量金融数据中挖掘有价值的信息;通过AI推理快速完成风险指标计算,以及利用AI推理生成市场趋势报告和投资建议等。

    前三、在AI大模型领域,有其他更深入的规划。

    而从目前行业推进情况看,人工智能参与的量化策略可能是近期各方关注的焦点。虽然各家机构研发的路径相对分散,且个别策略的收益波动还是比较大。但业内对这方面的投入的态度还是相对鲜明的。

    05 效果仍存争议

    但部分业内机构也表示,在是否重拳出击“AI”大模型方面,大家的意见并不一致。

    一方面,各家机构在量化方面的准备成熟程度不一,量化策略的原理也不尽相同,在既定策略方向上“嵌入”AI的必要性有分歧。

    另一方面,嵌入AI必然涉及持续投入算力集群硬件和人力,所费不赀。在资管市场整体费率有所压缩的当下,是否下决心“All in”各家还是有分歧的。

    其三,就是目前大模型在推理时时常出现“幻觉”(编造结果),这也是非常明显的一个短板。

    当然,业内确实也有中小型机构早早的打出“All in”人工智能的旗号,也获得了一定的场内关注。

    06 实习生待遇“升级”

    不过,眼见得的事实是,随着DeepSeek的风靡,量化人才受到了更多的追捧。

    有关AI的实习生待遇,也出现了提升。

    就在上述提及的平台上,部分量化机构也推出了AI算法实习生的招聘。

    相关岗位为全职类岗位,且岗位的日薪范围为800元-1500元,再度打破了此前日薪1000元的天花板。

    不过岗位的职责要求也较高,包括:利用公司强大的平台资源及系统框架,实践机器学习算法等要求。

    显然,这也是个考较实际产出的高技术岗位。

  • DeepSeek被传从外部筹资,相关人士称融资消息均为谣言

    针对“DeepSeek首次考虑进行外部融资”的消息,2月20日,据腾讯科技报道,有DeepSeek相关人士称融资消息均为谣言。

    2月19日晚间,据科技媒体The Information报道,DeepSeek正在考虑首次外部融资。知情人士透露,DeepSeek内部已经开始讨论是否接受外部融资,以获取更多的AI芯片和服务器资源。

    报道指出,中国投资公司和全国社保基金已经与DeepSeek取得联系,希望获得投资。DeepSeek的高管及其母公司幻方量化的高管也正在谈论是否从专注技术研究转向一家能够创造收入并最终获利的商业企业。

    尽管上述人士对此予以否认,但DeepSeek的融资情况备受外界关注。

    这家成立不到两年的公司,由量化资管巨头幻方量化创立,是“杭州六小虎”之一。其凭借DeepSeek-V3、DeepSeek-R1等大模型在性能上的出色表现,在国内外AI领域引发了巨大的冲击波。

    目前,DeepSeek已成为最快突破3000万日活跃用户量的应用程序,用时仅12天,而曾经改写AI历史的ChatGPT,实现这一用户规模耗时11个月。不仅如此,DeepSeek还在140个国家的应用商店排名第一。

    DeepSeek爆火之前,其资金主要来源于幻方量化的内部资源支持,以及政府的科研资助。公司创始人梁文锋此前专注于研究,有报道称其并不认同VC希望尽快实现产品商业化的诉求,所以拒绝了不少投资机构的合作意向。

    百度风投是其中之一,其北京办公室就在DeepSeek楼上。据雷递网消息,对于为何错过了投资DeepSeek,百度风投CEO高雪表示,DeepSeek去年5月入驻融科资讯中心的第一时间,便拜访了其相关负责人。但因为幻方的大模型业务没有拆分独立融资计划,所以和其他VC一样,目前没能有幸成为DeepSeek的投资人。

    市面上也曾传出阿里和国有基金对DeepSeek有投资意向,甚至称阿里计划以100亿美元估值入股10亿美元,占比10%。该消息后被阿里副总裁颜乔否认。

    若DeepSeek开放融资,预计将吸引大量投资机构涌入。对投资人而言,这是近几年少有的投资机遇,也是一大挑战,有着不小的投资门槛。

    彭博社的一份调研显示,DeepSeek的估值区间在10亿美元到1500亿美元之间,波士顿风险投资公司Glasswing Ventures创始人认为其估值最少有10亿美元,而Sweat Free Telecom创始人查纳基亚·拉姆德夫则认为,可能高达1550亿美元。

    作为对比,OpenAI的估值高达3000亿美元,马斯克的xAI估值提升至约750亿美元。

  • DeepSeek爆火一个月,豆包、Kimi们怎么样了?

    DeepSeek爆火一个月,豆包、Kimi们怎么样了?

    1月20日,前后相隔仅几小时的时间里,深度求索与月之暗面先后发布了技术路径相似的DeepSeek-R1及Kimi K1.5多模态思考模型。

    后来,OpenAI在论文里称,这两家中国AI公司同时独立发现了o1(OpenAI o1推理模型)的秘密。

    但从结果来看,二者南辕北辙。前者名声大噪,改写全球AI格局,后者却并没有太大声量。

    在此之前,不会有人想到一家由对冲基金公司孵化、没有进行任何广告投放的AI模型,能够在短短一个月的时间里,打破OpenAI神话,甚至让网友高呼:DeepSeek做空了美国!

    DeepSeek到底有多火?从数据可以窥探一二:

    微信指数显示,近30天,豆包、Kimi的微信指数平均值分别为3千万和2100万左右,而DeepSeek微信指数平均值达到了5.9亿,峰值更是逼近10亿,是豆包、Kimi的数十倍。

    至此,整个互联网由All in AI,开始向All in DeepSeek转向。

    那么,DeepSeek-R1诞生一个月,爆火至今,豆包、Kimi、文小言们如今怎么样了?

    一、拥抱派:腾讯元宝、文小言们

    DeepSeek的横空出世,让BAT等互联网大厂和月之暗面等AI六小龙们进一步分化,或拥抱DeepSeek、抢占优势与热潮开疆拓土,或自力更生、探究AGI业态的更多可能。

    这其中,拥抱DeepSeek的不在少数,腾讯更是其中代表。

    2月16日,腾讯方面确认微信已上线“AI搜索”功能,并正式灰度测试DeepSeek-R1模型,提供“深度思考”服务。

    而作为腾讯大模型终端应用,腾讯元宝在2月13日便悄悄更新,宣布接入DeepSeek;2月17日,腾讯自研深度思考大模型HunyuanT1也正式上线腾讯元宝APP,进行灰度测试。

    同时,腾讯元宝也在几乎同一时间加大了投放力度,似乎是为接入了DeepSeek与HunyuanT1的新版本助阵。

    ADX行业版数据显示,2月1日至14日,腾讯元宝投放力度始终保持在相对低位,日均投放素材量约2000组,2月15日起,投放力度迅速攀升,日投放素材量峰值超3400组,至2月18日,腾讯元宝日投放素材量再达新高6570组。

    尽管在自家AI助手中接入DeepSeek模型,会让人多少觉得有些“为他人做嫁衣”之感,但腾讯似乎并不在乎,反而从当下情况来看,包括元宝、微信、腾讯文档、QQ浏览器、QQ音乐、腾讯地图等应用在内,腾讯旗下至少十数款产品已经宣布接入DeepSeek大模型。

    DataEye研究院看来,腾讯的做法更像是有着自己的战略考量:利用外部模型及自身庞大信息量、用户量,打造AI时代的杀手级应用,并同时帮助腾讯内部大模型引流和迭代。

    除腾讯外,百度同样选择了拥抱DeepSeek。

    2月16日晚,百度搜索称将全面接入DeepSeek和文心大模型最新的深度搜索功能。但在百度旗下AI助手“文小言”APP上,只是通过DeepSeek-R1模型优化了“拍照解题功能”,还不能算正式接入DeepSeek-R1模型。

    不过即便如此,腾讯、百度的倾向性也十分明显。

    此外,AI六小龙中,阶跃星辰旗下“跃问”APP接入了DeepSeek-R1模型,MiniMax 01海外版也上线了DeepSeek-R1深度思考模式。

    随着腾讯、百度各自最核心产品微信、百度搜索、以及多款AI助手相继接入DeepSeek模型,这对搜索市场所带来的影响,或许也将在未来再次改变多数人的搜索方式与体验。

    二、自主派:字节豆包、Kimi们

    在自家AI助手应用中,接入竞争对手的AI模型,除腾讯等个别情况外,多数公司并没有这样的魄力。

    相反,同为大厂的字节跳动,甚至表现与腾讯大相径庭。

    如果说腾讯对待DeepSeek的态度是积极拥抱,那么字节跳动则可以称作极度保守。暂且不说“豆包”这一字节旗下最核心的AI助手应用,即便是其他边缘产品也几乎都没有接入DeepSeek。

    据统计,截至目前,字节系产品中仅有火山引擎及其旗下产品+飞书官宣上线DeepSeek系列模型。而火山引擎类云平台上架不同大模型本就是正常情况,因此严格来讲,字节系仅有飞书一款C端产品上线了DeepSeek模型,对比腾讯十几款产品拥抱DeepSeek的情况,二者态度天差地别。

    不过,这种态度似乎也代表着字节对自家豆包大模型的自信:字节或许相信,豆包大模型能够在不久的将来追赶上DeepSeek的水平。

    在DeepSeek-R1诞生前,豆包APP长期占据着国内AI助手类应用榜首位置。

    数据显示,2025年1月,豆包APP月活高达7861万,在国内AI类应用中位列第一,全球市场位列第二,仅次于ChatGPT。

    不过随着DeepSeek爆火,这样的格局正在被改写。

    点点数据显示,近30天豆包、DeepSeek及ChatGPT三款产品日活走势可总结为“一升两降”。其中,DeepSeek日活始终处于上升态势,尤其是1月26日、27日两天,日活迅速由几十万级别攀升至数百万,进入2月份之后,进入缓步上升态势。

    豆包与ChatGPT则在2月初期及之前保持在稳定态势,自2月初期开始,日活先后断崖式下跌,并保持至现在。

    可见,DeepSeek如今已经成为全球市场AI应用类产品日活TOP 1,而豆包日活大幅度下滑后,与下位者差距开始缩小。

    除豆包外,DeepSeek爆火后最被关注的另一款产品,当属月之暗面旗下的Kimi智能助手。

    单论技术能力而言,kimi或许并不算差。

    文章开头曾提到,Kimi K1.5模型与DeepSeek-R1同日发布,技术路径相似,被OpenAI称赞。

    2月18日,DeepSeek和月之暗面再次撞车,二者几乎同时发布了各自最新的论文,主题均是挑战Transformer架构最核心的注意力机制。

    因此,Kimi也并未接入DeepSeek模型,不过,在外界风评上,Kimi却总受到诟病。

    过去,Kimi凭借激进的投放策略,被外界认为过度依赖营销而非技术突破,曾单月付费投流金额超2亿元还一度登上微博热搜。

    但大肆投放之下,Kimi在用户量等方面仍旧赶不上豆包,如今DeepSeek爆火,更引发其对“重投放”策略的反思。

    这也导致Kimi如今最重要的一项改变:坚持基础模型SOTA、大幅缩减投放。

    消息称,DeepSeek爆火后,月之暗面内部复盘认为要坚持基础模型SOTA(State-of-the-art,当前最佳),接下来可能会重新训练基础模型,并抓紧应用层机会,内部选中的一个方向是一款面向深度研究领域的智能体产品DeepResearch。

    与此同时,媒体称月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。

    事实也确实如此:

    ADX行业版数据显示,自2月14日开始,Kimi智能助手投放力度便大幅下滑,2月15日投放力度几乎触底,至今维持在单日素材量1500组左右,较此前日均2万组投放素材量,大幅下滑了92.5%。

    三、DeepSeek时代,AI厂商的集体反思

    DeepSeek就像一条鲶鱼,一个月的时间内彻底搅浑了全球AI市场,引发各大AI厂商集体反思。

    字节跳动CEO梁汝波反思认为,DeepSeek-R1的长链思考模式并非业界首创。去年9月,OpenAI发布长链思考模型成为行业热点,字节虽意识到技术的重大变化,但跟进速度不足,若当时及时争先,或许有机会更早实现。

    而腾讯全体转向DeepSeek的表现,也一举扭转了外界对其在AI大模型领域战略模糊、动作迟缓的态度。

    对于腾讯而言,无论是自家大模型还是DeepSeek,只要技术能力达到了某个跨越式阶段,便能通过整合快速验证AI技术的实用性,并在现有的核心场景中建立AI时代的用户心智,微信接入DeepSeek刷屏全网便是最好的证明。

    与此同时,曾经的AI六小龙也站在新的十字路口。

    阶跃星辰、MiniMax选择拥抱,纷纷接入DeepSeek模型;百川智能继续加注AI医疗赛道;零一万物不再追求训练超级大模型,转而探索商用场景大模型能力的产业化落地;月之暗面、智谱AI则继续发力大模型与Agent智能体应用。

    过去的大模型叙事被打散,唯DAU论被推翻,所有人都被DeepSeek逼着往前再踏出一步。

    对于腾讯元宝们而言,接入DeepSeek并不等价于All in DeepSeek;对于豆包、Kimi们而言,不接入DeepSeek也不代表完全拒绝。

    有人一边在产品端提供最佳服务状态,一边为自研大模型争取迭代时间;有人不甘落后,调整策略聚焦技术攻坚。

    这大概是DeepSeek这条鲶鱼带给中国AI厂商们最好的反思。