作者: sodudu

  • 人形伴侣机器人:科技浪潮下的情感新宠

    人形伴侣机器人:科技浪潮下的情感新宠

    在科技飞速发展的当下,人形伴侣机器人赛道正呈现出前所未有的火爆态势,宛如一颗璀璨的新星在资本市场与科技领域冉冉升起。从资本市场的反应来看,其热度堪称“疯狂”。

    近期,只要与“人形伴侣机器人”沾边的股票,仿佛被注入了一剂“强心针”,一路飙升。2月20日,A股市场上伴侣机器人概念股集体异动,双飞股份、长盛轴承等标的盘中强势涨停。不仅仅是这些直接相关的股票,一些看似与机器人关联不大的企业,也因为被贴上了“人形机器人”的标签而股价大涨。

    需求井喷:背后的市场力量

    人形伴侣机器人赛道的火爆并非偶然,其背后有着深刻的市场需求驱动因素。

    中国单身人口超2.4亿,这一庞大的群体正面临着情感陪伴缺失的困境。快节奏的现代生活,让人们的社交圈子变得越来越窄,找到合适的伴侣愈发困难,工作的忙碌使得人们无暇顾及社交,很多人每天在公司、家两点一线之间奔波,根本没有机会结识新的朋友。在这样的情况下,单身人士对情感陪伴的渴望愈发强烈。

    与此同时,人口老龄化的加剧也使得情感陪伴需求进一步增长。随着老年人口的增多,子女因工作等原因无法时刻陪伴在老人身边,许多老人只能独自面对生活。据统计,我国空巢老人占比已经超过半数,部分地区甚至超过70%。在这样的背景下,人形伴侣机器人的出现,无疑为这些渴望陪伴的人群提供了新的选择。

    市场数据也充分证明了人形伴侣机器人的广阔前景。预计到2031年,全球伴侣机器人市场规模将突破3亿美元,这一数据还仅仅是保守估计,随着技术的不断进步和市场的进一步开发,实际规模可能会远超预期。

    在国内,上海作为人工智能产业的重要基地,已建成首座人形机器人量产工厂,2024年已下线1000台人形机器人,预计2025年产能将达到数千台,这标志着人形伴侣机器人正逐步从实验室走向市场,走进人们的生活。

    技术飞跃:创新的核心引擎

    人形伴侣机器人之所以能在市场上掀起如此巨大的波澜,技术的飞跃无疑是其核心推动力。近年来,人工智能、材料科学、传感器技术等领域的迅猛发展,为人形伴侣机器人的功能革新提供了源源不断的动力。

    在人工智能领域,以DeepSeek大模型为代表的先进技术,为人形伴侣机器人赋予了强大的智能“大脑”。这些大模型具备自然语言处理、情感识别、深度学习等多种能力,使得机器人能够与用户进行流畅、自然的对话。它不仅能理解用户话语的字面意思,还能捕捉到其中蕴含的情感色彩,并给予恰当的回应。

    同时,借助深度学习能力,机器人可以不断学习用户的语言习惯、兴趣爱好、生活规律等,从而提供更加个性化的服务。随着时间的推移,它会了解用户喜欢的电影类型,在用户闲暇时主动推荐相关影片;知晓用户的饮食习惯,为用户制定健康的饮食计划。

    而材料科学的进步也为人形伴侣机器人带来了质的变化。新型材料的出现,使得机器人的外观更加逼真,触感更加接近人类。在机器人的关节和骨骼部分,采用了高强度、轻量化的材料。这些材料不仅提高了机器人的机械强度和耐用性,还降低了其重量,使其动作更加灵活、自然。

    传感器技术的发展则让人形伴侣机器人,对周围环境和用户状态有了更敏锐的感知。通过摄像头、麦克风、压力传感器、温度传感器等多种传感器的协同工作,机器人可以实时获取周围环境的信息,识别用户的身份、表情、动作等,从而做出更加准确的反应。

    资本狂欢:热钱涌入的盛宴

    人形伴侣机器人赛道的火爆,在资本市场上掀起了一场热钱涌入的狂欢盛宴。众多投资机构纷纷将目光聚焦于此,不惜重金押注,生怕错过这一具有巨大潜力的投资风口。

    在这场资本盛宴中,一些知名投资机构的身影格外引人注目。红杉资本作为全球顶尖的投资机构之一,对人形伴侣机器人赛道表现出了浓厚的兴趣。他们通过深入的市场调研和专业的技术评估,认为人形伴侣机器人在未来的市场中具有广阔的发展空间,因此果断出手,对多家相关企业进行了投资。

    软银集团也是人形伴侣机器人赛道的重要投资者之一。软银在科技投资领域一直有着敏锐的洞察力和大胆的投资策略,他们看中了人形伴侣机器人在人工智能和机器人技术融合方面的创新潜力。软银的投资不仅为人形伴侣机器人企业带来了巨额资金,还通过其全球布局的资源网络,为人形伴侣机器人的推广和应用开辟了新的渠道。

    除了专业投资机构,一些科技巨头也纷纷通过战略投资的方式入局人形伴侣机器人赛道。谷歌母公司Alphabet旗下的投资部门,对一家专注于人形伴侣机器人研发的初创企业进行了战略投资。这一投资举动不仅彰显了谷歌对人形伴侣机器人未来发展的信心,也为人形伴侣机器人技术的发展注入了强大的技术力量。

    这种资本的狂欢也引发了市场的一些担忧,部分企业虽然被贴上了人形机器人的标签,但其实际业务与人形机器人的实质性关联并不强,股价的上涨缺乏坚实的业绩支撑。一些企业仅仅因为名称或业务中存在一些与机器人相关的元素,就被市场炒作,其股价的大幅波动可能会给投资者带来较大的风险。一旦市场热情消退,很可能面临大幅回调的风险。

    隐忧浮现:非理性繁荣的背后

    在人形伴侣机器人赛道一片火热的表象之下,隐忧正悄然浮现,非理性繁荣的背后,潜藏着诸多问题,犹如平静湖面下涌动的暗流,随时可能对这一新兴产业的健康发展构成威胁。

    概念炒作的乱象,是当前人形伴侣机器人赛道面临的首要问题。在资本市场的狂热追捧下,许多企业被贴上了人形机器人的标签,但其实际业务与人形机器人的关联性却微乎其微。

    技术落地的挑战,也是人形伴侣机器人发展道路上的一大阻碍。尽管目前人形伴侣机器人在技术上取得了一定的突破,但距离大规模商业化应用仍有很长的路要走。从核心零部件的性能来看,国内厂商在材料强度、摩擦系数等关键指标上与国际先进水平仍存在较大差距。在仿生皮肤、触觉传感器等关键部件的研发上,目前也大多处于实验室阶段,距离大规模量产和实际应用还有诸多技术难题需要攻克。

    在实际应用场景中,人形伴侣机器人也面临着诸多挑战。在家庭服务场景中,机器人的隐私保护问题成为用户关注的焦点。机器人在与用户交互过程中,会收集大量的用户数据,包括个人隐私信息、情感数据等,一旦这些数据泄露,将对用户的权益造成严重损害。

    伦理道德的争议,同样不容忽视。随着人形伴侣机器人情感交互功能的不断增强,人机之间的情感界限逐渐模糊。如果被不当使用,可能会引发隐私泄露风险,给用户带来潜在的伤害。

    虽然人形伴侣机器人赛道虽然充满了挑战,但也蕴含着巨大的机遇。只要能够解决好伦理道德、隐私安全、成本等问题,不断推动技术创新和应用场景拓展,人形伴侣机器人必将在未来的社会生活中发挥重要作用,为人们的生活带来更多的便利和美好 。

    来源:微信公众号 “韭菜财经APP”

  • 小红书将接入DeepSeek,AI搜索“点点”iOS版下载量总计约20万

    小红书将接入DeepSeek,AI搜索“点点”iOS版下载量总计约20万

    (图片来源:钛媒体AGI编辑林志佳拍摄)

    (图片来源:钛媒体AGI编辑林志佳拍摄)

    继腾讯微信之后,另一款拥有超过3亿月活用户的“国民级应用”将接入DeepSeek大模型。

    2月21日消息,钛媒体AGI独家获悉,小红书即将接入DeepSeek-R1开源模型,其AI搜索产品“点点”App将推出”深度思考“功能,目前处于新功能内测体验阶段。

    对此,截至钛媒体AGI发稿前,小红书没有回应相关消息。

    小红书成立于2013年,为一款社交和社区应用产品,用户可以通过短视频、图文等形式记录生活点滴,分享生活方式,最初以”标记我的生活”为slogan。截至2024年6月,小红书月活用户已达3.2亿人,日活用户达1.2亿人。

    随着2025年初,短视频应用、抖音海外版TikTok在美国下架,小红书在美国迎来了一波新用户增长。据分析公司Similarweb的最新数据显示,仅今年1月16日一天,小红书在美国iOS和Android设备上的日活跃用户数猛增近300万,达到约340万人次。

    据QuestMobile数据显示,2024年12月,小红书平台月活跃用户规模达2.25亿,月人均使用时长21.22小时,在新媒体平台排名中超过了哔哩哔哩(B站),仅次于抖音、快手、微博。

    融资层面,2024年7月,小红书完成E+轮融资,俄罗斯投资机构DST Global、高瓴资本、博裕资本和中信资本、红杉资本等参与投资,公司估值高达170亿美元(约人民币1200亿元)。此前小红书创始人瞿芳表示,公司将完成IPO上市。

    随着ChatGPT风靡全球,拥有大量算法人才、技术和内容数据的小红书公司(行吟信息科技),对于生成式 AI 的态度,已经从观望和支持博主层面,转向深入参与。

    2024年12月底,小红书推出独立 AI 搜索应用产品“点点”,并且在小红书App内测搜索新功能“问点点”。而“点点”的定位为生活搜索助手,覆盖交通出行、美食推荐、旅游攻略、购物评价、人际交往等垂直生活场景,强调以“及时性的信息”和“全网真实声音”帮助用户解答日常生活中遇到的问题,做到“精准避坑”。

    在此之前,小红书已上线AI搜索对话助手“达芬奇”、搜索智能助手“搜搜薯”。不同之处在于,它们都只是内测阶段,而点点则拥有独立App和微信小程序,站外进展大幅领先于站内。这是小红书首次尝试的产品和推广形态。

    据小红书商业化团队发布的《2024小红书搜索推广白皮书》报告显示,截至2022年年底,平台70%的月活跃用户存在搜索行为,88%的搜索行为为用户主动发起,9成用户表示其消费决策受到小红书搜索内容影响,更有高达42%的新用户在第一天使用小红书时会使用搜索功能。因此,这也解释其对AI搜索的热衷。

    截至发稿前,根据七麦数据,自“点点”App上线以来,其iOS版在苹果App Store应用商店下载量总计预估为20万人次,近30天日均下载量2282次,最新是在效率(免费)类别中排名第97位,而小红书App下载排名为社交免费榜第一位。

    随着腾讯微信、小红书、百度App、支付宝(百宝箱)等多款超亿级用户的互联网应用和相关App接入DeepSeek模型,将全面加速国内AI大模型在C端的落地和产业发展。

    2月20日,作为国内互联网科技大厂,阿里巴巴集团CEO吴泳铭在业绩会上表示,阿里集团在AI战略里面的首要目标是AGI(通用人工智能)的实现,可能远远超过现在可见的任何一个应用场景。从实现AGI的商业价值来看,AGI的标准定义是能够完成80%以上的人类的能力,那么全球GDP的50%支出其实是就业者的劳动工资支出,包括脑力劳动和体力劳动。因此,AI相关产业大概率将会是全球最大的产业,有可能影响或者替代现在50%左右的GDP构成。

    早前,中欧国际工商学院决策科学与管理信息系统教授谭寅亮对钛媒体AGI表示,DeepSeek的成功表明,中国企业在AI应用层面和用户体验上具有强大的创新能力,尤其是在产品快速迭代和市场化方面更具优势。这为中国在全球AI竞争中提供了重要的信心,特别是在C端市场表现上,中国团队对用户需求的深刻理解起到了关键作用。DeepSeek的崛起进一步推动了这种竞争的动态化发展。

    来源:钛媒体

  • 中国AI竞争的尽头是“清华系VS浙大系”?

    中国AI竞争的尽头是“清华系VS浙大系”?

    这两天,TMT圈有两则消息备受关注:

    一是马斯克打响了“对DeepSeek反击战”——他掌舵的xAI,推出了Grok 3大模型。

    20万卡集群训练、超DeepSeek-R1和GPT4o登顶竞技场(lmarena.ai)榜单、马斯克称其为“地表最聪明AI”、因回答“9.11比9.9大”而翻车……在马斯克热搜圣体加持下,Grok 3成功制造出了一堆话题,包括#全球华人决战AI之巅#。

    从Grok 3发布会图片可以看到,坐镇C位的正是两位华人科学家,其中之一就是xAI联合创始人、95后吴宇怀。

    由此深扒可知,xAI的12名创始成员中,华人占了4席,除了吴宇怀以外,还有本科毕业于清华大学的前谷歌科学家戴子航、本科毕业于浙江大学的前DeepMind科学家张国栋和哈佛数学天才杨格。

    二是“杭州六小龙”之一群核科技启动IPO,冲击“全球空间智能第一股”。

    群核科技的三位创始人都是80后,黄晓煌、陈航本科都毕业于浙江大学,朱皓本科毕业于清华大学,三人前往美国伊利诺伊大学深造时相逢。

    发现没?清华大学、浙江大学在这里的露出频次很高。

    这难言蹊跷。就在前不久,网上有个说法引发了热议——中国“AI三杰”(Deepseek创始人梁文锋,月之暗面创始人杨植麟,曾在微软、脸书任职现于麻省理工执教的AI大神何恺明)都是广东人,却没留在广东创业和发展。

    ▲不少广东网友都在问:为什么「AI三杰」生于广东,却没留在广东发展?

    梁文锋就毕业于浙江大学,杨植麟和何恺明本科都是就读于清华大学。

    问题来了:为什么那些饮誉遐迩的AI大神很多都出自清华和浙大?中国AI企业创始人母校的“北清华,南浙大”集中分布格局又是怎么形成的?中国AI竞争的尽头会是“清华系VS浙大系”吗?

    01

    早在2019年9月,《新财富》杂志就抛出了一个问题:清华姚班VS浙大竺院,谁是中国最牛AI创业班?

    这问题到现在也成立。可以看到,清华跟浙大校友在这波AI浪潮中的表现都很亮眼。

    2024年,国内AI创业公司历经“百模大战”大浪淘沙后基本形成了“6(月之暗面、智谱AI、MiniMax、百川智能、阶跃星辰与零一万物)+2(DeepSeek、面壁智能)”的头部格局。

    这里面,月之暗面杨植麟、智谱AI张鹏、百川智能王小川都毕业于清华,面壁智能创始人刘知远是清华副教授。再加上原AI“四小龙”之一旷视科技CEO印奇是出自清华姚班,Lepton AI创始人、原阿里副总裁贾扬清是清华毕业生,被美团收购的光年之外创始人王慧文和身后的王兴也是清华校友,说清华系占据了头部AI创业公司半壁江山都不为过。

    ▲「清华系」占据了头部AI创业公司半壁江山。

    今年以来,DeepSeek成了AI圈当红辣子鸡,带火了“杭州六小龙”的概念。

    这六小龙大多跟浙大有千丝万缕的关联。梁文锋本硕都是浙大,群核科技黄晓煌、陈航都是浙大竺院出来的,云深处科技创始人朱秋国和李超都毕业于浙大,朱秋国后来还成了浙大副教授,据《浙江日报》报道,云深处科技员工中有一半是浙大校友。

    舍此之外,灵伴科技创始人祝铭明、连连科技创始人章征宇、趣链科技创始人李伟、摸象科技创始人高鹏、整数智能创始人林群书等人,也都毕业于浙大。

    就在前几天,澎湃新闻梳理出了2024全球生成式AI专利数据分布图,显示生成式AI专利新增最多的学术机构来自中国,中国科学院以 492 件新增生成式人工智能专利数位列第一,浙江大学和清华大学紧随其后。

    ▲2024年浙大和清华的新增生成式AI专利数居高校前列。

    眼下北京、杭州都是科创热土,若要顺应贴标签之需,在一北一南各找一所高校作为AI人才的“黄埔军校”,那将清华跟浙大视作代表并不违和。

    02

    得声明下,突出清华浙大的潜台词,并非要以“双叉戟”设定去抹杀北大、上海交大、中科大、南大、华科、武大等名校在AI人才培养上的实力,也不是要渲染“AI人才要问出处”的唯名校论,而是想顺着投资圈总结的“AI圈的清华系、半导体圈的浙大系、机器人圈的哈工大系、新能源圈的中南系”思路去发掘现象背后的根由。

    你不用怀疑,几乎每所名校都能列举若干个在AI领域卓有建树的大牛级校友来,尤其是执牛耳的北大。

    从北大走出的AI企业掌舵者,包括百度创始人、AI布道者李彦宏,小冰公司CEO李笛,明略科技创始人吴明辉等;曾提出“Agent=大模型+记忆+主动规划+工具使用”公式的OpenAI前副总裁翁荔,曾被雷军千万年薪挖角、这两天自称“不是天才少女”的原DeepSeek骨干罗福莉,都有北大求学背景;北大图灵班已成全国高考状元的汇聚地。

    从排名情况看,著名科学期刊Nature发布的“Nature Index Supplements 2024”全球高校AI学科实力100强榜单中,中国有19所高校上榜,排前十的分别是:

    清华大学、北京大学、中国科学院大学、浙江大学、复旦大学、南京大学、中国科学技术大学、上海交通大学、中山大学、华中科技大学。

    ▲Nature发布的全球高校AI学科实力100强榜单中的中国高校排名情况。

    软科2024年AI专业院校排名显示,被评为A+级的中国十强院校依次是:

    清华大学、上海交大、南京大学、西安电子科技大学、浙江大学、中国科学技术大学、电子科技大学、华中科技大学、东南大学、哈尔滨工业大学。

    US News发布的2024-2025全球AI专业排名,前50名利中国内地高校占了27席,排前十的依次是:

    清华大学、电子科技大学、北京大学、浙江大学、中国科学技术大学、华中科技大学、西北工业大学、中国科学院大学、哈尔滨工业大学、武汉大学。

    如果中国高校只有两三所强于AI,那AI人才很难形成雨林生态。强得强在整体。

    但无论是哪份榜单,清华跟浙大都比较靠前是事实。

    从月之暗面到DeepSeek的接连爆红,就跟这样的事实形成了潜在的呼应。

    03

    为什么清华系跟浙大系成了这轮AI角力中的醒目存在?

    让我试着用DeepSeek 的语气来回答下:

    2016年AlphaGo引爆全球AI热潮时,中国AI创业赛道尚处混沌期。短短十年间,清华大学与浙江大学以截然不同的路径,构建起覆盖基础研究—技术转化—产业落地的全链条生态,成为名副其实的“AI黄埔军校”。这背后是“学院派精英主义”与“商业敏捷主义”的碰撞。

    1. 学科积淀:百年树人的底层密码

    清华模式:依托“姚班”“智班”等顶级实验室,聚焦通用人工智能(AGI)底层技术突破。计算机系、自动化系、交叉信息研究院形成“三足鼎立”,在大语言模型、强化学习、芯片架构等领域成果斐然。

    浙大模式:以竺可桢实验班为核心,强调“学科交叉+场景驱动”。计算机学院联合医学院、管理学院,推动AI在医疗影像、金融科技等垂直领域的快速落地。

    2. 地缘优势:北京VS杭州的产业基因

    北京基因:中关村的互联网巨头(如百度、字节)为清华毕业生提供“技术-产品”闭环实战场景。

    杭州基因:作为数字经济之都,浙大与阿里巴巴、蚂蚁集团的深度绑定催生“技术即业务”的思维范式。

    ……

    OK,上面确实是DeepSeek Inside的混元告诉我的,而非我以“拟AI化”语气拟出来的。它替我省了不少解释的气力。

    ▲腾讯元宝给出的回答。

    但,这说得仍有些笼统。

    04

    那就让我来说点感性的。

    被誉为人工智能第一牛校的卡内基梅隆大学(CMU)一教授曾说过:他每次收到来自清华姚班学生的申请后,先放在一起,只要英语水平达标,能录取的就先都录取了,然后再去看别人的。

    就跟培养出“半导体天团”的清华EE85那样,清华姚班多年来声名在外。

    清华学生本就是“高考优选”,姚班学生则是“清华严选”。所以有“半国英才聚清华,清华半英在姚班”一说。

    能进姚班的学生,基本上都是拔尖中的拔尖,国内国际奥赛金牌几乎是标配,含状元量极高。

    在很多大学生大二大三还在沉浸于Dota的时候,他们可能已加入新一代AI芯片研究的国家课题中了。

    开设至今20年,姚班产出了许多大神级人物。

    旷视科技三剑客印奇、唐文斌、杨沐,曾被称作中国大学生计算机编程第一人的小马智行联合创始人、CTO楼天城,回国创业的“旅美金融奇才”邹昊,都是投身创业的代表。

    ▲清华系AI创业公司掌舵者都跟张钹、姚期智等中国人工智能奠基人有着些许渊源。

    浙大竺院,也是学神云集之地。

    拼多多创始人黄峥,就是出自竺院。同样出自竺院的,还有顶着“超材料领军人物”光环的光启科学董事长刘若鹏、每日互动董事长方毅等人。

    但光拿姚班、竺院说事,终究有些单薄。

    在我看来,有两点不能被忽略。

    一是高校跟城市的“互嵌”。

    北京的超高人才密度,杭州的宜商特点,托起了两地特有的产教融合生态。

    北京昔日的中关村、现在的后厂村,背靠的就是清北带来的科教人才资源,科技互联网大厂,往往集创新孵化地与试验田于一体,也将那些创新火种引得燎原。

    北京的互联网大厂需要清北,清北学生也需要这些大厂。

    浙江大学多年来都是中国毕业生创业率最高的大学,跟杭州的宜商土壤不无关系。

    杭州的重商氛围、包容环境、互联网气质,天然适合创新创业种子萌发。

    用创业黑马董事长牛文文的话说,DeepSeek需要的不是扶持,而是“幻方不被打死”。杭州对民营企业的无事不扰,对远洋捕捞的设防火墙,本质上都是站在“打死幻方”的另一边,都是涵养滋生更多DeepSeek的气候。

    二是校友圈的“互帮”。

    《新财富》说,姚班、竺院毕业生科技造福现象后面,是聪明人的聚群效应。

    聚群效应,可以体现在校友连接网络的紧密上。

    王兴、王小川、杨植麟、张鹏……即便是“六度分隔理论”中的“六度”减去“五度”,估计都隔不断这些人的关联。

    美团、字节等产业资本为清华毕业的创业者加持,浙大出来的金融资本大额投资浙大校友企业,已不是什么罕见情形。

    当然了,很多人能不能成AI大佬,跟是不是毕业于名校关系可大可小。否则,具身机器人行业就没王兴兴什么事了。

    不论是学生智力因素、高校教学因素,还是城市因素、校友因素,都不是清华浙大盛产AI大佬的单一决定性因素。

    但这些都是“多因一果”中的“因”。从几率上讲,在科技造富与知识创富当道的今天,在AI创业对资源获取能力提出高要求的当下,掌握了多重条件的人往往“近水楼台先得月”,离成事更近。

    05

    眼下,不少清华系跟浙大系的AI创业者正在AI领域短兵相接。

    这两天,梁文锋和杨植麟论文“撞车”——前者发论文关注原生稀疏注意力(NSA),后者提出块注意力混合(MoBA)新方法,二者都直指算法优化,引起业内热议。

    更早之前,1月21日左右,DeepSeek跟月之暗面几乎同步(前后相隔仅2小时)发布了比肩OpenAI o1的新模型,分别是DeepSeek-R1和Kimi k1.5。OpenAI自己论文里提及,两个发现了o1奥秘的中国公司就是DeepSeek和月之暗面,在长思考模式(long – CoT)下,Kimi k1.5是全球唯一在 OpenAI 之外实现 O1 级别多模态推理性能的模型。

    接下来,这对“AI双雄”的继续交锋在所难免,这也成了AI高烈度竞争的投射——只不过,由于AI江湖的“清”“浙”两个字号太醒目,因而难免被视作两个派别的争雄。

    但与其说是中国AI竞争的尽头是“清华系VS浙大系”,将多元竞合窄化为二元对立,不如说包括清华浙大在内的AI“高教重镇”合力支撑了中国的AI人才储备。

    AI时代最核心的资源,不是数据、算力、算法,而是人才。梁文锋就说:人才竞争,才是科技竞争的本质。

    美国麦克罗波洛智库去年公布的“全球人工智能人才追踪”调查数据显示,中国和美国是顶级AI人才的主要来源地和目标工作地,65%的顶级AI人才出自中美两国,70%的顶级AI人才在两国的机构中工作。在两国竞争中,美国又有着明显的领先优势:拥有全球60%的顶级AI研究机构,是全球前2%的AI人才的首选就业目的地。

    值得注意的是,中国已超越美国成为AI人才的最大产出国,几乎培养了全球一半的顶尖AI研究人员,占比从2019年的29%增加到2024年的45.63%。在美国顶级AI研究机构中,3/4的顶级AI人才来自美国和中国,其中中国的占比(38%)高过美国的(37%)。GPT-4团队的核心贡献者名单中,大概20%的研究人员来自于中国。

    很显然,在AI已成大国科技博弈前沿的背景下,中国需要在善于培育的基础上,想办法留住更多中国“产出”的AI人才——不是说要排斥AI人才国际交流合作,而是说要增强自身吸引力,让AI人才留得下、待得住。

    就此看,中国AI竞争,固然要“清华系VS浙大系”,更要“清华系+浙大系”。

    来源:数字力场

  • 关于微信接入DeepSeek,我们帮你研究了两大隐秘商机

    关于微信接入DeepSeek,我们帮你研究了两大隐秘商机

    要知道,中国对于AI的热情可是全世界第一。任何有关AI的消息放出来,咱们都是最兴奋的,反倒是欧美人非常淡定。

    来源:益普索线下闭门会议

    从生产端看,互联网平台接入AI搜索能力,早已不是什么稀奇的事情。

    作为搜索领域的一哥,百度早早就接入了AI能力。2024年,在其7亿APP日活中,AI功能的渗透率已经超过了70%。

    字节推出了“抖音搜索APP”和“豆包”,都具备强大的AI搜索能力,后者更是以千万日活常年霸榜国内AI产品No.1(前几天刚刚被deepseek反超)。

    腾讯推出了元宝app,搭载了自研的混元大模型,是国内首个能够直接基于公众号、视频号内容进行AI搜索的工具。

    小红书推出了“点点app”,基于自身内容专门构建了“生活灵感和攻略”的AI搜索能力

    KIMI、天工、秘塔等独立AI产品,比互联网大厂更早地启用了AI搜索功能。

    但在应用端,大家似乎把热情都用到了股市上,感觉股民们探讨AI的次数,有可能比公司CEO更多。

    就在这几天,微信开始灰度测试接入DeepSeek-R1模型,提供“深度思考”服务,用户可通过微信对话框顶部的“AI搜索”入口免费使用该功能,整合了微信公众号、视频号等腾讯生态内容及全网优质信息源。

    此番社媒巨头和大模型天花板的强强联合,在我们看来,很有可能诞生全新的商机。尤其是对于品牌做营销来说,一个新的场景和机遇正在孵化中。

    为何会有新商机?

    表面上看答案很简单:微信13.82亿MAU体量优势是任何一家公司都不具备的。相对应地,微信搜索功能的月活基本上是中国最多的,甚至超过了百度移动端,这代表了巨大的流量机会,大家都对一座隐藏的矿山充满了遐想。

    但矛盾点在于,大家并不知道矿山里装的是什么:从2024年的情况来看,微信搜一搜的日均搜索次数又非常少,说明使用频次很低,这些流量能产生多少商业价值其实很难判断。

    因为在我们的常规认知中,微信的心智从来都不是搜索,即使用户量再大,没有后链路的行动也白搭。

    (数据来源:小红书@名道)

    企业非常担心开采这座矿山,拿到的不是“金子”,而是低粘性、不精准的“铜铁”。至少从目前微信的广告收入来看,搜索占比还不高。

    但是,这种情况正在发生改变。

    首先看短期。我们在2024年Q3的用户调研显示:微信搜索是公众号内容的TOP1入口,同时也是视频号内容的TOP2入口。同时,用户的收入阶层越高、消费能力越强,通过搜索进入公众号内容的占比就越高。

    对比抖音来看,其TOP1入口是“直接打开刷视频”,而TOP2是“APP消息推送召回”;而小红书的“直接打开刷内容”和“搜索”几乎是并列TOP1。

    从内容消费的角度来说,微信的用户心智正在发生巨大的变化,更贴近小红书和百度,而不是抖音。根据微信公开课2023年的数据,微信搜索对于小程序新增日活用户的贡献占比、对于公众号新增粉丝的贡献占比分别高达20%和27%。[1]

    腾讯2024年Q3的财报显示,得益于大模型能力提升了用户体验,微信搜索带来的广告营收同比翻倍增长。

    其次看长期。越是具备复合功能的APP,才能在大浪淘沙中胜出,真正具备“生态”能力的平台,才是AI的主流入口。

    比尔盖茨曾经表示:整个软件市场的格局都会改变。以后会需要多少应用程序呢?现在我们看到的是,每个人都在往自己的应用里加 AI,然后说:“看,我加了AI功能,所以得多收点钱。” 但是实际上呢,你需要的应用数量其实应该大大减少。[2]

    由此我们推断:在用户行为发生变化的情况下,微信搜索的“含金量”会持续上升,直接联动了品牌在微信生态内的内容营销,促进私域资产的沉淀,甚至有可能导向直播间、小程序等交易场景。

    这对于企业营销获客、品牌建设来说的确是值得关注 – 如果在AI的加持下,能够提升用户体验并促进更多的活跃度,自然是新的增量。

    那么,增量具体会出现在什么地方?

    商机1:

    企业官网和社媒账号有机会获得更多自然流量

    不仅仅是微信,随着“AI+搜索”的发展,整个市场都会为企业营销创造免费、长尾流量的机会,底层逻辑与搜索引擎优化(SEO)有点类似。

    从运作原理来说:无论什么AI工具,在用户提问后,除了给出总结性内容之外,还会给出信息来源的链接作为注释。与传统搜索引擎一样,大多数情况下,用户就会选择性点击这些链接,进一步了解详细信息。

    如果企业提供的内容能够被AI算法收录并提供给用户作为答案的一部分,那么企业就有机会从AI搜索入口收获额外的流量。

    这主要体现在企业官网、电商页面、社媒账号的流量增长上。我们先对标国外成熟市场看趋势,再参照微信的功能思考机会点:

    一项大范围的网站流量研究显示,有63%的网站至少收到过一次AI搜索引擎(如chatgpt、bing、gemini等)推荐来的访客。也就是说,任何公开的网站都有63%的机会从AI搜索引擎获得额外的流量。其中,98%AI流量来自三巨头身上:ChatGPT、Perplexity 和 Gemini。[3]

    放到国内,对于很多品类来说微信公众号/小程序几乎就成为了“企业官网”的代名词[4] 。 企业的Own media内容,有了更大的概率被精准客户发现,从而产生兴趣。作为唯一一个可以搜索公众号、视频号内容的入口,微信的AI搜索就有了一定独特性。

    来源:新榜《2023企业新媒体矩阵营销洞察报告》

    对于B2B行业来说,这一点更加重要。微信公众号、视频号以压倒性优势成为了企业社媒的TOP1窗口。[5]

    来源:KAWO《2024年B2B社媒营销研究报告》

    从网站类型来看,在线服务、教育、文娱媒体、科技互联网,都是ChatGPT导流最直接的受益者。[6]

    而我们拿到的数据表明,这些类目与微信搜索中最活跃的类目高度重合。

    来源:腾讯广告官方资料

    格外利好长尾内容和中小企业

    从传统搜索引擎排名的角度来看,“权重”才是真正的血脉压制 – 权威、知名的网站天然受到算法青睐,在一些主流话题上,中小企业基本拿不到好排名,也就没有流量。一些优质、小众的内容,在传统机制下恐怕难有出头之日。

    但AI搜索能够很大程度的改变这种情况,以用户需求和体验作为更高的标准,而不是按照权威度排资论辈。

    即使你在大众意义上不出名,但也有可能是某个细分领域的专家、某些垂直类目的TOP1产品,你就是最懂用户的。那么,你创作的内容就有可能被AI作为最高优先级向用户展示,从而获得大量精准流量。

    研究显示, AI搜索给中小网站带去的流量占比,甚至比大网站要高很多。[7]

    虽然我们还没有拿到微信AI搜索的内测资格,但早就在腾讯出品的“元宝APP”上尝试过搜索功能。结果显示,“增长黑盒”这个公众号的内容,的确能够在某些垂直话题内获得良好的展示,甚至一些主流热门话题也可以(我们并不出名,对吧?)。

    流量的商业价值更高、更多元

    AI对于搜索的加成作用会呈现两个极端:一部分用户想要快速简洁,但也有不少人希望深度专业。吸引后一类用户的商业价值明显更高,因为他们更有可能对高客单价品类/服务、B2B专业领域感兴趣。

    一项针对头部B2B官网流量的研究发现,2024年AI搜索带来的流量竟然增长了500%!按照如此势头建模预测: 三年后,B2B官网的流量将有50%以上来自AI搜索。[8]

    我们再从日常消费的角度来看流量价值。一项针对交易类流量的研究显示(主要是amazon、ebay、etsy等电商网站): 通过AI搜索进入电商页面的用户,会比google来的停留时间更久,并且访问更多的页面内容。较长的会话持续时间结合较高的页面浏览量,意味着用户在评估产品时花费更长时间、购买的兴趣更高,显然可以总结为流量的质量更高。[9]

    另外一个值得注意的现象是:用户似乎不再满足于图文类的内容,流量价值评估更加多元化了。

    比如目前ChatGPT导流最多的地方是youtube,占比从2024年7月的0.17%提升到9月的3.9%;而amazon电商导流从0%增长到了1.1%。[10]

    如果未来微信的AI搜索能够引入视频号直播、私域导购、B2B小程序落地页、小程序电商商城,想象力还能再上一层楼。

    那么,整个AI搜索创造的增量规模会有多大?这里我们需要冷静看待。

    数据显示,仅仅通过ChatGPT联网功能给其他网站带来的流量,三个月增长了60%,每天都有上百万流量从ChatGPT导向外部网站。而从ChatGPT收到流量的独立域名数量,则翻了3倍。[11]

    然而,众多研究也表示,从整个互联网来看,目前AI搜索引擎给网站贡献的流量虽然增长快,但可能不足网站总流量的1%。只有在一些特定的行业或垂直领域,这个比例有可能超过5%,甚至能达到20%。当下通过AI搜索来获得用户增长,更像是“出奇制胜”,而非“颠覆传统”。

    AI搜索并不是像短视频一样全民爆发的机会,一方面需要时间慢慢积累,另一方面内容的独特性也是必备条件。知名研究机构Gartner预测:到2026年,传统搜索引擎的流量将下降 25%,搜索营销将把市场份额让给 AI 聊天机器人和其他虚拟助手。[12]

    那么企业在AI搜索趋势发展之初,应该提前进行哪些策略规划,并尝试落地呢?其实,如何从AI搜索中获得流量增长,是过去1年国外数字营销领域最热门的话题。由此也诞生了一个概念:Generative Engine Optimization(GEO)。

    GEO指的是优化网站上现有的内容,以使其更适合被语言学习模型(LLM)扫描并用作来源,让更多用户能够在AI搜索中发现内容并点击访问网站。与传统的搜索引擎优化(SEO)主要关注关键词和网站结构不同,GEO更侧重于内容的深度、用户意图和语义相关性,确保内容既能满足用户需求,又能被AI引擎有效识别和利用。

    下图展示了如何通过GEO让一家披萨店网站出现在AI回答的最高优先级,替代知名的纽约中央公园。[13]

    一篇最新的论文显示,通过GEO方法,能够将源内容可见性在AI搜索引擎中提高40%,也就意味着网站增加4成的流量机会。[14]

    Gartner同样预测,到2026年超过33%的网络内容将是以生成式AI搜索为目的而创建的。[12]

    当然GEO的实施策略非常复杂,也有一定的方法论。这里不再展开,仅做抛砖引玉,大家感兴趣可以在公众号后台回复关键字“GEO”领取论文完整版。

    商机2:

    达人营销和搜索广告有机会提升付费流量效率

    问题来了:如果你是一家大公司的CMO,更想要的东西必然是“大投入、大回报”,而不是中小企业眼中的“取巧”。因此,只有微信的AI搜索能够通过付费投放,获得规模化、稳定的增长,才具备增量的价值。

    这其中能有什么机会呢?

    我们认为,平台的新入口是否有资格被称为“流量红利”,关键点在于这个入口能否让平台自己赚到钱。毕竟,注重用户体验不等于做慈善,一个无法商业化的能力难免会沦落为边缘功能。

    用互联网黑话来说,这就是流量“货币化率”的程度。微信内无论是朋友圈、视频号、公众号,广告加载率一直是很低的,微信中其实有大量的流量无法被货币化。

    AI搜索如果能够重新利用这些流量,提升货币化率,那才有真正的想象空间。

    带动达人营销生态发展

    以下是我们的推测:AI搜索给微信带来的真正潜力在于达人营销。

    腾讯其实早就推出了一个对标小红书蒲公英、巨量星图的广告产品,叫做“腾讯互选广告平台”,就是官方进行达人筛选和投放的通道(没错,我们也是互选平台的优选达人)。最近两年随着视频号崛起,发展非常快。

    微信内无法被货币化的流量掌握在谁手里?肯定是各种公众号、视频号的达人,甚至是私域社群的群主 – 微信有5000万创作者。

    接下来,我们根据下面这张图,推理一下逻辑:

    如果微信AI搜索的体验更好,必然有更多人用

    用户能够发现更多达人内容,从而给达人带去了流量

    更多原生达人能成长起来,其它平台的达人也愿意迁移过来

    品牌看到了这些增量的优质内容,愿意花钱投放给达人,也能获得更好的回报

    达人赚了钱,有动力生产更多优质内容,AI搜索的质量更高、体验更好,用的人就越多

    平台赚了钱,更愿意投资AI技术、扶持达人、完善商业化产品

    整个闭环形成

    这种看似“曲线救国”的方式,实际上抓住了内容平台最核心的资源 – 优质内容。比起自己付费买搜索流量,广告主其实还有其它的选择:直接把达人们积累的自然流量买过来不就行了!

    我们在2024年Q4的调研显示,无论是微信视频号还是公众号,用户增长的驱动力TOP1就是内容的匹配程度,这点跟抖音和小红书有明显差异。“内容质量上升”这一驱动力,在微信内容生态内的表现较为显著。

    也就是说,现在微信急需构建有特色的达人生态,来维持用户的增量,然后才是吸引广告主投放预算。

    而这些达人种草内容,的确能够引发用户积极的后链路行为 – 这是广告主最乐意看到的。

    根据我们拿到的一些内部数据来看,微信内容生态的增长还是比较正向的 – 这进一步验证了我们的逻辑推断。

    在搜索结果中引入广告

    这是一个非常简单粗暴的做法,与传统搜索引擎变现的模式并无差别,但增加了广告位,从而带动广告加载率提升。

    2024年10月,Google率先做出大胆的商业化尝试:在AI搜索结果中加入广告,并在美国手机端正式上线。

    Google搜索中早就上线了一个名为“AI overview”的功能。这相当于在传统的Google搜索结果页面的最上面,增加了一个区块来展示AI对于搜索结果的总结。原本这里是没有广告的,但现在部分商品广告会出现在里面。比如用户搜索如何在洗衣服的时候去除褶皱,那么AI Overview中不仅有教程,还有洗衣液的产品广告。[15]

    AI overviews并非百分之百展现,而是根据搜索关键词的不同,有选择性的出现。有调研显示,去年8月时差不多有12.47%的搜索结果中包含AI Overviews,比前几个月有了大幅增长,但从整体广告加载率的角度来看肯定是很低的,Google也处于尝试阶段。[16]

    但至少Google的内部调研显示:用户认为这些广告有帮助,因为它们能在自己需要时迅速将其与相关的企业、产品和服务连接起来。[17]

    反观国内,目前基本无人敢迈出这一步,各大AI搜索工具主打的都是“无广告”。这甚至倒逼百度在年初推出AI搜索功能时,也把“无广告”作为了卖点。

    所以,按照微信一贯的保守作风,也不会这么早就把AI搜索本身商业化。

    比如昨天,有知名博主指出,腾讯元宝中AI回答的结果可能存在广告链接。腾讯公关总监张军马上出来辟谣“理论上不应该”。

    结语

    搜索原本是一个主动在信息的汪洋大海中寻找有用线索的过程,传统的SEO主要依靠搜索词/点击量等表层数据来实现。而对于微信生态来说,由于它早已渗透进人们日常生活的方方面面,接入AI后,搜索很可能会实现千人千面的效果。

    我们大胆推测,当一个用户在微信搜一搜里搜索“度假”,搜索结果不再是全网点击率最高或是最新发表的帖子,而是DeepSeek在排除隐私信息后,分析了该用户的公众号阅读习惯、视频号点赞内容、小程序访问记录等,综合给出的最优方案。

    我们认为,微信接入DeepSeek将会深刻重构流量分配的逻辑,所以对于品牌营销而言,不仅需要强化内容质量与关键词优化以提升索引权重,还要紧抓达人已有的高质高效流量,找到自己的精准用户。

    当公众号、视频号及全网数据搭配上「深度思考」,品牌营销的目的或许不再是占领消费者心智,而是成为时刻陪伴消费者的智能化伙伴。

    参考资料:

    [1] 微信搜一搜月活跃用户达8亿,“数据看板”如何助力精细化运营?|新京报

    [2] Bill Gates on possibility, AI, and humanity|Youtube

    [3] 63% of Websites Receive AI Traffic (New Study of 3,000 Sites)|ahrefs bolg

    [4] 《2023企业新媒体矩阵营销洞察报告》|新榜

    [5] 《2024年B2B社媒营销研究报告》|KAWO

    [6] Investigating ChatGPT Search: Insights from 80 Million Clickstream Records|Semrush Blog

    [7] 63% of Websites Receive AI Traffic (New Study of 3,000 Sites)|ahrefs bolg

    [8] How significant is AI chatbot traffic in B2B?|Growth Memo

    [9] Transactional AI traffic – a study of over 7 million sessions|Growth Memo

    [10] Chat GPT Search|Growth Memo

    [11] Investigating ChatGPT Search: Insights from 80 Million Clickstream Records|Semrush Blog

    [12] Gartner

    [13] What’s Generative Engine Optimization (GEO) & How To Do It (Source: https://foundationinc.co/lab/generative-engine-optimization)

    [14] GEO Targeted: Critiquing the Generative Engine Optimization Research|sandboxseo

    [15] Google Search’s New AI Overviews Will Soon Have Ads|WIRED

    [16] AI Overviews Research: Google Ads in the AIO-inclusive SERPs|SE Ranking

    [17] New ways for marketers to reach customers with AI Overviews and Lens|Ads & Commerce Blog

    来源:钛媒体

  • AI技术赋能合成生物产品开发,「瑞德林生物」获超5亿元C轮融资|36氪专访

    AI技术赋能合成生物产品开发,「瑞德林生物」获超5亿元C轮融资|36氪专访

    合成生物领域头部企业「瑞德林生物」近期完成超5亿元融资。本轮融资由松禾资本、基石资本、常德兴鑫、白银科键、常德德源共同投资。投资方背景包括深圳市“20+8”未来产业基金、国家科技成果转化引导基金子基金、常德合成生物基金等政府或产业基金的管理主体。募集资金将主要用于产能建设和新品研发。
  • DeepSeek硬控智能家居!四大电视巨头抢跑,AR眼镜、智能音箱都上桌了

    DeepSeek硬控智能家居!四大电视巨头抢跑,AR眼镜、智能音箱都上桌了

    一大波AI家电,已经接入DeepSeek!

    这两周,AI电视、AI冰箱、智能音箱品牌扎堆宣布DeepSeek可用,有长虹海信创维TCL等大牌,还有小度这样的智能硬件代表。‍‍‍‍‍

    本周三,百度旗下智能硬件公司小度官宣,其AI智能助手小度正式接入DeepSeek模型。据小度淘宝旗舰店人工客服回复,小度智能屏可以下载并使用DeepSeek的App,但小度智能音箱暂不支持。

    可玩场景更丰富的AR眼镜,也在跟上DeepSeek潮流。上周星纪魅族 宣布其两款AR智能眼镜StarV Air2和MYVU已支持通过语音助手等功能调用DeepSeek-V3的能力,后续将支持用户自行选择是否调用DeepSeek-R1

    部分智能硬件厂商虽然尚未把DeepSeek能力直接整合到其产品中,但已经在研究结合DeepSeek的使用场景。 例如 Rokid 上周演示了其AR眼镜Rokid AR Lite可分屏使用DeepSeek网页版,以便打工 人用AI功能同时处理多项任务。

    DeepSeek已成为这些智能硬件的一大卖点,不少商品介绍页上直接注明“接入DeepSeek”。

    从国内三大主流电商平台搜索页来看,海信AI TV、长虹AI TV、创维AI TV、TCL AI TV的京东自营店铺产品页面和标题,均标注了“DeepSeek”。 这几家的淘宝官方旗舰店情况类似,但拼多多平台上暂未有明显标注。

    AR眼镜方面,李未可京东自营旗舰店和淘宝官方旗舰店的Chat AI眼镜,销售页面上多处标注了“接入DeepSeek-R1大模型”。拼多多平台上暂未有其官方店铺。

    Rokid的淘宝官方旗舰店则标注了“可使用DeepSeek”,但其京东自营旗舰店和拼多多官方旗舰店并未标注DeepSeek相关信息。

    总的来看,目前官方已确认会内嵌DeepSeek能力的智能家居硬件有:海信全部带智能体的AI TV长虹全部带沧海智能体的AI TV创维G7F Pro和A5F Pro两款AI TV星纪魅族StarV Air2和MYVU两款AR智能眼镜由TCL App AI助手和伏羲AI平台支持的全线TCL智能家居产品

    01.

    4家AI TV官宣

    将接入DeepSeek-R1,可语音对话

    接连3天,海信、长虹、创维、TCL相继宣布将DeepSeek能力整合到自家的AI TV中,以提升AI TV与用户的语音交互能力

    1、海信

    海信2月12日宣布,其全屋智能生态已深度整合DeepSeek模型相关技术,包括海信AI TV在内的智能家居软硬件将逐步全面升级DeepSeek能力。

    按海信方面预期,本周内所有搭载智能体的海信AI TV将完成升级,并全面支持DeepSeek。今年海信AI TV的新品也将自带DeepSeek能力。

    正式接入DeepSeek后,用户可以使用海信电视遥控器小聚AI键打开,或者直接语音唤醒DeepSeek对应的智能体对话界面。

    此外,海信自研的星海大模型深度融合DeepSeek能力后,将通过模型蒸馏、强化学习等技术,提升深度思考和推理能力,从而改善其全屋智能生态的人机交互体验。

    2、长虹

    2月13日,长虹宣布所有搭载了沧海智能体的长虹AI TV,均已接入DeepSeek模型。在长虹AI TV上,用户可以自行选择是用DeepSeek“深度思考”模式,还是“快速响应”模式,前者由DeepSeek-R1满血版支持。

    长虹方面称,现在用户在长虹AI TV的AI对话界面,可以通过语音对话的方式,与搭载DeepSeek能力的沧海智能体问答、交流,或要求其执行“清空问题”等操作。

    3、创维

    2月14日,创维集团发布了搭载DeepSeek能力的AI TV新品G7F Pro和A5F Pro。其DeepSeek能力来自于接入满血版DeepSeek-R1的创维酷开AIOS操作系统

    创维方面称,得益于DeepSeek能力,G7F Pro支持方言识别和模糊语义理解,从而能更准确地帮助用户找到影视、音乐等内容。其还能完成智能剪辑、生成氛围音乐、互动绘画、AI口语陪练、定制绘本、生成出行计划、预订行程等任务。

    4、TCL

    TCL实业于2月17日宣布正式接入DeepSeek,并应用于TCL智能家居、移动通讯、内部研发等产品线和业务,以提升用户体验和研发效率。

    其中,TCL智能家居矩阵的核心入口是TCL App AI助手。该AI助手接入DeepSeek后,升级了家电说明书问答和产品控制两大功能。在家电说明书问答方面,AI助手的回答速度和质量,及其模糊语义理解能力都有所提升,并且可以多轮追问。在产品控制方面,AI助手学会快速拆解复杂指令,实现跨设备协同响应。

    除了TCL智能家居中控,其电视、空调等品类的智能家居产品也接入了DeepSeek能力。

    TCL电视是通过伏羲AI平台接入DeepSeek能力的。用DeepSeek重点升级伏羲AI平台的多模态理解、知识处理、内容服务等能力后,TCL电视的音画质、人机交互和内容生成效果均有所提升。当前TCL电视方面已针对用户使用场景构建了16大智能体,后续将借助AI技术进一步细化场景和优化智能体。

    TCL空调则是通过TCL伏羲大模型和AI助手接入DeepSeek能力的。其主要强化了语音交互和故障诊断能力,可结合历史数据和上下文信息,预测潜在风险并提前预警。

    02.

    星纪魅族抢跑DeepSeek版AR眼镜,

    Rokid支持三屏使用

    在AR眼镜领域,虽然Rokid率先放出其AR眼镜可使用DeepSeek功能的消息,但星纪魅族抢先在其AR智能眼镜产品中实际接入了DeepSeek能力,推出首款内嵌DeepSeek V3模型的AR智能眼镜。

    1、星纪魅族

    2月14日,星纪魅族官宣,其AR智能眼镜StarV Air2、MYVU已接入DeepSeek大模型,支持在AI语音助手等功能中,根据用户提问内容动态调用DeepSeek V3的能力。而StarV Air2和MYVU的用户也可以直接语音唤醒带DeepSeek能力的AI语音助手,不需要上手操作。

    按计划,StarV Air2和MYVU用户端后续还会开放DeepSeek-R1大模型,并且用户可以自行选择是否调用该模型。

    星纪魅族方面称,该公司将会基于DeepSeek-R1模型及其相关技术,提升现有模型对用户潜在意图的理解能力,以帮助用户准确地做出决策,另外还能通过Flyme AIOS操作系统完成复杂任务的执行。

    2、Rokid

    Rokid方面于2月13日发文称,其AR眼镜Rokid AR Lite现能分屏使用DeepSeek网页版

    在Rokid给出的例子中,用户戴上Rokid AR Lite后,可以分屏使用DeepSeek功能,在三联屏上操作DeepSeek、查资料、编辑文档,而不用切换界面。

    不过,Rokid方面目前没有官宣,是否将DeepSeek能力整合到其AR眼镜的原生AI能力中。

    03.

    结语:两大方式部署智能家居

    DeepSeek能力,价格优势未显

    现阶段,智能家居硬件升级DeepSeek能力的方式主要有两大类,一种是通过AI智能助手或AI智能体接入后应用DeepSeek能力,例如海信AI TV、长虹AI TV;另一种是先把DeepSeek能力接入底层AI生态后,再由底层AI生态统一重塑智能硬件的AI交互能力,例如创维AI TV、TCL空调。

    而在价格方面,DeepSeek模型高性价比部署的优势有待进一步发掘。

    以TCL 65英寸的T6L QD-Mini LED AI TV为例,截至2月19日晚6点,该款AI TV在京东金榜平板电视排行榜排名第一。其京东自营官方旗舰店售价为3499元,国补预计到手价为2799元。TCL另一款未标注“接入DeepSeek”、同是65英寸的V8H Pro-J AI TV,京东自营官方旗舰店售价为2099元,国补预计到手价为2039元。

    可以看到,带有“DeepSeek”标注的AI TV,比其他未带有“DeepSeek”标注的AI TV,售价大概会高出1000元至1500元不等。这一差值未来有望进一步缩小。

    来源:微信公众号“智东西”

  • DeepSeek 创始人梁文锋牛逼的个人经历

    DeepSeek 创始人梁文锋牛逼的个人经历

    这个春节,DeepSeek  实在太火爆了

    DeepSeek 的爆火,引发了全国人民的关注,大家纷纷好奇这位幕后创始人究竟是何许人也,我也不免俗地产生了浓厚兴趣。尤其是他前不久刚刚参加了总理主持的座谈会,紧接着在不到一个月的时间内,前天又出席了中国规格最高的民营企业座谈会

    与马化腾并肩坐在第一排,其受重视程度可见一斑

    然而,这位创始人却异常低调,低调到何种程度呢?

    在撰写这篇文章时,我按照常规在 DeepSeek上搜集资料,却发现只要涉及到“梁文锋”这三个关键字的问题,信息均显得稀缺。

    DeepSeek 总是以换话题的方式回应我,似乎在暗示着更多的探讨空间。于是,我转而登录腾讯的 DeepSeek R1 平台,搜索有关“梁文锋”的信息,以完成这篇文章的撰写。由此可见,DeepSeek 的数据分散策略或许有其道理,可以有效避免单一企业的信息霸权。

    让我们先从梁文锋的求学之路说起:

    1985年,他出生于广东省湛江市下辖的吴川市覃巴镇,成长于一个普通家庭,父母都是小学教师。

    2002年,他以吴川一中的高考状元身份,考入了浙江大学,主修电子信息工程专业。尽管他的分数足以进入清华,但他坚持选择了浙江大学,因为这里能让他学习心仪的专业。这反映出他在高考时便对自己的人生方向有着清晰的规划,不为国内顶尖学府的诱惑所动。

    2007年,他继续在浙江大学深造,攻读信息与通信工程硕士学位,并于2010年毕业,其硕士论文题为《基于低成本 PTZ 摄像机的目标跟踪算法研究》。

    值得一提的是,近年来成功的企业家,比如:刘强东、雷军、虞仁荣、梁文锋等,往往有着优异的高考成绩或显赫的学历背景。随着时代的发展,创业越来越依赖于高科技,对创始人的背景要求也日益提高。而能成为高考状元,本身就是一种能力的体现。

    接下来,我们来看看梁文锋的创业历程

    毕业后,他没有像大多数同学那样加入大公司,而是选择在一个简陋的环境中,探索计算机赚钱的各种可能,他的生活几乎被代码和数据包围。

    在探索过程中,他偶然接触到了量化投资,并在发现其盈利潜力后,决定组建公司发展这一领域。

    2010年,他大学毕业,同年沪深300股指期货正式推出。

    2013年,他与浙江大学校友徐进共同创立了人生中的第一家公司——杭州雅克比投资管理有限公司。

    2015年,他成立了杭州幻方科技,专注于 AI 量化投资,并在当年的市场波动中依靠高频策略取得了显著成就。

    2016年,他推出了首个 AI 模型,到2017年管理规模达到30亿元,2018年获得了私募金牛奖。

    2019年,他自主研发了“萤火一号”训练平台(配备了 1100 块 GPU),管理规模突破百亿。

    2021年,管理规模更是突破千亿,使他成为量化私募界的“四大天王”之一。

    这一切成就,都是他在量化投资领域的成长轨迹,短短不到10年,他就从一个行业新手成长为国内顶尖的私募机构领导者。值得一提的是,梁文锋在招聘时有一个特点,他偏好那些没有基金背景的“外行”人才。

    在 AI 领域的发展又是另一条线索

    在运营量化基金期间,他为了训练模型进行股票交易,提前积累了大量的 GPU,其数量足以与国内一线大厂媲美。

    有人传言,DeepSeek 拥有上万张 GPU,虽然这一说法未经证实,但可以肯定的是,其 GPU 数量在国内绝对是首屈一指的。

    梁文锋曾说过,他的核心动力是好奇心,对 AI 能力边界的好奇。在好奇心的驱使下,他创建了 DeepSeek,不为利润,只为探索通用大模型的无限可能

    2023年7月,他创立了 DeepSeek(深度求索),进军通用人工智能(AGI)领域。

    2024年5月,发布了 DeepSeek-V2,其定价仅为 GPT-4 Turbo 的1%。

    2024年12月,推出了 DeepSeek-V3,并开源了技术细节。

    2025年1月,发布了 DeepSeek-R1 模型,并参加了国务院总理主持的座谈会。

    DeepSeek 的具体迭代路线,可以通过下方的图表来了解:

    最后,分享两个有趣的八卦

    一是关于梁文锋的创业伙伴徐进的近况

    比较好奇,最开始和梁文锋创业的徐进去哪里了,大概查了一下有这么一个小八卦。
    2023 年 10 月,一条 “股民的钱去了哪里?都被头部量化私募股东割韭菜来包养二奶!” 的微博小作文引发关注。发帖人是徐进的妻子,她控诉徐进不但长期 PUA 她,还在其面前公开出轨,用投资人的钱大肆包养二奶,玩各种大尺度色情游戏,甚至要求她们住在一起。
    2023 年 10 月 26 日,幻方量化官方公众号发布情况说明称,徐进作为公司团队成员,其对于个人家庭事务处理不当,引发负面舆论,对公司声誉造成不良影响,决定对徐进作出停职处理。

    二是关于捐款的趣事。2022年,幻方量化向慈善机构捐赠了2.2138亿元,而公司员工“一只平凡的小猪”个人捐赠了1.38亿元。后来证实,“一只平凡的小猪”正是梁文锋。

  • 王兴兴:宇树科技创始人,9岁造机器人,座谈会上唯一的90后,从大疆辞职创业,34岁获10亿元融资

    王兴兴:宇树科技创始人,9岁造机器人,座谈会上唯一的90后,从大疆辞职创业,34岁获10亿元融资

    什么?机器人现在都能扭秧歌,转手绢了?

    在2025年央视春晚的舞台上,一个名为《秧BOT》的创新节目一举成为全场焦点。借助高精度3D激光SLAM自主定位与导航、多智能体协同规划、先进组网方案等前沿技术,16台机器人在舞台上精准律动,自主跳舞,挥舞手绢,为观众带来了前所未有的科技盛宴。这些惊艳亮相的机器人,正是来自宇树科技的人形机器人 Unitree H1。据报道,其舞蹈动作基于强化学习算法生成,16台机器人能时调整队形,即使环境不断变化,仍能保持动作同步误差小于0.1秒。

    图片来源:《秧BOT》节目截图

    早在2021年春晚,宇树科技便携四足机器人“犇犇”登台,以高性能机器人集群舞蹈震撼全场。宇树科技如今稳居机器人行业的霸主地位,2023年全球四足机器人市场中,宇树科技的销量份额高达70%,市场规模份额达到41%,展现出强大的行业统治力。

    2025年2月17日,民营企业家座谈会在北京隆重召开,宇树科技创始人王兴兴作为六位企业家代表之一发表演讲。而与他同台发言的,正是华为任正非、比亚迪王传福、小米雷军等业界巨擘。能与这些商业巨头并肩而立,足以证明宇树科技在行业中的分量。

    令人惊叹的是,这位2016年才创业的年轻企业家,如何在短短不到十年的时间里,从一个初创公司迅速崛起,跻身全球机器人行业的领军者?他又是如何一步步奠定宇树科技的行业霸主地位?

    图片来源:风闻

    偏科严重的小发明

    1990年,王兴兴出生于浙江宁波余姚的一个普通家庭,自幼展现出对科技和手工制作的浓厚兴趣。从雕塑、绘画到电子电路,他都乐在其中。小学时,他亲手制作了一款风力小车,这是他人生中的第一个小发明。此后,他不断探索,从改装四驱赛车的直流电机,到利用铁皮、漆包线和磁铁手工制作直流电机,他总是乐此不疲。

    然而,他在英语学习上却屡屡受挫。尽管他从小学二三年级就主动学习英语,但记忆单词成为他最大的难题。严重的偏科导致他学业受阻,高中入学,不仅学校普通,成绩排名还全校倒数。不过,随着数理化课程比重的增加,他逐渐找回信心,第一学期便跃居前列,但英语依然是难以逾越的障碍,整个高中仅有三次勉强及格。

    2009年,王兴兴考入浙江理工大学机械与自动控制学院机电专业,尽管学历在行业内算不上顶尖,但这段求学经历成为他正式踏入机器人研究领域的起点。大学伊始,他便开始思考未来,并迅速投身于各种手工制作,探索自己的兴趣与发展方向。

    2009年冬天,王兴兴第一次接触单片机(MCU,Microcontroller Unit),并用自己的零花钱购买了一块几十元的Arduino开发板。到了大一寒假,他又购入了十多个9g舵机,开始研究制作机器人。或许是因为从小就习惯于凭借简陋的工具纯手工制作各种小发明,王兴兴手工制图,靠着手动钻头和一些边角料,硬是成功制作出一个14自由度的双足人形机器人。他曾自嘲自己“超级抠门”,仅用200元的成本就可以把机器人做出来。这背后,其实是王兴兴不同于一般人的天赋和毅力。

    图片来源:观察网

    这个机器人至今还在王兴兴的办公室里,是他发明的第一个人形机器人,颇具纪念意义。但在当时,这个机器人“步履蹒跚”,实在没有什么性能可言。事实上,这也是彼时全世界技术局限的缩影。王兴兴曾说:“当时看了一下全世界的技术水平,会发现以当时的人类科技水平,很难驾驭高复杂度的人形机器人。没有什么商业价值,只能做玩具,或者是科研、实验室场景,商业化非常难。”

    对人形机器人的探究暂且搁置,到了大一下学期,王兴兴开始接触神经网络和人工智能相关领域。此外,王兴兴在大学期间还积极参与科研项目,主动寻找不同的实验室,向老师展示自己的成果。在这一过程中,他逐渐意识到自己的专业深度仍然不足,因此萌生了攻读研究生的想法,以进一步拓展自己的学术视野和技术能力。

    2013年,王兴兴从浙江理工大学毕业,他的毕业论文是《一种BLDC控制器的研制》。毕业后入读上海大学机电工程与自动化学院机械工程专业硕士研究生。

    其实,他最初的目标是浙江大学,但英语成绩再次成为阻碍。尽管总分合格,却因英语未达标,最终调剂至上海大学。在上海大学就读期间,王兴兴研发出了XDog——全球首款采用外转子无刷电机驱动的小型高性能低成本四足机器人。XDog不仅开创了低成本、高性能四足机器人方案的先河,为他日后在行业内的发展铺下基石。

    四足机器人爆火 实习生意外创业

    读研究生开始,王兴兴就对小型的纯电力驱动的四足机器人产生了极大的兴趣。

    起初,王兴兴所在的实验室正尝试做一款比较大的液压机器人。液压驱动是彼时业界的主流,如美国机器人先驱公司波士顿动力就采取液压驱动,力量虽大但成本很高。相比之下,王兴兴的想法非常超前,他认为“整个(液压机器人)工程量非常大,很难做。但是电驱动这个方向,整个电控系统、机械结构、包括控制算法,在全世界做的还不够优,有很多方案可以把它做的更好”。于是,王兴兴在完成了电控系统、机械结构、控制算法的自主研发后,拿出了XDog的方案,经过验证,效果很好。

    图片来源:智源社区

    转眼就要毕业。为了能够将剩下的一半机器人项目完成,本应在2015年中下旬毕业的王兴兴主动申请了延期毕业,又花了半年多的时间,最终完成项目。而这个研发投入只有大约2万人民币的机器人,却给他带来了一系列意想不到的丰厚收获。

    XDog 图片来源:智源社区

    申请延毕后,王兴兴机缘巧合的参加了国际智能“星创师”大赛。因为其他同学都已经毕业,他只能带着XDog机器人独自参赛。相比于其他的参赛团队的热闹,王兴兴显得有些形单影只。但最终,他顺利通过了五六次比赛答辩,并获得二等奖,赚到了8万元。

    2015年,他还公开了机器狗电驱动方案。这比波士顿公司2016年公布电驱动早了一年时间,这个技术方案也是后续很多机器狗公司沿用的方案。

    2016年6月,王兴兴从上海大学毕业。他的硕士毕业论文课题就是《新型电驱式四足机器人研制与测试》。

    王兴兴也曾找过几个投资人。但当时的市场还不够成熟,投资人兴趣不高。虽然王兴兴的创业梦想暂时搁置,但XDog的履历,依然让他顺利拿到大疆的offer。可试用期还没结束,他的创业启动金就悄然来临。

    起初,王兴兴只是把XDog的测试视频上传到优酷平台,没想到被IEEE Spectrum转载到海外网站之后直接爆火。在国内外媒体轮番报道之后,买家和投资人接踵而至。王兴兴认为,这至少可以证明“社会上已经达成了一定的共识,大家愿意接受这个产品,整个的基本盘已经有了”,于是王兴兴拿着200万元的天使投资,果断辞职创业。

    建立宇树科技 掌管全球四足机器人市场

    2016年8月,王兴兴在浙江杭州成立杭州宇树科技有限公司(Unitree Robotics)。据悉,王兴兴曾想把公司取名为“科技树”,希望能帮助人类点亮“科技树”。但是这个名字没能通过工商注册,于是改名为“宇树”。

    宇树科技在创立初期便经历了严峻的考验。起初,公司只有三个人,都是技术工种。基于XDog的技术,王兴兴带领团队精益求精,在经过一年多的反复探索,于2017年10月,正式发布第一款机器狗——莱卡狗(Laikago),以此纪念被前苏联送上太空的那只狗狗Laika。

    产品做出来了,可是钱也花光了。2017年到2018年,公司的第一笔融资款耗尽。为了维持运营,王兴兴主动停发自己的工资来填补缺口,“创业是创业,不能亏待所有人,也不要太亏待自己,因为这是底线”。直到2018年初,王兴兴拿到极客公园变量资本的投资,才解了燃眉之急。

    图片来源:极客公园

    此外,虽然早在2017年宇树科技就开始产品预售,但真正交付给客户却花了一年多的时间。王兴兴深知,做DEMO工程机或许两个月就能完成,但要打造真正满足客户需求的产品,至少需要一年。他曾自豪地表示,直到2022年,仍有客户在使用公司的初代产品,这也证明了其长期稳定的产品质量。

    值得一提的是,2018年MIT开源了自己的机器狗方案,这在国内掀起了一股机器狗研发热潮。让王兴兴惊讶的是,MIT的电机方案与他在2016年公布的方案几乎完全一致,电控方案也高度相似。不仅如此,在软件方面,两者也有着惊人的相似之处。不仅关节电机的命名方式相同,通讯协议甚至是王兴兴版本的子集。而实际上,他的方案早在2013年就已经完成。王兴兴推测,可能是在自己公布低成本机器人方案后,MIT参考并加以改进,最终将其开源。他的研究进度,比MIT足足早了五年。

    自2018年底正式向客户发货后,宇树科技的资金流开始步入正轨。王兴兴曾透露,公司在2018年实现了数百万收入,而随后的2019至2020年,发展势头愈发迅猛,业务拓展更加顺畅。

    如果回顾宇树科技近6年的成长轨迹,不难发现,从行业功能性应用,到教育科研,再到工业和消费市场,王兴兴对整个产业的布局远比外界想象得更加全面。

    2019年,宇树科技发布了四足机器人 AlienGo,专注于行业功能性应用。AlienGo凭借全球最大尺寸和重量级别的后空翻能力,成为当时行业内的一大技术突破。这一年,宇树科技成功售出数百台四足机器人,产品市场认可度不断提升。同年12月,宇树科技获得红杉资本中国基金和德迅投资的Pre-A轮融资。

    2020年,宇树科技又发布教育版四足机器人A1,不仅体积更小,售价更低——不到十万人民币。当年10月,宇树科技的四足机器人受邀成为2021年央视春晚舞台的“表演嘉宾”。这次春晚对宇树科技来说,是一个命运转折点。据王兴兴回忆,他们在春晚后台连续奋战了一个月,通宵加班,终于保证了24只四足机器人“犇犇”的完美表演。“犇犇”是基于A1机器人改装而成,一经亮相便惊艳全场,引发全球关注。凭借春晚的广泛曝光,宇树科技的产品迅速走进大众视野,品牌影响力大幅提升。此后,宇树科技的机器人又陆续亮相2022年北京冬奥会开幕式、2023年Super Bowl赛前表演、2023年杭州亚运会和亚残运会等国际舞台,持续展现中国机器人技术的创新实力。

    机器牛“犇犇” 图片来源:新京报

    2021年6月,宇树科技乘胜追击,发布了第一款真正面对消费市场的四足机器人Go1。这是一款伴随仿生机器人,它的售价降至1.6万元人民币,一年累计出货近千台。反观波士顿动力Spot定价高达7.4万美元,Go1的售价仅为其价格的3%。

    同年7月,领宇树科技获得雷军的顺为资本1000万美元A轮融资;次年3月,获得经纬创投、敦鸿资产、深创投、顺为资本等机构B轮融资数亿元。

    图片来源:观察网

    2022年6月,宇树科技发布工业级机器狗B1,被成功应用在公共救援、电力巡检、勘测探索等行业级场景。

    2023年7月,宇树科技震撼发布消费级四足机器人Go2。据悉,Go2搭载宇树科技自研的4D激光雷达L1,实现360°感知,轻松适应复杂地形。集成OpenAI GPT模型,具备智能交互与数据处理能力,并开放AI模型接口,满足多场景需求。ISS2.0智能伴随系统提升50%定位精度,遥控范围超30米。此外,膝关节热管散热系统防止过热,最高奔跑速度5m/s,可模拟宠物狗的追球等动作,兼顾趣味性与实用性。这样一款高性能的伴随仿生机器人,起售价只有9997元!彻底将消费级机器狗的价格打到了万元以下。

    图片来源:官方

    紧接着,宇树科技在2023年11月发布工业级机器狗B2。有媒体报道,2024年10月,机器狗B2在泰山上当“智能挑夫”的视频在海外爆火,外交部副部长华春莹也在社交平台上发布相关片段,并配文称:“机器狗在雄伟的泰山上充当搬运工:科技造福人类。”

    据官方透露,2024年2月,宇树科技完成B2轮融资,近10亿元人民币,投资方包括美团、金石投资、源码资本等。有媒体表示,宇树科技2024年9月完成C轮融资,投资方包括美团龙珠、北京机器人产业投资基金等。

    2024年12月,宇树科技发布了升级版B2-W的测试视频。宇树科技相关人士曾向媒体表示,此次B2-W工业轮足机器人新功能包括完成双旋转,转换成三周半旋转倒立,侧翻,360°跳跃旋转;艰难的地形穿越;可承载重达40kg的重物,甚至可承载一人。这段视频在外网疯传,特斯拉创始人马斯克亲自下场回复称:未来的战争是无人机战争。

    图片来源:风闻

    “未来的战争是无人机战争” 图片来源:Xapp

    至此,宇树科技的四足机器人在现有技术框架下,已实现高度覆盖各大行业领域。产品如今已深度渗透至工业、消费市场、公共安全、科研等多个领域,广泛应用于自动化生产、安防巡逻、学术研究、娱乐教育等多个场景。宇树科技相关负责人曾向媒体介绍,其四足机器人出货量,占全球四足机器人出货量的60%以上。目前,该公司业务范围覆盖全球一半以上的国家和地区。据有关报道,曾有机器人行业从业者直白的表示:“我们不会做机器狗了,因为宇树科技已经一家独大,机器狗赛道没有机会了。”

    图片来源:官方

    借势而起,入局人形机器人市场

    人形机器人是王兴兴的初心,但也是他曾经坚决不越的雷池。

    2018年到2021年,很多投资人都曾对人形机器人感兴趣,但都被王兴兴坚决地拒绝。这并非因为他对人形机器人缺乏兴趣,而是他始终在等待合适的“借势”时机。相比盲目投入,他更倾向于在技术、市场和产业环境都足够成熟的情况下,以最优的策略切入。

    直到2022年马斯克明确表示开始研发人形机器人“擎天柱”,推动了行业的发展,再加上2022年年底ChatGPT横空出世,人们对AI行业的信心倍增。“有人愿意买(这种产品),我们才做这个方向”,王兴兴认为时机成熟,于2023年开始入场人形机器人。

    2023年8月,宇树科技迅速推出首款通用人形机器人H1,售价9万美元。H1被定位为国内首台具备跑步能力的全尺寸通用人形机器人,采用超轻量级设计,整机重量约47kg,最大扭矩达360N·m。宇树科技自主研发大扭矩关节电机等核心组件,使其能够执行复杂动作和任务。H1的移动速度可达3.3m/s,潜在运动性能超过5m/s,具备实地环境下的灵活奔跑和跳跃能力。就连OpenAI创始成员Karpathy都直呼“想要”。

    图片来源:Xapp

    2024年5月,宇树科技又推出了第二代人形机器人G1。G1机器人搭载43个自主研发的关节电机,最大扭矩120牛·米,并通过精准的动态平衡算法,将误差控制在毫米级,确保运行稳定流畅;在成本控制方面,G1采用三指力控方案替代传统五指设计,既能满足90%的抓取需求,又成功降低40%的制造成本。G1机器人以9.9万元的定价被行业称为“价格屠夫”,预售首日即斩获超三千台订单。

    图片来源:风闻

    今年1月,在国际消费电子展(CES 2025)上,宇树科技携带G1人形机器人和Go2机器狗亮相。Go2售价为1600美元,相比之下,形态类似的波士顿动力Spot机器人售价高达74500美元;G1人形机器人售价16000美元。有媒体证实,宇树科技在人形机器人领域的出货量处于行业前列。

    为何宇树科技可以把产品价格压低?核心在“技术资产复用”,最大化降低研发与生产成本。不同于特斯拉 Optimus 采用从零构建人形机器人技术栈的高投入模式,宇树科技借助四足机器人产品线的持续迭代,将运动控制、环境感知等底层技术进行模块化封装,形成高复用性的技术架构。其已有技术可直接迁移超过60%,大幅缩短H1 的研发周期。这种技术复用不仅加速了产品落地,也让BOM(物料清单)成本大大降低。

    王兴兴在社交媒体发布G1跳舞视频 图片来源:小红书

    据相关数据显示,宇树科技自成立以来已完成9轮融资。有消息指出,完成数亿元的C轮融资后,投后估值达到80亿元人民币。此外,宇树科技在机器人核心零部件、运动控制、机器人感知等多个领域积累了深厚的技术实力。公司具备自主研发全链条能力,涵盖电机、减速器、控制器、激光雷达等关键核心部件,以及高性能感知与运动控制算法。截至目前,宇树科技已累计申请国内外专利180余项,其中授权专利超过150项。

    有趣的是,尽管王兴兴对AI在人形机器人中的应用前景十分看好,但在AI研发投入上,他却表现得格外谨慎。他坦言,AI的研发成本极高,尤其是GPU算力的消耗更是难以负担。

    在他看来,目前AI与机器人结合的技术临界点尚未到来,但通用AI的技术已经出现曙光,并且未来将有更多人才投身于具身智能的研究道路。如果进展顺利,三到五年内或许能够迎来真正的技术突破。“如果哪一天有人把 AI 机器人的模型做出来,我可以保证年底之前直接给他做 10 万个人形机器人。”他曾这么说。

    识时务者为俊杰,而既懂市场又精通技术的俊杰,更是凤毛麟角。王兴兴正是这样的人。作为商人,他目光独到,总能在市场最需要的时候精准出手,垄断不同场景的多元化客户群体;他借势而为,早年拒绝跟风人形机器人,但在2023年AI技术突破后,仅用半年便推出H1,并迅速迭代至G1。

    而作为技术专家,他对机器人每个构件都了然于胸,甚至连一颗螺丝钉都亲自把关。正因如此,宇树科技通过自研构建起深厚的技术壁垒,成本远低于竞品,抢占市场份额,构建宇树帝国。而最核心的是,王兴兴自始至终都对机器人有着浓厚的兴趣,正是这份深深植根于内心的热爱,转化为强大的自驱力,让他在技术探索和行业革新的道路上坚定前行。

    正如王兴兴所言:“创新就是既要仰望星空洞察技术趋势,又要脚踏实地解决产业痛点。最重要的是,兴趣驱动的实践探索才能让创新具有爆发力。” 他希望,宇树科技的名字不仅代表着一家企业,更是一棵不断生长的科技之树,在广阔的宇宙中枝繁叶茂,最终点亮人类的未来生活

    图片来源:新闻联播

    来源:微信公众号“极思TopMinds”

  • 又一位杭州创始人火了

    又一位杭州创始人火了

    一位理工男生出现在演讲台上。留着络腮胡须,戴一副黑框眼镜,穿一件黑色卫衣,语气略微紧张——这是AI眼镜独角兽Rokid的创始人、CEO祝铭明。他向大家展示了极为科幻的一幕:在那副不太显眼的黑框眼镜里,写满了演讲台词。

    大会之后,祝铭明戴着智能眼镜的演讲视频爆红,让Rokid(灵伴科技)成为继“六小龙”之后又一家浮出水面的杭州科技公司。当天祝铭明还聊起一个细节:三天前的晚上,游戏科学的冯骥、宇树科技的王兴兴、DeepSeek的梁文锋、强脑科技的韩壁丞在祝铭明家里吃了一顿饭。年轻一代创始人惺惺相惜。杭州城里,由他们创立的公司正在崛起为中国科技新势力。

    浙大毕业,他在杭州创业身后VC/PE云集

    “我的发言稿就在眼镜上,翻页通过手上的戒指完成”祝铭明双手摊开,略显松弛——“没稿子。”他指着头上佩戴的新产品介绍,“非常自信地告诉大家,这绝对是代表全球最先进的AR技术……我平时工作和生活基本都戴着它,尤其是出差,已经完全可以代替原先的平板和电脑了。”

    这副黑框眼镜的外表与普通眼镜差别不大,除了显示演讲稿,还在公开场合实现拍照、翻译、问答搜索、识别物体等不少操作,能够通过声纹付款、快速充电,一系列复杂的技术都融合在了一副仅有49克的镜框中。

    如此满满“科幻感”背后,源自祝铭明在杭州的十年创业。

    时间回到2012年,还在阿里的祝铭明受邀参加谷歌一场发布会,亲眼看到谷歌工程师戴着Google Glass在旧金山上空跳伞拍摄,大受震撼。他坚信这个技术一定可以改变世界,但也认为“我们一定可以比它做的更好”。于是在2014年,祝铭明离开阿里, Rokid正式成立。

    给Rokid投出第一笔钱的是祝铭明在阿里的老领导、如今的阿里CEO吴泳铭,此后吴泳铭联合刘毅然创立元璟资本。此外,还有胡泽民的魔量资本;王淮和张川的线性资本;以及IDG资本。

    时至今日,Rokid已经融资超过10轮,集结了淡马锡、IDG资本、瑞士信贷、华登国际、海通证券、线性资本、元璟资本、复星集团等一众知名投资机构。2024年,Rokid宣布完成由合肥市政府领投的5亿元C+轮融资,投后估值达到10亿美元,跻身独角兽行列。

    这期间,祝铭明带领团队从一张粗糙的图纸完成转型,专攻智能眼镜赛道,如今已经进入教育、医疗、工业、能源和文博等一系列场景。正如他在演讲中提到,Rokid成为了人类历史上第一个上太空服役的AR产品,在中国博物馆的市占率也已经达到了99%。

    回忆起2014年离职前夕,祝铭明曾提到,老板曾经找他聊了四个小时,当问起离职原因,祝铭明解释,未来将有两件事情会改变人类生活方式,一个是AI,一个就是AR,而它们最终会变成一件事情。这一幕正在变成现实。

    “杭州七龙珠”崛起
    说起来,祝铭明与杭州渊源颇深。本科与硕士都就读于浙江大学,祝铭明的青年时代几乎有一半时间是在杭州度过。此后从加州伯克利博士毕业,祝铭明决定回国创业,第一站仍然是杭州。2010年,创业公司猛犸科技被阿里收购,祝铭明一同加入阿里巴巴,又在这里度过了四年多的时间。

    从阿里离职后,祝铭明还是把杭州作为根据地,从全国各地召集一批年轻人成立新公司,一晃又是十年,祝铭明曾说已经成了半个杭州人。

    如今的Rokid总部坐落在杭州市余杭区西溪国家湿地公园。2024年,这里凭借3355.67亿元的GDP成为“浙江经济第一区”,国家高新技术企业总数已经突破3000家,人才资源总量超45万人。

    这片区域还坐落着“杭州六小龙”之一强脑科技、3D扫描领域首家上市公司思看科技。当初为了挖来强脑科技,杭州未来科技城的考察团曾飞行1万多公里,远赴波士顿找到创始人韩璧丞,最终让这家脑机接口公司落地西子湖畔。

    思看科技董事长王江峰也在会上提到,2015年在余杭创业时,思看是一个仅7人的小团队,“从首笔研发补贴到人才引进政策,余杭诠释着什么叫创新创业生态最优”。如今,思看科技已经扩展至400多人,形成以余杭为中心,足迹遍布德国、美国、韩国等7个国家的全球化企业。

    从杭州中心城区辐射开来,方圆20多公里内,北边坐落着机器狗公司云深处,南端是《黑神话:悟空》的开发者游戏科学,西边Rokid与强脑科技相望而立,东边还有正在冲刺港交所的空间智能平台群核科技,以及最近火遍全球的DeepSeek和宇树科技——它们构成了如今的“杭州七龙珠”。

    过去这段时间,DeepSeek掀起堪比ChatGPT的全球狂潮;宇树科技王兴兴同样风头强劲;如今Rokid又成为继DeepSeek和宇树科技之后,再次出圈的杭州创业公司。

    这场爆发是意料之内。在此之前,从浙江到杭州已经陆续颁布一系列智能穿戴设备相关的激励政策,这里很早就聚集了李未可、回车科技、加南科技等一批知名智能眼镜企业。

    此外,祝铭明的母校浙江大学在2008年就开展数字化技术研究,为这一行业输送了一批批创业人才,正如祝铭明在演讲中提到,“目前据我所知国际上XR领域里,70%的顶级专家来自中国,这其中大部分来自浙大。”

    中国新一代科技创业者走上世界舞台

    Rokid的爆火,成为2025年智能眼镜爆发潮的一缕缩影。祝铭明的演讲刷屏后,AI眼镜概念股大涨。昨日(2月20日)收盘,博士眼镜、明月镜片、杰美特、星星科技涨超20%,激智科技、格林精密等涨超10%;慈文传媒、浙版传媒等直接或间接参股Rokid的公司更是一字涨停。智能眼镜又一次出现在一二级投资人的视野。

    此前,智能眼镜概念诞生已经有20多年,但不论在芯片技术、量产难度和成本覆盖上,都与大范围商业化相去甚远。直到AI浪潮涌现,眼镜成为承载人工智能更便捷的载体。不少投行机构预测——

    智能眼镜或将成为继具身智能爆发后的下一个浪潮,2025年可能就是智能眼镜元年。

    这只是AI浪潮的冰山一角——随着DeepSeek爆红,国内一批新行业正在被AI重塑。除了具身智能机器人,曾经一度进展缓慢的AI医疗也迎来了爆发;而在电商平台上,戒指、项链、胸牌等借助AI赋能的智能穿戴设备早已悄悄爆单。

    “AI会在极短的时间内开创下一个‘互联网时代’,中国科技军团绝对会占据重要的一席之地。”不少投资人都提到了这个趋势。

    一个例子是,一家有着中美两地背景的智能穿戴初创公司负责人告诉投资界,创业之初公司就决定将硬件团队落在国内珠三角地区,因为这里有着强大的供应链优势,“这些地区汇聚了光学、显示、芯片等核心零部件的供应商,能够轻易找到一个完整的产业链。”

    从长三角到珠三角,中国硬核产业崛起。就像20年前借移动互联网乘风而起的平台经济一样,“AI+”即将成为新拐点。

    最近德意志银行曾在研报中直言——2025年将是中国企业在全球崛起的一年,中国的科技成就一直被低估。此时,华尔街投行们集体唱多中国资产,扎堆抢起了“折价股”。

    不久前,一张名为《China Terrific Ten Beating US Magnificent Seven 》的统计图刷屏,美国分析师们用以表示从2024年以来,中国10家最具代表性的科技公司——阿里巴巴、腾讯、美团、小米、比亚迪、京东、网易、百度、吉利和中芯国际,类比美国科技“七姐妹”——苹果、微软、Alphabet、特斯拉、Meta、英伟达和亚马逊。

    最新一幕,则是昨晚阿里巴巴财报发布,连夜带动中概股大涨。摩根士丹利直接指出,阿里巴巴的财报将成为用于审视中国AI投资趋势的首个催化剂。

    也许若干年后回顾,当下发生的一幕幕会成为全球科技格局的转折点。

    来源:公众号“投资界”

  • ‍DeepSeek 爆火背后,必须看清的3大趋势

    ‍DeepSeek 爆火背后,必须看清的3大趋势

    一文读懂,怎样高效使用DeepSeek。

    内容来源:量子教育,企业人才培养优质内容及创新解决方案服务商。

    分享嘉宾: 陈旸,阿里云MVP,清华大学计算机博士。

    春节前夕,DeepSeek-R1模型公布开源,下载量迅速登上了免费榜榜首。随后,引起了美国资本市场的大波动,算力巨头英伟达出现了股价暴跌17%的罕见跌幅……

    开源后的DeepSeek到底对资本、科技产生了何种影响?是什么让其具有这么大的能量?我们如何拥抱DeepSeek带来的新AI时代?继DeepSeek之后,AI将有什么新的趋势?

    这篇文章,将由清华大学计算机博士、阿里云MVP(人工智能领域最有价值专家)陈旸为我们一一解读上述问题。

    一、DeepSeek的影响力

    1.对手惶恐,资本青睐

    2025年1月20日,DeepSeek-R1模型正式公布;1月26日在中国区、美国区苹果App Store中的免费榜上同时冲到了第一名。

    随后,美国资本市场出现大幅波动,标准普尔500指数在10天内跌幅接近10%。英伟达股票在1月27日当天暴跌了17%,美股主要科技公司(英伟达、微软、Meta、亚马逊等)市值共计蒸发上万亿美元。

    在DeepSeek-R1出现前,算力是大模型训练的关键因素,美国限制中国使用英伟达的显卡,因此大家普遍会认为美国在AI大模型的领先优势是“断层式”的,这也是美国对华科技限制采取“小院高墙”战略的底层逻辑。

    DeepSeek用少量的显卡训练出了与其媲美的模型,相当于打破了美国对华在人工智能领域的战略限制。

    就连OpenAI的CEO山姆奥特曼也重新思考了OpenAI的开源战略,迅速推出了o3-mini模型,在使用中开放了思考推理过程。

    在这之前,OpenAI并不是完全开源的,我们只能使用o1模型,现在我们也可以使用其o3模型进行更深入的思考。

    通过OpenAI o3 mini与DeepSeek R1的使用对比,可以发现DeepSeek-R1的思考时间更长,思考逻辑更完整,推理结果更好。

    同时,DeepSeek会将推理过程完整地展现出来,而OpenAI以前不会展示思考的过程,而思考的过程其实非常有价值的。

    今年1月,美国宣布“星际之门”计划,软银向OpenAI投资400亿美元,用于OpenAI对星际之门的承诺,投后估值达3000亿美元;而具有对标OpenAI能力的DeepSeek,同样受到国内近百家资本的青睐,对其表达了投资意向,可以预见DeepSeek的估值将会上到一个新的高度。

    2.DeepSeek开源,行业争相部署

    在DeepSeek宣布开源R1之后,各个行业都开始集成或部署DeepSeek的相关模型。

    国内的华为云、百度智能云、阿里云、腾讯云、京东云、火山引擎以及三大运营商等云平台都相继部署了DeepSeek的R1/V3等模型。

    国外的亚马逊、微软、英伟达、AMD等平台也快速地将DeepSeek R1/V3模型部署或集成到相关的产品和服务上。

    在产业端,吉利、岚图、东风、广汽、智己、长城、宝骏、零跑等车企也宣布与DeepSeek进行融合,未来智驾上也可以体验到与DeepSeek的交互。

    金融领域,国泰君安、国金证券、兴业证券、广发证券等证券机构进行了本地化部署和调试,应用于行业研究、市场研判、风险管理、信息检索、文档处理等多种场景。

    当然,部署与开发完成还需一定的测试过程,但也体现出各个行业不甘落后的状态,也说明与先进的大模型融合使用将是大势所趋。

    二、DeepSeek撕破了算力面纱

    1.DeepSeek的完全版与蒸馏版

    DeepSeek完全版的尺寸是671B,由于采用创新的MOE架构,在推理过程中激活少部分参数,因此推理速度更快,所需训练资源更小。

    DeepSeek蒸馏版有Qwen2.5-Math-1.5B、Qwen2.5-Math-7B、Uama-3.1-8B、Qwen2.5-14B、Qwen2.5-32B、Llama-3.3-70B-Instruct等多个尺寸。它选了两个开源模型进行训练,国内是Qwen2.5,国外则选用了Llama,蒸馏模型更小更快,但能力相对弱一些。

    对于性能要求不太高、GPU资源有限的企业,蒸馏版是一个更优选择。因为完全版需要的显存是496GB,而R1:1.5B只需要2G显存、R1:7B也只需要8G显存,最高的R1:70B蒸馏版也只需要128G显存,大幅降低了私有化部署的资源要求。

    2.蒸馏技术路线,让DeepSeek R1性能大幅提升

    在R1模型之前,DeepSeek推出V3通用模型,在推理速度上相较历史模型有了大幅提升。一度在大模型主流榜单中,位于开源模型榜首,与世界最先进的闭源模型也不分伯仲。

    而V3模型最大的特点是训练成本极低,需要的显卡数量和训练时间较于OpenAI只是一个零头。

    2024年12月,V3模型正式推出,但当时并没有太大波澜。

    而以V3模型为基础,通过新的奖励机制GRPO(group relative policy optimization),并使用规则类验证机制自动对输出进行打分,在一个多月时间内训练出了DeepSeek-R1模型,性能堪比GPT-o1模型,使R1迅速火出了圈。而R1模型与V3模型相比,其性能也有了大幅提升。

    R1模型遵循MIT License(一种非常宽松的开源许可协议,允许用户自由地使用、修改、分发和商业化软件或模型。),允许用户通过蒸馏技术借助R1训练其他模型。

    相比之下,Meta Llama的License相对严格,虽然LLaMA3是开源的,但许可协议限制了商业用途和对模型的修改,比如新的模型如果使用LLaMA,需要名称上带有LLaMA标识。

    DeepSeek-R1上线API,对用户开放思维链输出,因此一经发布,多家企业就宣布融合DeepSeek-R1的各个版本,因为是完全开源的模型,在版权上就减少了不少风险。

    在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标0penAlo1-mini的效果.

    3.DeepSeek的创新策略及产生的效果

    ① 创新策略

    第一,引入MLA(Multi-Head Latent Attention)。

    在“All you need is attention”的背景下,传统的多头注意力(MHA,Multi-Head Attention)的键值(KV)缓存机制事实上对计算效率形成了较大阻碍。缩小KV缓存(KV Cache)大小,并提高性能,在之前的模型架构中并未得到很好的解决。

    DeepSeek引入了MLA,一种通过低秩键值联合压缩的注意力机制,在显著减小KV缓存的同时提高计算效率。低秩近似是快速矩阵计算的常用方法,在MLA之前很少用于大模型计算。

    从大模型架构的演进情况来看,Prefill和KV Cache容量瓶颈的问题正一步步被新的模型架构攻克,巨大的KV Cache正逐渐成为历史(实际上在2024年6月发布的DeepSeek-V2就已经很好的降低了KV Cache的大小)。

    第二,创新使用了DeepSeek-MoE架构策略。

    V3使用了61个MoE(Mix of Expert混合专家)block,虽然总参数量很大,但每次训练或推理时只激活了很少链路,训练成本大大降低,推理速度显著提高。

    第三,DeepSeek采用混合精度框架。

    在不同的区块里使用不同的精度来存储数据。我们知道精度越高,内存占用越多,运算复杂度越大。

    DeepSeek在一些不需要很高精度的模块,使用很低的精度FP8储存数据,极大的降低了训练计算量。

    ② 创新策略带来的效果

    第一,计算速度快,成本低。

    架构设计方面:DeepSeek MoE架构在推理时仅激活部分专家,避免了激活所有参数带来的计算资源浪费;MLA架构通过降秩KV矩阵,减少了显存消耗。

    训练策略方面:在训练过程中采用多token预测(MTP)目标,即在每个位置上预测多个未来token,增加了训练信号的密度,提高了数据效率。

    在训练中,对于占据大量计算量的通用矩阵乘法(GEMM)操作,采用FP8精度执行;同时,通过细粒度量化策略和高精度累积过程,解决了低精度训练中出现的量化误差问题。

    第二,推理能力强大。

    强化学习驱动:DeepSeek-R1通过大规模强化学习技术显著提升了推理能力。在数学、代码和自然语言推理等任务上表现出色,性能与OpenAl的o1正式版相当。

    长链推理(CoT)技术:DeepSeek-R1采用长链推理技术,其思维链长度可达数万字,能够逐步分解复杂问题,通过多步骤的逻辑推理来解决问题。

    三、如何高效使用DeepSeek?

    1.DeepSeek的多种使用方式及其表现

    第一种,直接访问DeepSeek官网。虽然免费,但由于访问量过大,表现极不稳定。

    第二种,在GitHub上下载cherry Studio(或者一些其它工具),使用Cherry Studio+DeepSeek API做本地部署。但官方DeepSeek API也存在不稳定的情况。

    第三种,使用Cherry Studio+第三方云厂商DeepSeek API做本地部署。使用第三方云厂商的DeepSeekAPI稳定很多,相比官方API价格也便宜。

    Cherry部署之后,除了DeepSeek,还可以使用OpenAI、月之暗面、智谱清言等API。

    假设我们来解一道高考数学题:设集合A中的元素皆为无重复数字的三位正整数,且元素中任意两者之积皆为偶数,求集合中元素个数的最大值是多少?

    这是一个非常复杂、难度较大的问题,如果采用通义千问等通用大模型,大概率得不出正确答案,而DeepSeek通过分步骤的长链深度思考,一步步给出了正确答案。

    2.简单应用:DeepSeek+知识库

    以构建投资研究框架为例,我们来展示用DeepSeek+知识库的使用。

    第一步,配置embedding模型。嵌入模型,把知识库进行向量化,并进行快速检索;选择嵌入模型(可以使用硅基流动),在Cherry Studio设置中,设置对应的API Key。

    第二步,整理知识库。在Cherry studio的知识库中,配置投研报告知识库,上传相关投研报告(处理知识库主要用到文字,所以知识库支持PDF、PPT、Excel、word等多种文本文件)。完成后,你就在本地有了知识库。

    第三步,在智能对话助手中,选择对应的知识库。

    最后一步,针对知识库进行提问。可以看到,DeepSeek会进行长链思考并展现思考过程。

    需要注意,虽然云厂商不会主动收集你的数据,但并不能100%保证数据安全,对于企业的敏感数据(如财务、营销数据),建议进行本地私有化部署。

    3.复杂应用:DeepSeek+Cursor

    知识库并不能完全展现DeepSeek的深度思考能力,借助于其它工具(如Cursor)可以完成更复杂的任务,如物理世界的小球碰撞实验。

    首先,我们在Cursor的【File->Preferences->Cursor Settings】中设置DeepSeek-r1和DeepSeek-v3模型。

    然后,在openAI API Key中进行设置(这里采用openAI的协议),可以使用自定义的模型。

    设置好DeepSeek-r1和DeepSeek-v3模型之后,接下来就可以在Cursor中选择该模型进行编程。

    我们看一个实际的例子:一个红色的小球在三角区域内运动,碰到边界就反弹,编写一个HTML网页。

    Cursor会新建一个工程,动态展示编程结构。而DeepSeek在长链思考之后,编写出HTML代码,但代码运行可能不符合要求,需要进一步调整,调整的过程我们也只需发出语言(文字对话)指令。

    调整过程如下:

    基于之前的思考,帮我完善HTML。(动作:DeepSeek思考并完善HTML代码。效果:HTML样式有了调整,但是小球还是会飞出三角区域,需要进一步调整。)

    小球弹了之后,弹出去了啊,帮我检查代码……

    考虑小球的重力,以及三角区域的支撑力,小球的弹力进行完善……

    每次运行,小球可以从随机的任意方向抛出……

    小球的弹力大一些……

    最后到地面都垂直弹跳了,不是应该还会滚动么,就是有水平的速度……

    下面增加一个刷新按钮,可以重新执行这个HTML……

    中文显示是乱码,另外考虑到手机显示,页面需要做自适应……

    经过多次调校,DeepSeek终于生成了符合我们要求的HTML代码,并在Cursor工程中进行效果演示。

    通过上面的演示,我们发现,即使不懂代码,也可以通过DeepSeek来完成机器编程,获得期望的效果。

    4.这一次,AI真的“智能”了

    从AlphaGo与围棋世界冠军李世石大战开始,人工智能逐渐介入我们的生活。机器第一次能进行自主思考,完成简单(其实战胜世界冠军这个任务并不简单)任务。

    在发展中的人工智能也一度被我们吐槽为“人工智障”,但从OpenAI开始,人工智能逐渐会处理一些复杂任务了,而DeepSeek展现出了超越普通人的长思维链路,我们不得不感叹:AI真的“智能”了。

    可见,在学习过程中,对于复杂任务的处理有一个逐渐成熟的过程,一切都可以从最简单的开始。当你具备了一些常见的思考、自我更新、自我迭代的能力,就可以完成一些更有价值的作品。

    比如,如果你是一名投资分析师,会用哪种AI助手来辅助完成投研报告呢?如果用通用大模型(相当于文科生)写报告,可能也会完成任务,但显然缺乏严谨的逻辑推理过程。

    因此可能带来市场的盲目跟投或者疯狂踩踏,而DeepSeek的R1模型的严谨推理过程,可以胜任你的助手了。

    四、DeepSeek掀桌子,打通了另一条路

    1.李飞飞50美金复刻R1模型

    在R1及其蒸馏模型推出后,李飞飞团队用不到50美金的云计算费用,成功训练出了一个名为s1的推理模型。该模型在数学和编码能力中的表现,与0penAI的o1和DeepSeek-R1等尖端推理模型不相上下。

    s1模型的训练只用了1000个样本数据,具体过程是:使用Gemini对这1000个样本完善推理过程,然后对Qwen模型进行监督微调。

    消息出来,在网络上一度刷屏。但我们也要了解这个模型成功的背景:

    其一,s1模型是站在巨人的肩膀上,在阿里Qwen和谷歌Gemini大模型进一步训练得到的;

    其二,成本之所以低,是因为只使用了1000个样本(对于企业来说,1000个样本可能足够了,但对于训练完整的大模型是不可能的),通过26分钟花费50美金,达到了一个比较理想的推理效果(与o1相差不大)。

    也就是说,在每个企业中,未来大家都有机会用1000个样本经过精细训练就可能达到类似效果。

    如果稍微展开,可以发现s1模型背后有自己的独特方法论:

    首先,数据集的构建有三个标准(难度、多样性和质量),从这三个标准出发,挑选了1000个问题及对应的推理路径。

    S1的数据集包含了不同领域,如数学竞赛、物理竞赛,并且新增了两个原创数据集;s1-prob和s1-teasers,分别涵盖了概率问题和定量交易面试中的难题。

    其次,采用了预算强制技术。这是一种控制测试时计算的技术,通过强制终止或延长模型的思考过程(通过添加“wait”字符串),使模型有机会重新检查答案,从而可能纠正错误的推理步骤。

    在预算强制技术下,有三个强制策略。

    其一,设定思考时间限制:当模型开始处理一个问题时,首先为其设定了一个最大思考时间(以token数量衡量)。如果模型在这个时间内完成了思考并准备给出答案,则按照正常流程进行。

    其二,强制结束思考过程:如果模型生成的思考token超过了预设的最大值,系统会强行终止模型的思考过程。这通常是通过添加一个特殊的end-of-thinking token delimiter实现的,促使模型停止进一步的推理,并转向生成最终答案。

    其三,鼓励更深入的探索:如果希望模型花更多的时间来考虑一个问题,可以抑制end-of-thinking token delimiter的生成,并在当前的推理路径后面追加“wait”字符串=>为了让模型有机会重新评估其先前的推理步骤,可能会纠正一些快速但不准确的回答。

    2.继DeepSeek后的AI趋势

    趋势一:小模型将成为主流(大模型蒸馏)。

    通过蒸馏技术将大型模型的推理能力成功迁移到小型模型中,显著提升了小型模型的性能(DeepSeek-R1-Distil-Qwen-7B在AIME 2024竞赛中击败了32B模型)。

    趋势二:使用合成数据进行训练成为主流。

    虽然蒸馏数据是公开的秘密,但很多表现不是蒸馏能解释的。比如v3的中文能力,很多用词和表达方式非常接地气,可能是用了数据合成方法做的预训练。

    趋势三:AI模型将自我迭代(强化学习新范式)。

    让模型自己出题自己做,自己检查。第一步:模型自己出题(比如100万道);第二步,模型自己检查对错;第三步,筛选验证对的内容,将结果与思维链合成新的数据。

    比如在100万道题目中,模型检查后发现有1万道能验证是对的,那么解出这1万道题的思维链就成了新的训练数据。通过不断迭代,探索出之前人类没有探索到的地方(类似AlphaGo-Zero战胜AlphaGo)。

    来源:微信公众号 “笔记侠”