反击梁文锋,马斯克的“半成品”符合吗?

liukang202415小时前朝阳吃瓜302
本文来自微信大众号:字母榜,作者:毕安娣,修改:赵晋杰

起猛了,差点分不清马斯克和奥特曼。

明亮的反击梁文锋,马斯克的“半成品”够格吗?的图片

北京时刻2月18日正午,马斯克旗下人工智能公司xAI搞了一场直播,进行新一代模型Grok 3的介绍和现场演示。

气氛很轻松,马斯克和xAI团队的三名成员,围坐在一张小桌前,背面是用来展现的大屏幕。不管是这个办法,仍是这个画面,都让人联想到OpenAI。只不过xAI走的是暗黑极客风,OpenAI则是温馨家居风。

这倒也不古怪,究竟马斯克从兴办xAI伊始,就死死盯住OpenAI的背影狂追。

而看起来小小的发布会,在一个小时的时刻里实则杀机满满:

  • Grok 3在多项基准测验中,打败了竞赛对手,包括DeepSeek的V3和OpenAI的GPT-4o;

  • 推出名为“DeepSearch”的智能查找引擎,由推理模型Grok 3 Reasoning和Grok 3 mini Reasoning驱动;

  • Grok 3将显现具体的思想链,和DeepSeek R1和OpenAI的o3-mini类似;

  • *将“赶快”参加语音形式。

xAI的开展迅猛,2023年7月树立,11月就发布了首个大模型Grok。次年5月,xAI完结60亿美元B轮融资,12月又宣告完结60亿美元C轮融资,估值逾越400亿美元。

从上一年9月,xAI建成包括10万张英伟达H100的集群Colossus开端,外界就在等待xAI的下一代大模型的发布。从上一年年末,“跳票”到本年年初,外界又多了新的变数,一边是OpenAI敞开算力基础建设的“星际之门”,一边是DeepSeek掀起低成本推理模型热潮,Grok 3的发布顶着巨大的压力。

在Grok 3发布之前,马斯克做足了预热,称其“聪明得吓人”“(是)最聪明的AI”,但从发布会来看,xAI没有完毕追逐状况。马斯克的AI路,还未到一望无际之境。

就在马斯克鼓足热心发布Grok 3之际,奥特曼也暗戳戳来抢热度,在X(推特前身)上建议投票,问询网友关于OpenAI下一个开源项目的观念,是做一个适当小但仍需求在GPU上运转的o3-mini级模型更有用,仍是做一个能做得最好的手机巨细的端侧模型更有用。

超3万名参加投票的网友中,逾越一半的票投向了端侧模型。究竟,赶在奥特曼前面,大热的DeepSeek,现已抢先掀起了一波在智能手机和新能源轿车等终端,布置端侧模型的浪潮。

Grok 3发布会之前,外界也很关怀特斯拉轿车是否会接入Grok。1月初,马斯克从前给出必定的答复,称Grok会登陆特斯拉。但惋惜的是,本次发布会中,马斯克并未回应特斯拉接入Grok的相关问题。

发布会一开端,xAI就侧重谈了谈Grok 3背面的Colossus超算。

该超算包括10万张英伟达H100芯片,树立仅用三个月,是马斯克的一大“伟业”。连黄仁勋都表明,这可谓“奇观”。

在发布会上,xAI表明练习进行到第92地利,集群的规划拓宽到了20万张芯片。这是该音讯初次被发表。

得益于新核算集群,马斯克在直播讲演中表明:“Grok 3 的才干比 Grok 2 高出10倍。”

据xAI介绍,Grok 3 在包括 AIME(评价模型在数学问题样本上的体现)和 GPQA(运用博士级物理、生物和化学问题评价模型)在内的基准测验中胜过 GPT-4o。此外,Grok 3的前期版别在Chatbot Arena中也取得了有竞赛力的分数,是有史以来第一个打破1400分的模型。这是一项众包测验,让不同的 AI 模型相互竞赛,并让用户投票选出他们喜爱的答案。

细腻的反击梁文锋,马斯克的“半成品”够格吗?的照片

精确地说,Grok 3是一系列模型。

Grok 3的较小版别Grok 3 mini能够更快地答复问题,但会献身一些精确性。

别的两个版别 Grok 3 Reasoning和Grok 3 mini Reasoning,旨在细心“考虑”问题然后再供给解决方案,类似于OpenAI的o3-mini和DeepSeek 的 R1 等“推理”模型。

推理模型在给出成果之前会彻底查看自己,这有助于它们避免通常会绊倒模型的一些圈套。

xAI表明,Grok 3 Reasoning在几个盛行的基准测验中逾越了OpenAI的o3-mini 的最佳版别——o3-mini-high,其间包括一个名为 AIME 2025的较新的数学基准测验。

推理模型可通过 Grok 运用程序拜访。用户能够要求 Grok 3“考虑(Think)”,或许运用“大脑(Big Brain)”形式进行推理,该形式需求额定的核算。xAI 以为推理模型最适合数学、科学和编程相关的问题。

另一个显着冲着OpenAI和DeepSeek来的是“DeepSearch”,直译是“深度查找”。这是一个AI署理,由xAI的推理模型驱动,扫描互联网和X渠道来剖析信息。演示显现,DeepSearch包括研讨、脑筋风暴和数据剖析等选项,会展现“考虑”进程和方案呼应的办法。

就在两周前,OpenAI推出AI署理“DeepResearch”,直译“深度研讨”。

与 DeepSeek R1和现在的OpenAI o3-mini 相同,Grok 3将显现具体的思想链,让用户能够看到谈天机器人是怎么考虑问题的。马斯克证明,xAI 会略微含糊思想,这样其他公司就不能直接仿制xAI的谈天机器人。

顺带一提,马斯克表明,在 Grok 运用中,推理模型的一些“主意”被含糊化,以避免“蒸馏”,即AI模型开发人员从另一个模型中提取常识的办法。最近,DeepSeek 被指控蒸馏 OpenAI 的模型来创立自己的模型。

当然啦,新产品仍是得“会员抢先用”。

X的Premium+等级的订户将首要取得 Grok 3,其他功用则由xAI的新方案SuperGrok供给。SuperGrok 的价格为每月30美元或每年300美元,可解锁额定的推理和 DeepSearch 查询,并供给无限的图画生成。

马斯克表明,未来(最快一周后),Grok 将取得“语音形式”,这将为 Grok 供给组成语音。几周后,Grok 3 模型将与 DeepSearch 功用一同出现在xAI 的企业API中。几个月后,马斯克表明,xAI 将开源 Grok 2。

“咱们的一般做法是,当下一个版别彻底发布时,咱们将开源最终一个版别(Grok)。”马斯克说。“当 Grok 3 老练稳守时,或许在几个月内,咱们就会开源 Grok 2。”

从演示及xAI给出的基准测验成果来看,Grok 3的确实力不俗,但这场发布会仍是略有“匆促”之感。

一贯乐于画饼、擅长于把80分宣扬成101分的马斯克,也在这次发布会时给用户“打预防针”:“这仅仅一个测验版别,刚开端或许会有些不完美。假如你想要更完善的版别,或许需求等上一周。”

此外,语音形式没有发布也值得注意。发布前的几个小时,希冯·齐利斯(Shivon Zilis)——Neuralink高管,一起也是和马斯克育有一对双胞胎的孩子妈,在X上大赞和Grok 3进行的对话,称“是我终身中最出人意料、最值得的韶光之一”,公开了Grok 3有语音功用。

但随后马斯克回复称语音形式还有一些问题,还需求一周左右时刻才干发布。在发布会上,完毕时压轴的也是一小段Grok 3语音对话的画面,看起来语音形式是被暂时从这次发布会中撤销的。

咱们都理解这次发布对马斯克和xAI来说都很重要,Grok 3有必要支棱。

明亮的反击梁文锋,马斯克的“半成品”够格吗?的插图

Grok 3本来定于上一年年末推出,但被推延。依据马斯克的说法,Grok 3在本年一月初完结了练习。

按理说这样的推延并不算久,但刚迈进新年,本年一月连续产生两件大事:一是OpenAI宣告携手软银和甲骨文,共建“星际之门”,估计投入5000亿美元夯实AI基建。二是我国杀出个DeepSeek,其推理模型R1因低成本高性能体现冷艳大洋彼岸的硅谷。

或许也正因如此,马斯克这次硬是整出了苹果发布会的局面,在Grok 3发布之前就预热不断。马斯克在各个场合以及X上都大赞新一代模型,以视频接入迪拜国际政府峰会时称“Grok 3 的体现优于咱们所知的任何已发布产品”,周末在X上声称Grok 3是“地球上最聪明的AI”。

这也能够解说为什么这次语音形式没有彻底准备好、Grok 3也尚处于测验阶段,xAI就急着隆重召开发布会——同行的獠牙,多半现已闪得马斯克睡不着觉了。

马斯克不停地着重“再等一周”,但一周之内国际会产生什么真不好讲。

在DeepSeek于1月底开端打出知名度之后,OpenAI的应对办法就火速跟上,先是给免费用户敞开o3-mini,又发布DeepResearch深度研讨的功用。此外,OpenAI的CEO山姆·奥特曼(Sam Altman)前不久还发布长推文,发布GPT-5的方案。

在更大的竞赛场中,我国的科技大厂如腾讯、百度等,以及出海的我国草创AI公司如MiniMax,都纷繁接入DeepSeek的模型,眼瞅着有打造“技能共同体”之态,构成竞赛合力。

好在马斯克也有打造“马斯克共同体”的潜力。其名下企业很多,借由xAI正在加快互相打通的进程。

图源:AI制造

一开端,似乎是马斯克名下其他几个企业当“扶弟魔”,喂食xAI。陆续传出过特斯拉显卡、X渠道数据被xAI运用的音讯。现在xAI也有了回馈的趋势。

Grok从一开端便是X订阅用户的“特权”,在上一年末,Grok开端供给给X的免费用户,乃至是未注册用户,仅仅模型挑选与发问数量的约束有凹凸之分。本年1月,Grok的独立运用也在苹果商铺上线,正式和ChatGPT翻开比赛。

本次直播期间,翻开X的APP,相关进口在顶部高亮显现。托X的福,这场直播在进行半个小时后就现已有200万次观看,一小时后这个数字到达300万。从前期宣扬、发布会直播到后期嵌入,马斯克算是把X玩理解了。

要知道,据X官方音讯,2024年3月时渠道日活2.5亿,月活5.5亿。比较而言,据《纽约时报》,ChatGPT上一年6月的月活为3.5亿。X关于xAI来说,是一个巨大的流量池。

此次发布会之前,外界也很关怀特斯拉轿车是否会接入Grok。仍是在1月初,马斯克从前给出必定的答复,称Grok会登陆特斯拉,你能够和特斯拉对话,提出任何要求。

但惋惜的是,本次发布会中没有触及特斯拉接入Grok的问题,却是有一名xAI的工作人员问马斯克Grok何时会被接入SpaceX的火箭,马斯克答复“两年”。

不管怎样,xAI接下来一周,都得祈求AI界不要再有“炸场”的同行。再稍久一些的未来,则得等待Grok 3的体现足以感动华尔街,究竟xAI正在考虑以750亿美元估值融资100亿美元,而与此一起,OpenAI据传正在进行一轮400亿美元的融资,方针估值冲着3400亿美元而去。

Grok 3是否是“地球上最聪明的AI”,又是否能持久成为“地球上最聪明的AI”,好戏还在后头。

本文来自微信大众号:字母榜,作者:毕安娣,修改:赵晋杰

本内容为作者独立观念,不代表虎嗅态度。未经答应不得转载,授权事宜请联络 [email protected]

正在改动与想要改动国际的人,都在 虎嗅APP
告发/反应

相关文章

压力给到梁文锋

  依据DeepSeek过往的产品更新周期来看,梁文锋的主场时刻又快到了。  文|《我国企业家》记者 闫俊文  修改|张晓迪  头图来历|视觉我国  这两天,中美大模型公司各有大事产生。  4月15日...

友情链接: