依据DeepSeek过往的产品更新周期来看,梁文锋的主场时刻又快到了。
文|《我国企业家》记者 闫俊文
修改|张晓迪
头图来历|视觉我国
这两天,中美大模型公司各有大事产生。
4月15日清晨,OpenAI发布了GPT-4.1系列模型,包含GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的中心特征是本钱更低,速度更快;同一天,另一家我国明星AI公司,智谱AI正式发动上市教导存案,由中金公司担任教导组织。存案陈述显现,智谱AI将在本年8月至10月完结IPO教导方案。
此前的3月底,智谱AI CEO张鹏曾告知《我国企业家》,他判别完成AGI,旅程还长,“不论咱们融了多少钱,其实都是AGI道路上的旅费,未来,还需求更多旅费,咱们会继续地做相关的工作”。
现在看来,这个“更多的旅费”就是指IPO。
2025年开年,DeepSeek“燃爆”AI圈,现在,到R1模型正式发布现已曩昔86天。
DeepSeek和梁文锋的团队什么时候推出新的大模型产品,尤其是R1的更新版?
《我国企业家》计算了国外Anthropic、Meta等公司更新大模型的周期,如果是模型的严重晋级,周期在5至10个月左右;而同一版别的功用晋级则在3至4个月之间。
依据DeepSeek官网数据,梁文锋的AI团队更新产品与国外干流公司同频,2024年9月发布V2.5,12月发布V3,2025年3月将V3更新为V3-0324版别,也简直每隔3个月就会迎来一次晋级。
有一些猜测以为,DeepSeek下一次更新R1模型或许是在5月初,届时或提早发布,但DeepSeek方面现在还没有对这种猜测进行回应。
OpenAI也在寻求更小更快
揭露材料显现,GPT-3的参数规划为1750亿,GPT-4的参数规划为1.76万亿,到了GPT-4o参数约2000亿规划,此次OpenAI推出的GPT-4.1 Mini,被称作OpenAI的高效小型模型,在多个基准测验中体现逾越GPT-4o,大幅削减推迟并下降83%本钱。
GPT-4.1 Nano被称之为首个超小型模型,它能支撑100万token的上下文窗口,适用于低推迟使命,如分类和主动补全。
值得注意的是,上述三个模型将上下文窗口处理的规划从GPT-4o的128K直接提升至100万token(1M)。这意味着模型在更长的文本中坚持专心和了解的才能得到了强化。
详细到本钱、价格方面,GPT‑4.1比GPT‑4o廉价26%,输入、输出分别是每百万token2美元和8美元;GPT‑4.1 Nano输入、输出分别为0.1美元和0.4美元。
比照DeepSeek,规范时刻段内,V3模型输入、输出百万token的费用为0.5元、8元,R1推理的费用分别为1元和16元。
可以说,OpenAI也打上了token的价格战,价格直接对标DeepSeek。
与此一起,OpenAI已暂停了其此前2月发布的GPT-4.5,原因在于本钱太高,其API定价为输入、输出每百万token75美元、150美元。官方回应说此次调整旨在将更多资源投入未来模型的研制。
关于开源,OpenAI的CEO山姆·阿尔特曼不得不走向与DeepSeek相同的途径,他曾表明,DeepSeek的呈现并未影响GPT的增加,OpenAI将推出更好的开源模型。
不过,在DeepSeek冲击之下,阿尔特曼从前一度十分动火,乃至惊惧,他曾在交际平台上责备R1模型使用了GPT的数据蒸馏,又写揭露信给美国政府,宣称约束AI技能流向我国等国家,并禁用DeepSeek。
来历:视觉我国
但这并不影响DeepSeek的影响力。在英伟达的2025GTC开幕主题讲演会上,黄仁勋数次说到R1模型,并用R1模型验证了黄仁勋所谓的“推理越多,所需算力越多”的说法。
除了OpenAI,谷歌在4月9日也举办了发布会,宣告推出Agent2Agent智能体交互协议,该协议答应生态系统中的AI智能体进行底层技能无关的彼此操作。多个智能体的协作将带来更高的自主性,一起成倍进步生产力、下降长时刻本钱。
梁文锋的主场时刻又快到了
在R1模型“爆火”之后,DeepSeek除了模型晋级,人事布局上动作颇多,DeepSeek官网在3月份发布了招聘CFO、COO、财政负责人岗位的信息。这也被一些媒体解读为DeepSeek在为融资做准备;模型方面,DeepSeek最大的动作是3月25日发布了V2模型的更新版。
现在,DeepSeek并未发布有关融资方面的信息。4月3日,梁文锋和团队宣布了一篇论文,标题是《通用奖赏建模的推理时刻缩放》,文章论说了怎么让注意力机制更高效地处理更长的上下文等。
DeepSeek“燃爆”AI圈后,外界对其充溢猎奇和新的等待。潞晨科技CEO尤洋近期在承受《我国企业家》采访时说,如果有时机跟梁文锋面临面,他最想问梁文锋的是他终究的方针是什么,“梁文锋是想做一个成功的商业化公司,仍是想经过一些其他手法做一些非盈利的工作?这两者必定距离是十分大的,OpenAI或许仍是想做一个Google那样的十分高价值的商业化公司。”
记者了解到,现在,无论是杭州本地的大公司,仍是深圳的尖端创投,都难见梁文锋一面。
近期英伟达揭露表明,美国政府正在约束其H20芯片向我国的出口,而且H20芯片对华出口需求取得许可证,这一要求是“无限期”。
而H20芯片正是梁文锋最介意的“基础设施”,新近,梁文锋在承受媒体采访时说,“咱们真实的应战历来不是资金,而是高端芯片的出口禁令。”
不过,面临禁令,梁文锋也并非束手待毙,他曾在承受媒体采访时说,“英伟达的GPU没有什么奥秘之处,但要赶上他们,就必须重建团队、支付时刻和本钱,追逐下一代技能——这才是真实的护城河。”
4月17日,据英国《金融时报》报导,英伟达CEO黄仁勋今天拜访北京并会见了生成式人工智能草创公司DeepSeek的创始人梁文锋,评论如何为我国规划下一代芯片,以满意客户需求以及中美两边的监管要求。本文...
北京时刻2月18日正午,马斯克旗下人工智能公司xAI搞了一场直播,进行新一代模型Grok 3的介绍和现场演示。
本文来自微信大众号:字母榜,作者:毕安娣,修改:赵晋杰起猛了,差点分不清马斯克和奥特曼。北京时刻2月18日正午,马斯克旗下人工智能公司xAI搞了一场直播,进行新一代模型Grok 3的介绍和现场演示。气...