压力给到梁文锋

liukang20243个月前 (04-24)网友吃瓜753

　　依据DeepSeek过往的产品更新周期来看，梁文锋的主场时刻又快到了。

　　文|《我国企业家》记者闫俊文

　　修改|张晓迪

　　头图来历|视觉我国

　　这两天，中美大模型公司各有大事产生。

　　4月15日清晨，OpenAI发布了GPT-4.1系列模型，包含GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano，它们的中心特征是本钱更低，速度更快；同一天，另一家我国明星AI公司，智谱AI正式发动上市教导存案，由中金公司担任教导组织。存案陈述显现，智谱AI将在本年8月至10月完结IPO教导方案。

　　此前的3月底，智谱AI CEO张鹏曾告知《我国企业家》，他判别完成AGI，旅程还长，“不论咱们融了多少钱，其实都是AGI道路上的旅费，未来，还需求更多旅费，咱们会继续地做相关的工作”。

　　现在看来，这个“更多的旅费”就是指IPO。

　　2025年开年，DeepSeek“燃爆”AI圈，现在，到R1模型正式发布现已曩昔86天。

　　DeepSeek和梁文锋的团队什么时候推出新的大模型产品，尤其是R1的更新版？

　　《我国企业家》计算了国外Anthropic、Meta等公司更新大模型的周期，如果是模型的严重晋级，周期在5至10个月左右；而同一版别的功用晋级则在3至4个月之间。

　　依据DeepSeek官网数据，梁文锋的AI团队更新产品与国外干流公司同频，2024年9月发布V2.5，12月发布V3，2025年3月将V3更新为V3-0324版别，也简直每隔3个月就会迎来一次晋级。

　　有一些猜测以为，DeepSeek下一次更新R1模型或许是在5月初，届时或提早发布，但DeepSeek方面现在还没有对这种猜测进行回应。

　　OpenAI也在寻求更小更快

　　揭露材料显现，GPT-3的参数规划为1750亿，GPT-4的参数规划为1.76万亿，到了GPT-4o参数约2000亿规划，此次OpenAI推出的GPT-4.1 Mini，被称作OpenAI的高效小型模型，在多个基准测验中体现逾越GPT-4o，大幅削减推迟并下降83%本钱。

　　GPT-4.1 Nano被称之为首个超小型模型，它能支撑100万token的上下文窗口，适用于低推迟使命，如分类和主动补全。

　　值得注意的是，上述三个模型将上下文窗口处理的规划从GPT-4o的128K直接提升至100万token（1M）。这意味着模型在更长的文本中坚持专心和了解的才能得到了强化。

　　详细到本钱、价格方面，GPT‑4.1比GPT‑4o廉价26%，输入、输出分别是每百万token2美元和8美元；GPT‑4.1 Nano输入、输出分别为0.1美元和0.4美元。

　　比照DeepSeek，规范时刻段内，V3模型输入、输出百万token的费用为0.5元、8元，R1推理的费用分别为1元和16元。

　　可以说，OpenAI也打上了token的价格战，价格直接对标DeepSeek。

　　与此一起，OpenAI已暂停了其此前2月发布的GPT-4.5，原因在于本钱太高，其API定价为输入、输出每百万token75美元、150美元。官方回应说此次调整旨在将更多资源投入未来模型的研制。

　　关于开源，OpenAI的CEO山姆·阿尔特曼不得不走向与DeepSeek相同的途径，他曾表明，DeepSeek的呈现并未影响GPT的增加，OpenAI将推出更好的开源模型。

　　不过，在DeepSeek冲击之下，阿尔特曼从前一度十分动火，乃至惊惧，他曾在交际平台上责备R1模型使用了GPT的数据蒸馏，又写揭露信给美国政府，宣称约束AI技能流向我国等国家，并禁用DeepSeek。

　　来历：视觉我国

　　但这并不影响DeepSeek的影响力。在英伟达的2025GTC开幕主题讲演会上，黄仁勋数次说到R1模型，并用R1模型验证了黄仁勋所谓的“推理越多，所需算力越多”的说法。

　　除了OpenAI，谷歌在4月9日也举办了发布会，宣告推出Agent2Agent智能体交互协议，该协议答应生态系统中的AI智能体进行底层技能无关的彼此操作。多个智能体的协作将带来更高的自主性，一起成倍进步生产力、下降长时刻本钱。

　　梁文锋的主场时刻又快到了

　　在R1模型“爆火”之后，DeepSeek除了模型晋级，人事布局上动作颇多，DeepSeek官网在3月份发布了招聘CFO、COO、财政负责人岗位的信息。这也被一些媒体解读为DeepSeek在为融资做准备；模型方面，DeepSeek最大的动作是3月25日发布了V2模型的更新版。

　　现在，DeepSeek并未发布有关融资方面的信息。4月3日，梁文锋和团队宣布了一篇论文，标题是《通用奖赏建模的推理时刻缩放》，文章论说了怎么让注意力机制更高效地处理更长的上下文等。

　　DeepSeek“燃爆”AI圈后，外界对其充溢猎奇和新的等待。潞晨科技CEO尤洋近期在承受《我国企业家》采访时说，如果有时机跟梁文锋面临面，他最想问梁文锋的是他终究的方针是什么，“梁文锋是想做一个成功的商业化公司，仍是想经过一些其他手法做一些非盈利的工作？这两者必定距离是十分大的，OpenAI或许仍是想做一个Google那样的十分高价值的商业化公司。”

　　记者了解到，现在，无论是杭州本地的大公司，仍是深圳的尖端创投，都难见梁文锋一面。

　　近期英伟达揭露表明，美国政府正在约束其H20芯片向我国的出口，而且H20芯片对华出口需求取得许可证，这一要求是“无限期”。

　　而H20芯片正是梁文锋最介意的“基础设施”，新近，梁文锋在承受媒体采访时说，“咱们真实的应战历来不是资金，而是高端芯片的出口禁令。”

　　不过，面临禁令，梁文锋也并非束手待毙，他曾在承受媒体采访时说，“英伟达的GPU没有什么奥秘之处，但要赶上他们，就必须重建团队、支付时刻和本钱，追逐下一代技能——这才是真实的护城河。”

告发/反应