压力给到梁文锋

liukang20243个月前网友吃瓜753

  依据DeepSeek过往的产品更新周期来看,梁文锋的主场时刻又快到了。

优雅的压力给到梁文锋的插图

  文|《我国企业家》记者 闫俊文

  修改|张晓迪

  头图来历|视觉我国

  这两天,中美大模型公司各有大事产生。

  4月15日清晨,OpenAI发布了GPT-4.1系列模型,包含GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的中心特征是本钱更低,速度更快;同一天,另一家我国明星AI公司,智谱AI正式发动上市教导存案,由中金公司担任教导组织。存案陈述显现,智谱AI将在本年8月至10月完结IPO教导方案。

  此前的3月底,智谱AI CEO张鹏曾告知《我国企业家》,他判别完成AGI,旅程还长,“不论咱们融了多少钱,其实都是AGI道路上的旅费,未来,还需求更多旅费,咱们会继续地做相关的工作”。

  现在看来,这个“更多的旅费”就是指IPO。

  2025年开年,DeepSeek“燃爆”AI圈,现在,到R1模型正式发布现已曩昔86天。

  DeepSeek和梁文锋的团队什么时候推出新的大模型产品,尤其是R1的更新版?

  《我国企业家》计算了国外Anthropic、Meta等公司更新大模型的周期,如果是模型的严重晋级,周期在5至10个月左右;而同一版别的功用晋级则在3至4个月之间。

  依据DeepSeek官网数据,梁文锋的AI团队更新产品与国外干流公司同频,2024年9月发布V2.5,12月发布V3,2025年3月将V3更新为V3-0324版别,也简直每隔3个月就会迎来一次晋级。

现代的压力给到梁文锋的插图

  有一些猜测以为,DeepSeek下一次更新R1模型或许是在5月初,届时或提早发布,但DeepSeek方面现在还没有对这种猜测进行回应。

  OpenAI也在寻求更小更快

  揭露材料显现,GPT-3的参数规划为1750亿,GPT-4的参数规划为1.76万亿,到了GPT-4o参数约2000亿规划,此次OpenAI推出的GPT-4.1 Mini,被称作OpenAI的高效小型模型,在多个基准测验中体现逾越GPT-4o,大幅削减推迟并下降83%本钱。

  GPT-4.1 Nano被称之为首个超小型模型,它能支撑100万token的上下文窗口,适用于低推迟使命,如分类和主动补全。

  值得注意的是,上述三个模型将上下文窗口处理的规划从GPT-4o的128K直接提升至100万token(1M)。这意味着模型在更长的文本中坚持专心和了解的才能得到了强化。

  详细到本钱、价格方面,GPT‑4.1比GPT‑4o廉价26%,输入、输出分别是每百万token2美元和8美元;GPT‑4.1 Nano输入、输出分别为0.1美元和0.4美元。

  比照DeepSeek,规范时刻段内,V3模型输入、输出百万token的费用为0.5元、8元,R1推理的费用分别为1元和16元。

  可以说,OpenAI也打上了token的价格战,价格直接对标DeepSeek。

  与此一起,OpenAI已暂停了其此前2月发布的GPT-4.5,原因在于本钱太高,其API定价为输入、输出每百万token75美元、150美元。官方回应说此次调整旨在将更多资源投入未来模型的研制。

  关于开源,OpenAI的CEO山姆·阿尔特曼不得不走向与DeepSeek相同的途径,他曾表明,DeepSeek的呈现并未影响GPT的增加,OpenAI将推出更好的开源模型。

  不过,在DeepSeek冲击之下,阿尔特曼从前一度十分动火,乃至惊惧,他曾在交际平台上责备R1模型使用了GPT的数据蒸馏,又写揭露信给美国政府,宣称约束AI技能流向我国等国家,并禁用DeepSeek。

迷人的压力给到梁文锋的插图

  来历:视觉我国

  但这并不影响DeepSeek的影响力。在英伟达的2025GTC开幕主题讲演会上,黄仁勋数次说到R1模型,并用R1模型验证了黄仁勋所谓的“推理越多,所需算力越多”的说法。

  除了OpenAI,谷歌在4月9日也举办了发布会,宣告推出Agent2Agent智能体交互协议,该协议答应生态系统中的AI智能体进行底层技能无关的彼此操作。多个智能体的协作将带来更高的自主性,一起成倍进步生产力、下降长时刻本钱。

  梁文锋的主场时刻又快到了

  在R1模型“爆火”之后,DeepSeek除了模型晋级,人事布局上动作颇多,DeepSeek官网在3月份发布了招聘CFO、COO、财政负责人岗位的信息。这也被一些媒体解读为DeepSeek在为融资做准备;模型方面,DeepSeek最大的动作是3月25日发布了V2模型的更新版。

  现在,DeepSeek并未发布有关融资方面的信息。4月3日,梁文锋和团队宣布了一篇论文,标题是《通用奖赏建模的推理时刻缩放》,文章论说了怎么让注意力机制更高效地处理更长的上下文等。

  DeepSeek“燃爆”AI圈后,外界对其充溢猎奇和新的等待。潞晨科技CEO尤洋近期在承受《我国企业家》采访时说,如果有时机跟梁文锋面临面,他最想问梁文锋的是他终究的方针是什么,“梁文锋是想做一个成功的商业化公司,仍是想经过一些其他手法做一些非盈利的工作?这两者必定距离是十分大的,OpenAI或许仍是想做一个Google那样的十分高价值的商业化公司。”

  记者了解到,现在,无论是杭州本地的大公司,仍是深圳的尖端创投,都难见梁文锋一面。

  近期英伟达揭露表明,美国政府正在约束其H20芯片向我国的出口,而且H20芯片对华出口需求取得许可证,这一要求是“无限期”。

  而H20芯片正是梁文锋最介意的“基础设施”,新近,梁文锋在承受媒体采访时说,“咱们真实的应战历来不是资金,而是高端芯片的出口禁令。”

  不过,面临禁令,梁文锋也并非束手待毙,他曾在承受媒体采访时说,“英伟达的GPU没有什么奥秘之处,但要赶上他们,就必须重建团队、支付时刻和本钱,追逐下一代技能——这才是真实的护城河。”

告发/反应
标签: 梁文锋压力

相关文章

至少5死!山火致洛杉矶18万人收分散令;回绝间断!特朗普“封口费”案新进展;碧桂园大音讯;金山工作回应“174位星星求救文档”丨每经早参

NO.1 隔夜商场美股休市一日。欧股首要股指大都收涨,德国DAX30指数跌0.01%,英国富时100指数涨0.81%,法国CAC40指数涨0.51%,欧洲斯托克50指数涨0.43%。英债连跌四天,基准...

驻美国使馆发言人就中方针对美对华加征关税采纳反制办法答记者问

驻美国使馆发言人就中方针对美对华加征关税采纳反制办法答记者问。问:北京时间2月4日,我国国务院关税税则委员会发布关于对原产于美国的部分进口商品加征关税的公告。一起,我国在世贸组织就美国对华产品加征10...

石景山突发:充电宝引发火灾!消防部分紧迫提示

4月15日11时06分,石景山区某住户家中突发火情。火灾致该住户南侧卧室内的桌子、床铺、空调等物品过火严峻受损,其他房间也存在不同程度的烟熏痕迹。所幸未形成人员伤亡。经查询,起火原因系该住户放置在南侧...

印度宣告采纳对等举动!巴外长:巴方不会自动发动战争,未参加印控克什米尔区域突击事情

印度宣告采纳对等举动!巴外长:巴方不会自动发动战争,未参加印控克什米尔区域突击事情

央视新闻音讯,当地时刻4月30日夜间,印度发布飞行布告,现在开端到印度时刻5月24日清晨5时29分停止,约束全部在巴基斯坦注册、运营或租借的飞机进入印度领空,包含商业航空公司和军用飞机。这是巴基斯坦决...

央行稀有破例周末加班!赶在A股开盘前,发布重磅金融数据,A股周一开盘稳了

金融界4月13日音讯 央行稀有周末加班!据央行网站显现,央行发布了一季度金融数据等要害信息。初步统计,2025年一季度社会融资规划增量累计为15.18万亿元,比上年同期多2.37万亿元。一季度人民币...

影视剧里厦门元素多

▲电影《我国乒乓之绝地反击》海报本报记者 郭睿 蒙婧2月17日,由邓超、俞白眉导演的电影《我国乒乓之绝地反击》正式上映。不只该片重要的取景地、拍照地是厦门,影片榜首出品方也是厦门影企。对这部充溢厦门元...

友情链接: