首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

Mar 19,25(3个月前)
DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的新聊天机器人拥有令人印象深刻的介绍:“嗨,我被创建了,您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”这种AI是中国初创公司DeepSeek的产物,已迅速成为主要市场参与者,甚至导致NVIDIA的股价大幅下降。

DeepSeek测试图片:ensigame.com

DeepSeek的成功源于其创新的建筑和培训方法。关键技术包括:

  • 多语预测(MTP): MTP不是单独预测单词,而是同时预测多个单词,从而提高准确性和效率。
  • 专家的混合物(MOE):该体系结构使用多个神经网络,加速培训并提高性能。 DeepSeek V3使用256个网络,每个令牌都激活了8个网络。
  • 多头潜在注意力(MLA): MLA专注于关键的句子部分,反复提取关键细节以最大程度地减少信息丢失并捕获细微的细微差别。
DeepSeek V3图片:ensigame.com

尽管DeepSeek最初仅使用2048 GPU的DeepSeek V3的培训成本非常低,但半分析显示出了更为实质性的基础设施:大约50,000个NVIDIA HOPPER GPU(包括10,000 H800、10,000 H100,以及其他H20 GPU,以及其他跨越多个数据中心的H20 GPU)。这意味着服务器投资约为16亿美元,运营费用约为9.44亿美元。

DeepSeek是中国对冲基金高飞行员的子公司,拥有其数据中心,提供了对优化和更快的创新实施的控制。这种自资助的方法增强了灵活性和决策。该公司还吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。

DeepSeek图片:ensigame.com

DeepSeek最初的600万美元培训成本索赔具有误导性;它仅反映了训练前的GPU使用情况,不包括研究,改进,数据处理和基础架构。该公司对AI开发的总投资超过5亿美元。但是,与更大的官僚主义公司相比,其精益结构允许有效的创新实施。

DeepSeek图片:ensigame.com

DeepSeek的成功展示了一家资金充足的独立AI公司与行业巨头竞争的潜力。尽管其“革命性预算”主张被夸大了,但它的成功与大量投资,技术进步和强大的团队有关。在比较培训成本时,对比很鲜明:DeepSeek在R1上花费了约500万美元,而Chatgpt-4的价格估计为1亿美元。即使考虑到其大量投资,DeepSeek仍然比竞争对手便宜得多。

发现更多
  • Happy World Puzzles
    Happy World Puzzles
    *幸福世界拼图*是一种有趣而教育的拼图游戏,旨在帮助孩子们发展基本的心理和合乎逻辑的技能。这种易于玩的游戏鼓励儿童识别形状,图案和空间关系,同时享受丰富多彩而引人入胜的视觉效果。该应用程序具有40个完整
  • Farkle Blast
    Farkle Blast
    Farkle Blast是一款令人振奋且快速的骰​​子游戏,它具有动态的游戏和战略深度吸引玩家。目的是通过滚动骰子形成特定组合来在对手面前取得目标分数。玩家必须决定是要兑现他们的观点还是冒险
  • VPN Duck
    VPN Duck
    VPN Duck是您绕过Internet审查,确保匿名浏览和加密在线流量的首选解决方案。只需轻按一下即可,您可以连接到首选国家 /地区的高速服务器,使您的互联网服务提供商围绕您的在线活动而陷入困境。经过
  • Manga Books
    Manga Books
    使用漫画书应用深入漫画的激动人心的宇宙!凭借其每日更新顶级漫画标题,您可以随时随地将自己沉浸在智能手机上的高清内容中,而无需互联网连接。该应用具有用户友好的界面,完成
  • EscapeGame Ruins of the subway
    EscapeGame Ruins of the subway
    进入地铁废墟的令人毛骨悚然的气氛,熊猫工作室的最新逃生游戏体验充满了神秘和悬念。这种独特的拼图冒险设置在一个被遗忘的地下世界中
  • Imnuri Creștine AZȘ
    Imnuri Creștine AZȘ
    发现专门为基督复临安息日会成员精心设计的736 IMNURI CRESTINE应用程序。该应用程序彻底改变了您如何访问920个赞美诗的完整集合,所有这些都以易于阅读的文本格式呈现。在Innova中,通过赞美诗和国歌航行非常轻松