บ้าน > ข่าว > ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา
ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา

Chatbot ใหม่ของ Deepseek มีการแนะนำที่น่าประทับใจ: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" AI นี้ซึ่งเป็นผลิตภัณฑ์ของการเริ่มต้นของจีน Deepseek ได้กลายเป็นผู้เล่นในตลาดรายใหญ่อย่างรวดเร็วแม้กระทั่งมีส่วนทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมีนัยสำคัญ

ความสำเร็จของ Deepseek เกิดจากสถาปัตยกรรมที่เป็นนวัตกรรมและวิธีการฝึกอบรม เทคโนโลยีที่สำคัญ ได้แก่ :
- การทำนายแบบมัลติเทน (MTP): แทนที่จะทำนายคำแต่ละคำ MTP คาดการณ์หลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): สถาปัตยกรรมนี้ใช้เครือข่ายประสาทหลายเครือข่ายเร่งการฝึกอบรมและปรับปรุงประสิทธิภาพ Deepseek V3 ใช้ 256 เครือข่ายเปิดใช้งานแปดสำหรับแต่ละโทเค็น
- ความสนใจแฝงหลายหัว (MLA): MLA มุ่งเน้นไปที่ชิ้นส่วนประโยคที่สำคัญการสกัดรายละเอียดสำคัญซ้ำ ๆ เพื่อลดการสูญเสียข้อมูลและจับความแตกต่างเล็กน้อย

ในขณะที่ Deepseek เริ่มแรกอ้างว่ามีค่าใช้จ่ายในการฝึกอบรมที่ต่ำอย่างน่าทึ่งที่ $ 6 ล้านสำหรับ Deepseek V3 โดยใช้ GPU เพียง 2048 แต่ Semianalysis เปิดเผยโครงสร้างพื้นฐานที่สำคัญกว่า: GPU NVIDIA Hopper ประมาณ 50,000 NVIDIA (รวมถึง 10,000 H800, 10,000 H100 และ H20 GPU เพิ่มเติม) สิ่งนี้แปลว่าการลงทุนเซิร์ฟเวอร์ประมาณ 1.6 พันล้านเหรียญสหรัฐและค่าใช้จ่ายในการดำเนินงานประมาณ $ 944 ล้าน
Deepseek ซึ่งเป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงของจีนที่มีการบินสูงเป็นเจ้าของศูนย์ข้อมูลให้การควบคุมการเพิ่มประสิทธิภาพและการใช้นวัตกรรมที่เร็วขึ้น วิธีการที่ได้รับการสนับสนุนตนเองนี้ช่วยเพิ่มความยืดหยุ่นและการตัดสินใจ บริษัท ยังดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยจีน

การเรียกร้องค่าใช้จ่ายการฝึกอบรมเริ่มต้นของ Deepseek ครั้งแรกของ Deepseek นั้นทำให้เข้าใจผิด มันสะท้อนให้เห็นถึงการใช้งาน GPU ก่อนการฝึกอบรมไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน การลงทุนทั้งหมดของ บริษัท ในการพัฒนา AI เกิน $ 500 ล้าน อย่างไรก็ตามโครงสร้างแบบลีนช่วยให้สามารถใช้นวัตกรรมที่มีประสิทธิภาพเมื่อเทียบกับ บริษัท ที่มีขนาดใหญ่และมีระบบราชการมากขึ้น

ความสำเร็จของ Deepseek นำเสนอศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีในการแข่งขันกับยักษ์ใหญ่ในอุตสาหกรรม ในขณะที่การเรียกร้อง "งบประมาณปฏิวัติ" เกินจริงความสำเร็จของมันเชื่อมโยงอย่างปฏิเสธไม่ได้กับการลงทุนที่สำคัญความก้าวหน้าทางเทคนิคและทีมที่แข็งแกร่ง ความแตกต่างนั้นสิ้นเชิงเมื่อเปรียบเทียบค่าใช้จ่ายในการฝึกอบรม: Deepseek ใช้เงินประมาณ 5 ล้านดอลลาร์ใน R1 ในขณะที่ CHATGPT-4 มีค่าใช้จ่ายประมาณ $ 100 ล้าน แม้จะพิจารณาจากการลงทุนที่สำคัญ Deepseek ยังคงถูกกว่าคู่แข่งอย่างมีนัยสำคัญ
-
Happy World Puzzles* Happy World Puzzles* เป็นเกมจิ๊กซอว์ที่สนุกสนานและการศึกษาที่ออกแบบมาเพื่อช่วยให้เด็กพัฒนาทักษะด้านจิตใจและเชิงตรรกะที่จำเป็น เกมที่เล่นง่ายนี้กระตุ้นให้เด็กจดจำรูปร่างลวดลายและความสัมพันธ์เชิงพื้นที่ในขณะที่เพลิดเพลินกับภาพที่มีสีสันและน่าดึงดูด
-
Farkle BlastFarkle Blast เป็นเกมลูกเต๋าที่น่าตื่นเต้นและรวดเร็วซึ่งทำให้ผู้เล่นหลงใหลในการเล่นเกมแบบไดนามิกและความลึกเชิงกลยุทธ์ วัตถุประสงค์คือการรวบรวมคะแนนเป้าหมายก่อนที่ฝ่ายตรงข้ามของคุณจะได้รับการผสมผสานลูกเต๋าเพื่อสร้างชุดค่าผสมที่เฉพาะเจาะจง ผู้เล่นจะต้องตัดสินใจว่าจะธนาคารคะแนนหรือเสี่ยงต่ออโนท
-
VPN DuckVPN Duck เป็นโซลูชันที่คุณต้องผ่านการเซ็นเซอร์อินเทอร์เน็ตเพื่อให้มั่นใจว่าการท่องเว็บที่ไม่ระบุชื่อและการเข้ารหัสการเข้าชมออนไลน์ของคุณ ด้วยการแตะครั้งเดียวคุณสามารถเชื่อมต่อกับเซิร์ฟเวอร์ความเร็วสูงในประเทศที่คุณต้องการทำให้ผู้ให้บริการอินเทอร์เน็ตของคุณอยู่ในความมืดเกี่ยวกับกิจกรรมออนไลน์ของคุณ โดย
-
Manga Booksดำดิ่งสู่จักรวาลที่น่าตื่นเต้นของมังงะด้วยแอพ Manga Books! ด้วยการอัปเดตชื่อมังงะระดับบนทุกวันคุณสามารถดื่มด่ำกับเนื้อหาความละเอียดสูงบนสมาร์ทโฟนของคุณทุกที่ทุกเวลาโดยไม่จำเป็นต้องเชื่อมต่ออินเทอร์เน็ต แอพนี้มีอินเทอร์เฟซที่ใช้งานง่ายเสร็จสมบูรณ์
-
EscapeGame Ruins of the subwayก้าวเข้าสู่บรรยากาศที่น่าขนลุกของซากปรักหักพังที่ถูกทิ้งร้างของรถไฟใต้ดินประสบการณ์เกมหลบหนีล่าสุดของ Panda Studio ที่เต็มไปด้วยความลึกลับและความสงสัย การผจญภัยปริศนาที่ไม่เหมือนใครนี้ตั้งอยู่ในโลกใต้ดินที่ถูกลืมซึ่งรูปปั้นหินแปลก ๆ อยู่ในเงามืดและความลับซ่อนอยู่ข้างหลังทุก ๆ
-
736 Imnuri Crestineค้นพบแอพ 736 Imnuri Crestine ซึ่งสร้างขึ้นมาโดยเฉพาะสำหรับสมาชิกของโบสถ์มิชชั่นวันที่เจ็ด แอพนี้ปฏิวัติวิธีที่คุณเข้าถึงคอลเลกชันเต็มรูปแบบของเพลงสวดทั้งหมด 920 เพลงทั้งหมดนำเสนอในรูปแบบข้อความที่อ่านได้ง่าย การนำทางผ่านเพลงสวดและเพลงสรรเสริญพระบารมีนั้นง่ายดายกับนวัตกรรม