據《CNBC》報導,美國AI新創公司Scale AI創辦人Alexandr Wang指出,DeepSeek擁有約5萬個輝達H100晶片,而這些AI晶片早在2022年拜登政府時期就遭列出口管制措施,禁止出口給中國公司。由於中國在AI發展遭到美國全面限制,尤其又以提供AI訓練的算力來源、也就是包括輝達、AMD這幾年所打造的AI GPU,幾乎在過去一段時間遭到拜登政府一步步封殺出口管道,然而,DeepSeek的出現,顯示可以透過各種低成本、或是算力較低的方式,也能訓練出如OpenAI的o1的模型。

DeepSeek聲稱,他們只花了550萬美元,就打造出如此成就,如今在中國App store的下載排行更是排名首位。至於近期引發熱議的DeepSeek-R1,由於其為開源LLM,代表任何開發者都可以下載並根據自身需求修改,嚴重衝擊當前的AI語言模型商業模式,尤其是僅用2048個H800、耗時2個月就推出6710億參數的DeepSeek-V3,相較於Meta的4050億參數Llama 3.1,使用超過1.6萬個H100,花了54天,更是耗費數億美元經費,DeepSeek的訓練效率提升11倍。

中媒《每日經濟新聞》報導,一名Meta工程師相當焦慮並寫下文章,指稱Meta內部因為DeepSeek陷入恐慌,DeepSeek-V3在基準測試已經讓Llama 4相形見絀,更強調對方是僅用550萬美元就能做到這點的中國AI新創公司,不過,該文章真實性還有待查證。

Alexandr Wang則是爆料,DeepSeek擁有約5萬個輝達H100晶片,但顯然此事不能公開說明,因為這違反美國AI晶片禁令,他認為之後該公司會受到美國政府的晶片出口管制措施與相關限制。拜登政府從2022年開始,就限制包括H100、H200晶片出口給中國公司,甚至連符合算力規定的H800、A800等特供中國的晶片,也在之後的禁令遭到限制。

不過,美國商務部近期針對輝達的AI晶片流入中國進行調查,除了近期爆出中國AI新創公司有突破性發展,多家外媒也在去年提及,中國公司利用各種管道,甚至是讓白手套公司,將最新先進AI晶片,或是有一定算力的GPU走私到中國,讓中國AI發展能在美國全面封鎖下持續推進。