由於DeepSeek創辦人梁文鋒在AI領域毫無知名度,美國AI領域領導人物之一、Anthropic聯合創辦人克拉克(Jack Clark)甚至認為,DeepSeek的員工是一批來自東方「莫測高深的奇才」。
根據中國科技媒體36氪報導,梁文鋒1985年出生於廣東省湛江市,自稱是普通家庭出身,父母親都是中學老師。不過,梁文鋒從小喜歡數學,高中畢業時以「高考狀元」成績考入浙江大學電子資訊工程系,後來又取得了資訊與通訊工程研究所碩士學位。
梁文鋒不甘只是成為一名IT工程師,在學校期間就非常關注金融市場的操作。2008年的全球金融海嘯成了他練功與發展的良機,他以自己研發的量化投資軟體在股市中獲得了第一桶金。後來,中國在2010年推出了滬深300股指期貨,梁文鋒帶領團隊發展出了自動量化交易程式,在投資領域發家致富。
由於在投資市場已經小有名氣,梁文鋒又成立私募對沖基金,可供操作金額已經高達數百億人民幣。
不過,梁文鋒始終無法忘情科技領域。美國OpenAI在2022年推出ChatGPT後,震驚全世界科技領域。隔年,梁文鋒就正式成立了專注人工智慧大模型技術研發的創新公司DeepSeek。
梁文鋒先前受訪時表示,中國與美國在人工智慧領域的差距不是一年、二年,而是「代差」,是一代、二代間的差距。他不想「跟隨」,而是想「創新」,選擇最困難的挑戰。DeepSeek是小公司,他以「最困難的挑戰」為號召,選擇中國本土出身的頂尖人才,都非常年輕,沒有一個國外留學回來的研發人員。
DeepSeek-V3語言模型去年年底問世後,對標人工智慧領域的龍頭ChatGPT,以號稱「低成本、高效能、開放」的模式,取得接近或勝出ChatGPT的成績。這個撼動科技界的發展,也讓低調的梁文鋒無法再隱身於幕後。