DeepSeek,,全稱杭州深度求索人工智能基礎技術研究有限公司,,是一家成立于2023年的創(chuàng)新型科技公司,由知名私募巨頭幻方量化孕育而生,,專注于開發(fā)先進的大語言模型(LLM)和相關技術,。憑借強大的深度學習能力和廣泛的應用場景,,DeepSeek在全球科技領域引發(fā)廣泛關注。
隨著國產(chǎn)開源大模型DeepSeek的強勢出圈,,其背后的核心團隊也引起了廣泛專注,。資料顯示,DeepSeek的創(chuàng)始人為梁文鋒,,公司核心團隊的最大特點是年輕,,核心技術崗位基本上以應屆和畢業(yè)一兩年的人為主,許多成員的工作時間都不長,,不少還是在讀博士,。除此之外,DeepSeek團隊成員也多來自中國本土市場,,工程師和研發(fā)人員幾乎都來自清華大學,、北京大學、中山大學,、北京郵電大學等國內(nèi)頂尖高校,,鮮有“海歸”,。
*DeepSeek主創(chuàng)團隊名單是小編根據(jù)公開資料整理而得。名單僅供參考和幫助,,歡迎在末尾交流探討,。
梁文鋒,畢業(yè)于浙江大學,,擁有信息與電子工程學系學士和碩士學位,,杭州幻方科技有限公司、DeepSeek創(chuàng)始人,。在他的帶領下,,DeepSeek對人才極其看重,不看經(jīng)驗,,只看能力,。
高華佐,,畢業(yè)于北京大學物理系,為MLA架構做出了關鍵創(chuàng)新,。
曾旺丁,,畢業(yè)于北京郵電大學,研究生導師是北郵人工智能與網(wǎng)絡搜索教研中心主任張洪剛,,其為MLA架構做出了關鍵創(chuàng)新,。
邵智宏,清華大學交互式人工智能(CoAI)課題組博士生,,師從黃民烈教授,。曾在微軟研究院工作過,是DeepSeekMath核心作者之一,,此外還參與了DeepSeek-Prover,、DeepSeek-Coder-v2、DeepSeek-R1等項目,。
朱琪豪,,北京大學計算機學院軟件研究所2024屆博士畢業(yè)生,受熊英飛副教授和張路教授指導,,研究方向為深度代碼學習,。朱琪豪是DeepSeekMath核心作者之一,此外還基于他的博士論文工作,,主導開發(fā)了DeepSeek-Coder-V1,。
Peiyi Wang,北京大學博士生,,受北京大學計算語言學教育部重點實驗室穗志方教授指導,,是DeepSeekMath核心作者之一。
代達勱,,2024年博士畢業(yè)于北京大學計算機學院計算語言所,,師從穗志方教授,他從V1就加入到DeepSeek,,一直到V3,。
趙成鋼,,畢業(yè)于清華大學,,大二時成為清華學生超算團隊正式成員,三次獲得世界大學生超算競賽冠軍,,曾在英偉達實習,,在DeepSeek中擔任訓練/推理基礎架構工程師,。
吳俁,2019年博士畢業(yè)于北京航空航天大學,,博士期間接受北航李舟軍教授和MSRA前副院長周明博士的聯(lián)合培養(yǎng),,曾在微軟MSRA參與過小冰和必應百科項目,是DeepSeek后訓練團隊的負責人,。
郭達雅,,2023年博士畢業(yè)于中山大學,由中山大學印鑒教授與MSRA周明博士聯(lián)合培養(yǎng),,2024年7月加入DeepSeek,,主要參與了一系列數(shù)學和代碼大模型的工作。