1月20日下昼开云kaiyun官方网站,中共中央政事局常委、国务院总理李强主抓召开巨匠、企业家和教科文卫体等领域代表谈话会,听取对《政府责任发达(征求意见稿)》的意见建议。
谈话会上,张辉、任少波、刘珺、梁文锋、魏洪兴、陈学东、陈红彦、杜斌、邹敬园等先后发言。
有着重者发现,第四位发言的梁文锋,即是最近一段时期颇受关注的大模子DeepSeek的创举东说念主。17岁考入浙江大学、30岁创办幻方量化、36岁料理千亿范围的私募基金……在金融和东说念主工智能领域深耕多年的梁文锋有着特地亮眼的经历。

图片开头:央视新闻
在国表里互联网巨头接连漠视“All in AI”,花高价买显卡、堆算力之际,他指导的DeepSeek却凭借对试验轨范和模子架构的改造,使得试验出的模子在大幅度裁汰算力本钱的同期,性能上平直赶超好意思国AI巨头OpenAI进入超百倍的顶级模子GPT-4o,也引得雷军拿出千万年薪罗致该神志团队的中枢参与者。
在外界的宽恕之下,梁文锋却特地低调,这两年,他很少采用媒体的采访,也鲜少公开出头参加行为。昨天《新闻联播》播出的总理谈话会的画面,让许多东说念主第一次看到了他的真实状貌。
“85后”科技大佬火了!
一位“80后”的深度求索之路
梁文锋,1985年降生于广东省湛江市。2002年,这位对数学建模充满激情的年青东说念主考入浙江大学电子信息工程专科,并在随后的几年里链接深造,最终于2010年取得信息与通讯工程硕士学位。
在校时代,他对金融市集产生了浓厚的风趣。终点在2008年全球金融危险之际,他指导团队探索了机器学习时刻在全自动量化往来中的应用后劲,这已经历为他日后的奇迹生存奠定了坚实的基础。
毕业后,梁文锋将眼神转向更广博的金融市集。
2013年,他与浙大同学徐进共同创立了杭州雅克比投良友理有限公司,两年后又确立了杭州幻方科技有限公司,极力于于通过数学和东说念主工智能进行量化投资。2015年的市集波动中,幻方依靠先进的高频量化策略取得了令东说念主瞩接头收成。
2016年是幻方的紧迫漂流点。这一年,公司推出了首个基于深度学习的往来模子,并罢了了统统目化策略的AI化转型。2018年,幻合模范建立了以AI为中枢的发展计谋。然则,跟着业务的快速扩展,算力瓶颈渐渐显现。
为贬责接头资源不足的问题,2019年,梁文锋指导团队自主研发了“萤火一号”试验平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的进入增多到10亿元,搭载了约1万张英伟达A100显卡。
2021年,幻方的钞票料理范围破损千亿大关,置身国内量化私募领域的“四大天王”之列。2023年,他晓示将负责进击通用东说念主工智能领域,并创办了深度求索DeepSeek,专注于作念简直东说念主类级别的东说念主工智能。
2024年5月,DeepSeek发布夹杂巨匠话语模子DeepSeek-V2。同庚12月,DeepSeek-V3问世,这款性能优厚且性价比极高的诳言语模子,被硅谷同业誉为“来自东方的神秘力量”。
“咱们仅仅不抑遏成了一条鲶鱼”
DeekSeek的走红,源于业内一场狠毒的大模子价钱战。
2024年5月初,DeekSeek对外晓示,其开源模子DeepSeek-V2的推理本钱被降到每百万token仅 1块钱,约等于GPT-4 Turbo的七特地之一。随后,智谱、豆包、通义千问、文心一言等国内名次靠前的大模子先后跟进,最高降幅以致高达97%经此一役,DeepSeek解锁了一个新诨名——AI界的拼多多。
关于这场由我方掀翻的价钱战,梁文锋的恢复云淡风轻。他说:“咱们不是特意成为一条鲶鱼,仅仅不抑遏成了一条鲶鱼。”他暗意,没念念到价钱让大家这样敏锐。咱们的原则是不贴钱,也不赚取暴利。这个价钱亦然在本钱之上略微有点利润。
一家初创企业,为何能将大模子欢叫的推理价钱极限压低?
这源自于DeepSeek对模子架构进行了全办法的改造。有征询者指出,它漠视的一种簇新的机制架构,把显存占用降到了曩昔最常用架构的5%-13%,再加上始创的结构改造,最终促成了本钱的着落。
对此,有位有名的科技博主打了一个形象的譬如:OpenAI的试验轨范是“巨流漫灌式”,拿来的数据放到“黑盒”里试验,反复试验直至成效,因此很烧钱;而DeepSeek是先一步诈欺算法,对数据进行转头和分类,然后运送给大模子。这意味着大模子的试验比较“黑盒”变得愈加规章和透明化。
但是,DeepSeek出色的建立与其团队范围变成了显着的对比。字据公开报说念,DeepSeek的职工范围不足OpenAI的1/5,百东说念主出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的征询东说念主员共有约70东说念主,主要在北京分部,其余30多东说念主在杭州总部,多为前端、家具以及商务东说念主员。
让东说念主齰舌的是,这家公司内并莫得外界扩张的神秘莫测的奇才。梁文锋曾自大,职工齐是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年青东说念主。他说,在东说念主工智能领域,“前50名顶尖东说念主才可能不在中国,但也许咱们能我方打造这样的东说念主。”
在梁文锋看来,在这一波东说念主工智能的海潮中,DeepSeek的起点,不是趁便赚一笔,而是走到时刻的前沿,去鼓舞通盘生态发展。他说:“曩昔许多年,中国公司民俗了别东说念主作念时刻改造,咱们拿过来作念应用变现,但这并非是一种理所诚然。”
“用最弥远的见解去回答最大的问题”
进入DeepSeek的官方微信公众号,一段精真金不怕火但有劲的先容语映入眼帘:
“投身于探索AGI的本体,不作念中和的事,带着有趣心,用最弥远的见解去回答最大的问题。”
从2023年11月2日开动更新以来,DeepSeek的公众号在1年多的时期里只更新了38篇著作,且大普遍为新模子发布、升级以及招募种种东说念主员的信息。从2024年12月底开动,公众号发出的三篇著作的阅读量均在10万+以上。
这也从侧面反应,外界对这家神秘的公司产生了热烈的有趣心。
一家量化基金为什么要作念大模子?为什么给我方的定位是“作念征询、作念探索”?征询经费那儿来?对买卖阵势作念了哪些推演和设念念?2023年5月下旬,创业十余年后第一次公开采用“暗涌Waves”采访的梁文锋,聚首回答了这些问题。
他说,通用东说念主工智能可能是下一个最难的事之一。因此,“对咱们来说,这是一个奈何作念的问题,而不是为什么作念的问题。”梁文锋暗意,团队成员的研发心思源自于一种有趣心驱动。
关于企业的买卖答复和盈利阵势,他坦言说念,“淌若一定要找一个买卖上的根由,它可能是找不到的,因为划不来。但当今比较细目的是,既然咱们念念作念这个事,又有这个智商,这个时期点上咱们就是最安妥东说念主选之一。”
最近一段时期,DeepSeek的作为不断。1月20日晚,它负责发布DeepSeek-R1,并同步开源模子权重。文中对家具的先容如下:该模子在后试验阶段大范围使用了强化学习时刻,在仅有少量标注数据的情况下,极大进步了模子推明智商。在数学、代码、当然话语推理等任务上,性能并列 OpenAI o1 郑再版。
后文还写说念:在此,咱们将DeepSeek-R1 试验时刻一起公开,以期促进时刻社区的充分调换与改造引诱。
此前,有媒体在采访过梁文锋之后,将这个团队的行为转头为“一个更极致的中国时刻理念念主义故事”。
但在极致的时刻理念念主义以外,低调少言的梁文锋亦然一位厚重的执行主义者。他曾暗意开云kaiyun官方网站,英伟达的跳跃,不仅仅一个公司的纳闷,而是通盘西方时刻社区和产业共同纳闷的成果。因为,他们能看到下一代的时刻趋势,手里有阶梯图。中国AI的发展,相似需要这样的生态。