过年亲戚没有聊成婚聊AI:DeepSeek为啥有这么大的
日期:2025-02-08 08:34 浏览:
这个春节,有一款国产 AI 年夜模子成了科技消息里“最靓的仔”,乃至回故乡过年,不少亲戚在饭桌上聊的“下饭话题”都酿成了 AI。咱们这些在北上广互联网公司打工过的牛马,作为家人眼中独一一个懂“修电脑”的人才,天然未免要被问到种种相干成绩。怎样跟不懂得科技行业的亲友挚友简略易懂地讲明白 DeepSeek,颇破费了我一番脑汁,但后果还不错,比方我妈听完后一拍年夜腿表现:八成懂了!(咳咳,有一说一,答复这个成绩仍是比“为什么不完婚/生小孩”,简略多了……ㄟ(▔,▔)ㄏ )接上去我就把我跟我妈讲的归纳综合一下,盼望可能帮你揭开DeepSeek的奥秘面纱。先总结一下,DeepSeek 有三宝:开源普惠,大家可复制嫁接本钱年夜幅下降练习形式冲破性翻新此中每一条都为人类通往构建 AGI 发明了有利前提——所谓 AGI,指的是可能像人类一样实现种种差别义务的人工智能。它不只能做一件事,还能进修、顺应并处理多种成绩。接上去,我们就简略聊聊 DeepSeek 进步在哪儿,有什么特色。DeepSeek R1 强在哪儿?DeepSeek 之前,最为人熟知的年夜模子产物是 ChatGPT,寰球月活泼用户约 4 亿。然而年夜局部用户休会到的 ChatGPT 收费版本仍有很多缺乏。比方,从前你问 ChatGPT 如许的成绩:“小美上午 9 点的心率是 75bpm,下战书 7 点的血压是 120/80。她于晚上 11 点逝世亡。她半夜还在世吗?”Chatgpt 就会被绕晕,给出不靠谱的谜底。这阐明彼时 ChatGPT 并不睬解数字跟数理之间,以及事物之间的逻辑关联,它答复对了可能是瞎蒙,可能是拾人牙慧。注:因为当初的 AI 曾经能处理这类成绩,这里顺便让 ChatGPT 表演更老的版本以展现可能呈现的过错但 DeepSeek R1 在展现成果同时,表现了完全的头脑力(Cot)推理进程,把成绩一步步拆解剖析,而且在进修数学题进程中,表现出了提炼总结数理公式的才能。这就是 DeepSeek R1 在盘算性子上差别于 ChatGPT 跟 GPT-4/4o 的基本差别——R1 是推理模子,后者不是。咱们为了测验它能否真的学会了数理逻辑,而不是靠积聚的语料数据“瞎蒙”,派他去自力处理各种数学跟编程比赛的成绩,成果非常亮眼——在MATH基准测试中的得分为 97.3,在AIME上的得分为 79.8,超越了 OpenAI 的 o1 预览版。而在中科院物理所的比赛比拼中,也获得了优良的成就(拜见 咱们用近来很火的 DeepSeek 挑衅了物理所出的比赛题,成果……)固然,这些测试只是从一个方面权衡了 DeepSeek R1 的才能,其余庞杂的义务,可能会波及差别的评价方式跟指标。为什么说 R1-Zero 是 AI 界的“野生学霸”假如说传统 AI 是“补习班量产的勤学生”,成才重要靠领导教师每天谆谆教诲,那 R1-Zero 就是靠自学的“蠢才少年”。R1-Zero 的“自学”进程依附于强化进修(RL)算法,而非传统的人类标注数据。经由过程重复练习跟优化,只管不人工干涉,它仍在特定的反应机制下自我优化,最后在数学标题中展现出了出色的推理才能。这个方式跟 ALPhaGo 有些相似,对,就是谁人已经克服过人类最强棋手的“硅基棋王”——它并不依据人类的围棋教程进修,全程也不接收过任何人类输入的旌旗灯号领导,完整依附本人跟本人“亿局局”下棋、输赢演绎总结,发生了强盛的下棋战略。更绝的是,DeepSeek 的解题进程一步步推演,能够长告竣百上千字,乃至上万,堪比《三体》里罗辑的面壁打算——每一步都充斥“假如……那么……”的逻辑推演,并且连中先生都能看懂它的头脑进程。同时,它的练习方式还带来了效力晋升,练习周期更短,资本耗费下降,因为省去了 SFT 跟庞杂的赏罚模子,盘算量增加。开源:技巧界的“国民战斗”须要指出的是,DeepSeek R1 并不是现在独一的推理模子。OpenAI 的 o1 模子在推理义务上表示也很杰出,然而 DeepSeek 有个明显的差别。那就是,OpenAI 的 o1 模子像米其林三星餐厅——菜品冷艳,但厨房拒绝观赏。而 DeepSeek 直接把菜谱开源,约请全天下极客来改进——有人往模子里塞《五年高考三年模仿》,练习出秒杀奥数冠军的 AI;有人用 R1 给女友人写情书,成果由于逻辑过于谨严被骂“直男癌”。这种“群殴式翻新”,让 AGI 研讨从高冷学术圈酿成了全平易近参加的“黑客马拉松”(指限制时光内各人经由过程编程、计划等技巧配合,做出风趣或适用的名目。)。更主要的是,模子开源,让全天下的科技人才,都有可能站在 R1 的基本上,停止改进再发明。科技的汗青过程曾经一次次告知咱们:基本技巧的传布分散,会激发更大批、更进步的前沿冲破跟现实利用的出现。科技树的点亮,没措施仅靠一团体或许一家公司,DeepSeek 的开源,就相称于一次开枝散叶的主要进程,而这也会进步 DeepSeek 的名誉跟影响力。省钱鬼才:本钱仅用非常之一年夜模子范畴的研发实在是很“烧钱”的,良多著名的年夜模子,练习一次本钱就高达数百万美元。而 DeepSeek 最为人称道的,是它把本钱抹了个零——是的,它直接把本钱金额的末端砍失落了一个“0”。简略地说,DeepSeek采取了一系列架构、算法跟义务拆分等方面的优化跟翻新,如许就能只用较低的本钱就实现练习义务,而这些方面的发明力恰是 DeepSeek 的出色之处。更变态识的是,本钱暴降的同时,机能反而飙升:它可能在一个恳求中处置多达 128000 个 Token、一次最多能够天生 32000 个 Token(注:1 个 token 视情形相称于 1 个词语或 1 个汉字),十分合适编写深度讲演或分析大批数据集,作为出产力东西效力极年夜晋升,活生生把 AI 从“吞金兽”酿成了“招财猫”,利人利己。用推理实现环保最新的研讨跟报道表现,跟着人工智能行业的范围跟影响力急剧扩展,保持人工智能增加所需的盘算才能大概每 100 天翻一番。现在,ChatGPT 天天须要耗费大概 564 兆瓦时的电能。同时,支持年夜模子运算的数据核心效劳器会须要耗费大批的水资本来散热。有研讨表现,ChatGPT-3 在练习时期耗水近 700 吨,厥后每答复 20 至 50 个成绩,就需耗费 500 毫升水。耗能、耗水、增添碳排放,已经是咱们担心通往 AGI 之路的主要阻力,然而,DeepSeek 的胜利向咱们提醒了——或者咱们有其余更好的途径。从前十年,AI 界陷溺于“数目碾压”:堆算力、冲数据量、比谁烧钱多。但 DeepSeek 另辟门路——与其让 AI 逝世记硬背《百科全书》,不如教它“怎样像福尔摩斯一样思考”。成果在 ARC-AGI 测试(AGI 中心才能基准)中,R1 体系与人类表示并驾齐驱。这证实:兴许推理才能才是翻开 AGI 之门的钥匙,而钥匙孔里显露出的光,正在被开源社区的手电筒照得越来越亮。DeepSeek 不是神话,是团队一步步发明的火种固然 DeepSeek 的故事听起来像一部科幻爽文:它用纯强化进修攻破了数据把持,用开源扑灭了寰球极客的豪情,再用本钱暴降,让 AI 能更好地从试验室走进咱们的生涯,但它毫不像某些流量自媒体为了博眼球说的那样横空降生,更不是什么剽窃了其余厂家 AI 的成果。从前一年,DeepSeek 团队始终步步为营,从 V2 模子(2024 年 5 月宣布),到 V3 模子(2024 年 12 月宣布),到近来的 R1 跟 R1-zero 模子,每一步都获得了明显的提高, 走得很踏实,并且其翻新有开源的信息为证。因而,不要理睬那些逆袭开挂爽文或是争光文,咱们要信任的是,从人类群体提高的角度讲,投入时光、聪明跟真正能扑灭人的信心,冲破式翻新必定会出现。当咱们赞叹于 R1 的优良表示时,也别忘了——它省下的每一度电、开放的每一行代码,都在为 AGI 来临积存能量。或者将来某天,认真正具有通用智能的AI回想汗青时,会像人类铭刻火种与轮子一样,为 DeepSeek 刻下一块里程碑。参考文献[1]《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 https://arxiv.org/abs/2501.12948[2]DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V3 Technical Report https://arxiv.org/abs/2405.04434[3]DeepSeek-V3 技巧讲演 https://arxiv.org/html/2412.19437v1[4]《研讨职员发明算法可将人工智能能耗下降 95%》https://oilprice.com/Energy/Energy-General/Researchers-Discover-Algorithm-to-Slash-AI-Energy-Consumption-by-95.html[5]DeepSeek R1-Zero与R1的成果与剖析. 腾讯云开辟者社区.https://cloud.tencent.com/developer/article/2493328[6]GPT-4 Can t Reason https://arxiv.org/abs/2308.03762谋划制造作者丨木木 北京师范年夜学数学专业 资深产物司理 人工智能创业者考核丨于乃功 北京产业年夜学呆板人工程专业担任人,北京人工智能研讨院呆板人研讨核心主任,博士生导师谋划丨丁崝责编丨丁崝审校丨徐来、林林