AlphaGo 的故事：AI 第一次让全人类意识到，机器可以拥有自己的直觉

说明：本文是基于 AlphaGo 公开历史资料和原始草稿整理的中文科普与解读，不是论文翻译。重点不是复盘每一盘棋的技术细节，而是讲清楚 AlphaGo 为什么会成为 AI 历史上的关键节点，以及它和今天这轮 AI 浪潮之间的关系。

如果要选一个普通人真正开始感受到 AI 冲击力的时刻，我会选 AlphaGo。

不是因为它是第一个会下棋的程序。

在 AlphaGo 之前，机器已经赢过人类很多次。

1997 年，IBM 的 Deep Blue 击败了国际象棋世界冠军卡斯帕罗夫。那件事当时也很轰动，但很多人仍然可以把它理解成一种“超级计算机的暴力搜索”。

国际象棋空间很大，但它的规则、局面和评估方式相对更容易被程序化。只要算力足够强，搜索足够深，机器就能找到非常好的走法。

围棋不一样。

围棋棋盘是 19×19，合法局面数量通常被估算在 10 的 170 次方量级。这个数字大到无法靠穷举解决。

更重要的是，围棋里有大量很难用规则写清楚的判断：

厚薄
轻重
形势
味道
手感
全局平衡
先手和后手
攻防转换

这些词听起来不像数学，更像一种长期训练出来的直觉。

所以在很长时间里，围棋被认为是 AI 最难攻克的智力游戏之一。

很多人相信，机器要达到人类顶尖棋手水平，至少还需要很多年。

然后 AlphaGo 出现了。

它让人第一次清楚地看到：

机器不只是会计算，它也可以形成一种人类看不懂、但事后证明有效的判断。

这就是 AlphaGo 最震撼的地方。

它不是简单地告诉人类“我算得比你快”。

它是在告诉人类：

我可能已经拥有了另一种直觉。

一、为什么围棋曾经被认为很难被 AI 攻克

要理解 AlphaGo 为什么重要，先要理解围棋为什么难。

国际象棋已经很复杂，但围棋复杂得多。

每一步棋可以落在棋盘上很多位置。局面变化分支极大，单纯靠暴力搜索几乎走不通。

更麻烦的是，围棋的很多局面很难直接评价。

国际象棋里，你可以看子力、王的安全、兵型、攻击路线。虽然也很复杂，但很多东西可以相对明确地量化。

围棋里，一块棋现在看起来弱，十几手之后可能变成全局攻击的支点。

一手棋局部看亏，可能换来全局厚势。

一片空看起来很大，后面可能被打入、侵消、压缩。

职业棋手常说“这手棋味道好”“这个形不舒服”“这里厚了”。这些判断来自大量经验，但很难写成固定规则。

这也是为什么围棋一直被看作人类直觉和审美的代表。

它不像一道有明确公式的题。

它更像一个巨大的可能性空间，人类棋手靠长期训练，在里面形成自己的方向感。

AlphaGo 的出现，就是对这种方向感的第一次正面挑战。

二、2015 年：AlphaGo 第一次进入公众视野

2015 年，DeepMind 公开了 AlphaGo。

DeepMind 是一家伦敦 AI 公司，后来被 Google 收购。它的联合创始人 Demis Hassabis 本人也有游戏和认知科学背景。

AlphaGo 第一次真正震动圈内，是因为它以 5:0 击败了欧洲围棋冠军樊麾。

樊麾是职业二段。放在世界范围内，他不是最顶级的棋手。

所以当时很多围棋界人士的反应并不是恐慌，而是半信半疑。

大家会觉得：

机器能赢职业二段，确实很厉害。

但离李世石、柯洁这种世界顶尖棋手，还差得远。

这种反应很正常。

因为人类过去判断 AI 能力，常常是线性外推的。

今天能赢业余，明天能赢职业低段，再过几年也许能接近顶尖。

但 AlphaGo 后来的速度不是线性的。

它像是突然跨过了一个门槛。

三、2016 年：李世石之战，AI 第一次真正破圈

AlphaGo 真正进入全球公众视野，是 2016 年 3 月的李世石五番棋。

李世石九段不是普通棋手。

他是那个时代最具代表性的围棋天才之一，拿过多个世界冠军，棋风锐利、战斗力极强。

当 DeepMind 宣布 AlphaGo 要挑战李世石时，很多人仍然认为人类会赢。

赛前，李世石自己也预测会 5:0 或 4:1 获胜。

这不是狂妄。

在当时的认知里，顶尖人类棋手仍然被认为站在围棋世界的最高处。

但比赛开始后，事情很快变得不一样。

第一局，AlphaGo 赢了。

这已经足够震惊。

更震惊的是第二局。

第二局里，AlphaGo 下出了著名的第 37 手。

那是一手落在右边五路线附近的肩冲，很多职业棋手第一眼都觉得奇怪。

按照人类传统棋理，那不像是常规选择。

但后来复盘发现，这手棋非常深远。

它不是局部抢便宜，而是在全局上改变了节奏和结构。

这手棋后来被很多人称为 AlphaGo 的代表性时刻。

因为它让人第一次强烈感受到：

AI 不是在模仿人类棋谱。它可能真的看到了人类没看到的东西。

到了第三局，AlphaGo 3:0 提前锁定胜局。

那一刻的冲击，不只是李世石输了。

而是人类在一个长期被认为依赖直觉、经验和审美的领域里，被机器击败了。

很多人第一次意识到：

AI 的边界可能比我们想象得远得多。

四、第四局：人类唯一的胜利为什么让人难忘

五番棋里最让人难忘的，反而是李世石赢的那一局。

第四局，李世石在中盘下出第 78 手。

这手棋后来被称为“神之一手”。

它击中了 AlphaGo 判断里的一个薄弱点，让局势突然发生变化。

随后 AlphaGo 开始出现一连串非常反常的着法。

那种错误很特别。

它不像人类棋手常见的失误。

更像是一个强大的系统突然进入了自己不熟悉的区域，局面评估开始失真。

最终，李世石赢下了这一局。

这是他在五番棋中的唯一胜局，也是人类对 AlphaGo 的一次珍贵反击。

为什么这一局后来被反复提起？

因为它保留了一点人的尊严。

它说明人类并不是完全被碾压。

在某些极端复杂、极端微妙的位置里，人类的创造力仍然可能打破机器的判断。

但这份胜利也带着一种悲壮感。

因为五番棋最终结果是 4:1。

AlphaGo 赢了。

而且赢得非常清楚。

李世石后来退役时，也提到 AI 已经成为无法跨越的存在。

这不是一场普通比赛。

它像是人类智力史上的一个分水岭。

五、Master：当 AI 不再只是赢一场，而是横扫整个棋坛

如果说李世石之战还有戏剧性，那么 2017 年初的 Master 事件，就更像一次彻底展示实力。

AlphaGo 的后续版本以 Master 的匿名账号出现在网络围棋平台上，对阵中日韩顶级棋手，取得了 60 连胜。

其中包括柯洁等当时最强的一批棋手。

这件事给围棋界的冲击更深。

因为它说明 AlphaGo 的强，不是特定比赛准备、特定对手研究、特定场景下的偶然胜利。

它已经稳定地站在了人类顶尖水平之上。

过去几千年，人类围棋经验是一代代棋手积累出来的。

布局、定式、手筋、官子、棋理、胜负感，都是人类长期对弈沉淀下来的知识体系。

但 AlphaGo 用一种完全不同的方式进入了这个体系，然后迅速超越它。

这对职业棋手的心理冲击非常大。

以前棋手追求的是“接近神之一手”。

而现在，一个机器系统不断下出人类看不懂、但又不得不承认正确的棋。

这会迫使整个围棋界重新审视自己的知识。

哪些棋理是真的？

哪些只是历史经验形成的习惯？

哪些所谓坏棋，只是在过去没人能算清楚？

AlphaGo 不只是赢棋。

它开始改写围棋的知识结构。

六、柯洁之战：人类最强者的最后正面交锋

2017 年 5 月，柯洁在乌镇与 AlphaGo 正式进行三番棋。

柯洁当时是世界排名最靠前的棋手之一，也是人类围棋的代表人物。

这场比赛在某种意义上，是人类顶尖棋手与 AlphaGo 的最后一次正式正面对抗。

结果是 3:0。

AlphaGo 完胜。

但比分之外，更重要的是比赛过程。

柯洁不是随便输了。

他在比赛中下出了很高水平，尤其第二局一度把局面推到非常复杂、非常接近的状态。

从人类角度看，那已经是极限发挥。

但 AlphaGo 依然能够在复杂转换里找到更好的道路。

柯洁赛后落泪的画面，后来被很多人记住。

那不是简单的输不起。

更像是一种强烈的无力感：

自己已经下出了非常好的棋，但对手仍然像站在更高处看棋盘。

这是一种很难描述的心理冲击。

不是你犯了低级错误。

不是你状态不好。

而是你发现自己的上限，可能已经低于另一个系统的常态。

这比输一盘棋更难接受。

七、AlphaGo Zero：真正震撼的不是赢人，而是不再需要人类

如果故事到柯洁之战结束，AlphaGo 已经足够重要。

但真正让它成为 AI 历史节点的，是后来的 AlphaGo Zero。

AlphaGo Zero 的关键变化是：

它不再需要人类棋谱。

早期 AlphaGo 还学习过大量人类棋谱。

它先从人类对局中学习，再通过自我对弈强化能力。

AlphaGo Zero 更进一步。

它从零开始，只知道围棋规则，然后通过自我对弈训练。

没有人类棋谱。

没有传统定式。

没有几千年围棋经验作为先验。

它自己和自己下。

然后不断更新自己的策略和评估。

DeepMind 论文中给出的结果非常惊人：AlphaGo Zero 在很短时间内就超过了之前击败李世石的版本，之后继续提升，最终超过所有旧版本。

这件事真正震撼的地方在于：

AI 不只是学习人类知识，它可以自己发现知识。

这和过去很多人理解的机器学习不一样。

很多人以为 AI 的能力来自“喂给它很多人类数据”。

AlphaGo Zero 证明，在规则清晰、反馈明确的环境里，AI 可以从零开始探索出超越人类经验的策略体系。

这就是为什么 AlphaGo Zero 比 AlphaGo 更有象征意义。

AlphaGo 击败了人类棋手。

AlphaGo Zero 则在某种意义上绕开了人类。

它告诉我们：

人类经验不一定是 AI 的天花板。

有时候，人类经验只是 AI 起步时可以参考的脚手架。

甚至连脚手架都不是必须的。

八、AlphaGo 为什么让人觉得机器有了“直觉”

说机器有直觉，听起来很容易被误解。

机器当然没有人的意识、情绪和主观体验。

AlphaGo 不会因为赢棋而开心，也不会因为输棋而难过。

但从功能上看，它确实表现出了一种类似直觉的能力。

所谓直觉，不是凭空乱猜。

直觉是人在大量经验之后，能在复杂局面里快速抓住关键结构。

顶尖棋手看到一个局面，不一定能马上说清楚全部变化，但他会感觉某个方向更好，某块棋更重，某个交换有问题。

这种判断不是简单规则，也不是完整穷举。

AlphaGo 的神经网络做的事情，在某种意义上很接近这个过程。

它不是把所有变化都算到底。

它会评估局面，判断哪些方向更有价值，再结合搜索寻找更优解。

所以 AlphaGo 的可怕之处，不只是算力。

而是它把两件事结合起来：

像人一样进行局面判断
又比人更稳定、更冷静、更大规模地搜索

这让它表现出一种超越人类的“棋感”。

人类看不懂它的第一反应，常常是觉得怪。

但事后复盘，又不得不承认它有道理。

这就是 AlphaGo 给人的震撼：

机器不只是更快，它可能形成了一套不同于人类的审美和判断。

九、AlphaGo 退役：围棋只是验证方法的舞台

2017 年之后，DeepMind 宣布 AlphaGo 不再参加围棋比赛。

原因很简单：

围棋不是终点。

围棋是一个非常好的验证场。

它规则清楚，胜负明确，复杂度极高，而且长期被认为需要直觉。

如果 AI 能在这样的领域里超过人类，就说明相关方法有更广泛的潜力。

AlphaGo 背后的关键思想包括：

深度学习
强化学习
自我对弈
蒙特卡洛树搜索
价值网络和策略网络

这些东西后来影响了很多领域。

DeepMind 后续最著名的成果之一是 AlphaFold。

AlphaFold 用 AI 预测蛋白质结构，对生物学和药物研发产生了巨大影响。

它和 AlphaGo 不是同一个任务。

但它们背后有一种共同精神：

在一个复杂空间里，让 AI 学会发现结构、评估可能性，并找到人类过去很难系统探索的解。

这也是为什么 AlphaGo 不应该被看成一个围棋项目。

它更像是一次公开演示：

如果一个领域有清晰规则、明确反馈和巨大的搜索空间，AI 可能用不同于人类的方式找到新知识。

十、AlphaGo 和今天 AI 浪潮的关系

今天我们谈 AI，更多是在谈大语言模型。

ChatGPT、Claude、Gemini、DeepSeek，以及各种 coding agent、search agent、multimodal agent。

它们和 AlphaGo 不一样。

AlphaGo 解决的是围棋这种规则封闭、反馈明确的问题。

大语言模型面对的是开放世界：语言、代码、图像、知识、工具、网页、工作流。

但 AlphaGo 留下的启发仍然很重要。

第一，AI 的突破常常先发生在一个看似狭窄的领域。

围棋只是一个游戏，但它验证了深度学习、强化学习和搜索结合的威力。

今天很多 AI agent 也是这样。

它们可能先在写代码、查资料、做客服、分析数据、控制浏览器这些具体任务里变强，然后再扩展到更复杂的工作流。

第二，人类常常低估 AI 跨过门槛后的速度。

在 AlphaGo 之前，很多人觉得围棋还要很多年。

但一旦方法跑通，进步速度非常快。

今天的大模型也有类似感觉。

某些能力在很长时间里看起来不行，突然某一代模型之后，就从“勉强可用”变成“很多场景已经够用”。

第三，AI 不只是压缩成本，也会改写知识结构。

AlphaGo 出现后，职业棋手不只是输给机器。

他们开始用 AI 复盘，用 AI 学棋，用 AI 重新理解布局和定式。

今天很多行业也会经历类似过程。

AI 不是简单替代一部分工作，而是会改变这个行业内部的判断标准。

什么是好代码？

什么是好文章？

什么是好设计？

什么是好策略？

当 AI 参与进来以后，这些标准都会被重新校准。

十一、人类输给 AlphaGo 之后，围棋并没有结束

有意思的是，AlphaGo 没有毁掉围棋。

它改变了围棋。

今天职业棋手训练离不开 AI。

很多过去被认为不好的下法，被重新评估。

很多布局和定式被改写。

业余爱好者也能用 AI 分析自己的棋，看到过去只有高手才能指出的问题。

这件事很像今天很多行业正在发生的变化。

一开始，人会把 AI 看成对手。

然后发现它太强，产生挫败感。

再后来，人开始把它当工具。

最后，整个领域的学习方式、训练方式和评判标准都被改变。

围棋没有因为 AlphaGo 消失。

人类棋手也没有因为 AlphaGo 放弃围棋。

他们只是进入了一个新阶段：

人类不再只和人类经验对话，也开始和机器发现的知识对话。

这是 AlphaGo 故事最有后劲的地方。

结语：AlphaGo 真正改变的不是围棋，而是人类对机器的想象

AlphaGo 的故事，表面上是一段围棋史。

但它真正改变的，是人类对机器的想象。

在 AlphaGo 之前，很多人仍然习惯把机器理解成工具：

更快的计算器
更大的数据库
更强的搜索引擎
更自动化的执行器

AlphaGo 之后，人们开始意识到：

机器不只是执行人类写好的规则。

它也可能在一个复杂空间里形成自己的判断，发现人类没有总结出来的模式，并用一种我们一开始看不懂的方式解决问题。

这就是为什么 AlphaGo 是 AI 历史上绕不开的节点。

它第一次让全世界用一种非常直观的方式感受到：

AI 不只是会算。

AI 也可能会判断。

AI 甚至可能拥有一种不同于人类的直觉。

今天我们再看 AlphaGo，已经不会像 2016 年那样震惊。

因为大语言模型、AI coding agent、多模态模型已经把 AI 带进了更多日常场景。

但 AlphaGo 仍然值得被反复讲起。

因为它像一个预告片。

它提前告诉我们：当 AI 跨过某个门槛后，人类最初的反应往往是怀疑，然后是震惊，然后是失落，最后是重新学习如何和它合作。

围棋已经走过了这条路。

现在，更多行业正在走上同一条路。

参考背景：

DeepMind / Nature: Mastering the game of Go with deep neural networks and tree search
DeepMind / Nature: Mastering the game of Go without human knowledge
AlphaGo vs Lee Sedol, 2016
AlphaGo vs Ke Jie, 2017

AlphaGo 的故事：AI 第一次让全人类意识到，机器可以拥有自己的直觉

AlphaGo 的故事：AI 第一次让全人类意识到，机器可以拥有自己的直觉

一、为什么围棋曾经被认为很难被 AI 攻克

二、2015 年：AlphaGo 第一次进入公众视野

三、2016 年：李世石之战，AI 第一次真正破圈

四、第四局：人类唯一的胜利为什么让人难忘

五、Master：当 AI 不再只是赢一场，而是横扫整个棋坛

六、柯洁之战：人类最强者的最后正面交锋

七、AlphaGo Zero：真正震撼的不是赢人，而是不再需要人类

八、AlphaGo 为什么让人觉得机器有了“直觉”

九、AlphaGo 退役：围棋只是验证方法的舞台

十、AlphaGo 和今天 AI 浪潮的关系

十一、人类输给 AlphaGo 之后，围棋并没有结束

结语：AlphaGo 真正改变的不是围棋，而是人类对机器的想象

Leave a Reply Cancel reply