AlphaGo 的故事:AI 第一次让全人类意识到,机器可以拥有自己的直觉
说明:本文是基于 AlphaGo 公开历史资料和原始草稿整理的中文科普与解读,不是论文翻译。重点不是复盘每一盘棋的技术细节,而是讲清楚 AlphaGo 为什么会成为 AI 历史上的关键节点,以及它和今天这轮 AI 浪潮之间的关系。
如果要选一个普通人真正开始感受到 AI 冲击力的时刻,我会选 AlphaGo。
不是因为它是第一个会下棋的程序。
在 AlphaGo 之前,机器已经赢过人类很多次。
1997 年,IBM 的 Deep Blue 击败了国际象棋世界冠军卡斯帕罗夫。那件事当时也很轰动,但很多人仍然可以把它理解成一种“超级计算机的暴力搜索”。
国际象棋空间很大,但它的规则、局面和评估方式相对更容易被程序化。只要算力足够强,搜索足够深,机器就能找到非常好的走法。
围棋不一样。
围棋棋盘是 19×19,合法局面数量通常被估算在 10 的 170 次方量级。这个数字大到无法靠穷举解决。
更重要的是,围棋里有大量很难用规则写清楚的判断:
- 厚薄
- 轻重
- 形势
- 味道
- 手感
- 全局平衡
- 先手和后手
- 攻防转换
这些词听起来不像数学,更像一种长期训练出来的直觉。
所以在很长时间里,围棋被认为是 AI 最难攻克的智力游戏之一。
很多人相信,机器要达到人类顶尖棋手水平,至少还需要很多年。
然后 AlphaGo 出现了。
它让人第一次清楚地看到:
机器不只是会计算,它也可以形成一种人类看不懂、但事后证明有效的判断。
这就是 AlphaGo 最震撼的地方。
它不是简单地告诉人类“我算得比你快”。
它是在告诉人类:
我可能已经拥有了另一种直觉。
一、为什么围棋曾经被认为很难被 AI 攻克
要理解 AlphaGo 为什么重要,先要理解围棋为什么难。
国际象棋已经很复杂,但围棋复杂得多。
每一步棋可以落在棋盘上很多位置。局面变化分支极大,单纯靠暴力搜索几乎走不通。
更麻烦的是,围棋的很多局面很难直接评价。
国际象棋里,你可以看子力、王的安全、兵型、攻击路线。虽然也很复杂,但很多东西可以相对明确地量化。
围棋里,一块棋现在看起来弱,十几手之后可能变成全局攻击的支点。
一手棋局部看亏,可能换来全局厚势。
一片空看起来很大,后面可能被打入、侵消、压缩。
职业棋手常说“这手棋味道好”“这个形不舒服”“这里厚了”。这些判断来自大量经验,但很难写成固定规则。
这也是为什么围棋一直被看作人类直觉和审美的代表。
它不像一道有明确公式的题。
它更像一个巨大的可能性空间,人类棋手靠长期训练,在里面形成自己的方向感。
AlphaGo 的出现,就是对这种方向感的第一次正面挑战。
二、2015 年:AlphaGo 第一次进入公众视野
2015 年,DeepMind 公开了 AlphaGo。
DeepMind 是一家伦敦 AI 公司,后来被 Google 收购。它的联合创始人 Demis Hassabis 本人也有游戏和认知科学背景。
AlphaGo 第一次真正震动圈内,是因为它以 5:0 击败了欧洲围棋冠军樊麾。
樊麾是职业二段。放在世界范围内,他不是最顶级的棋手。
所以当时很多围棋界人士的反应并不是恐慌,而是半信半疑。
大家会觉得:
机器能赢职业二段,确实很厉害。
但离李世石、柯洁这种世界顶尖棋手,还差得远。
这种反应很正常。
因为人类过去判断 AI 能力,常常是线性外推的。
今天能赢业余,明天能赢职业低段,再过几年也许能接近顶尖。
但 AlphaGo 后来的速度不是线性的。
它像是突然跨过了一个门槛。
三、2016 年:李世石之战,AI 第一次真正破圈
AlphaGo 真正进入全球公众视野,是 2016 年 3 月的李世石五番棋。
李世石九段不是普通棋手。
他是那个时代最具代表性的围棋天才之一,拿过多个世界冠军,棋风锐利、战斗力极强。
当 DeepMind 宣布 AlphaGo 要挑战李世石时,很多人仍然认为人类会赢。
赛前,李世石自己也预测会 5:0 或 4:1 获胜。
这不是狂妄。
在当时的认知里,顶尖人类棋手仍然被认为站在围棋世界的最高处。
但比赛开始后,事情很快变得不一样。
第一局,AlphaGo 赢了。
这已经足够震惊。
更震惊的是第二局。
第二局里,AlphaGo 下出了著名的第 37 手。
那是一手落在右边五路线附近的肩冲,很多职业棋手第一眼都觉得奇怪。
按照人类传统棋理,那不像是常规选择。
但后来复盘发现,这手棋非常深远。
它不是局部抢便宜,而是在全局上改变了节奏和结构。
这手棋后来被很多人称为 AlphaGo 的代表性时刻。
因为它让人第一次强烈感受到:
AI 不是在模仿人类棋谱。它可能真的看到了人类没看到的东西。
到了第三局,AlphaGo 3:0 提前锁定胜局。
那一刻的冲击,不只是李世石输了。
而是人类在一个长期被认为依赖直觉、经验和审美的领域里,被机器击败了。
很多人第一次意识到:
AI 的边界可能比我们想象得远得多。
四、第四局:人类唯一的胜利为什么让人难忘
五番棋里最让人难忘的,反而是李世石赢的那一局。
第四局,李世石在中盘下出第 78 手。
这手棋后来被称为“神之一手”。
它击中了 AlphaGo 判断里的一个薄弱点,让局势突然发生变化。
随后 AlphaGo 开始出现一连串非常反常的着法。
那种错误很特别。
它不像人类棋手常见的失误。
更像是一个强大的系统突然进入了自己不熟悉的区域,局面评估开始失真。
最终,李世石赢下了这一局。
这是他在五番棋中的唯一胜局,也是人类对 AlphaGo 的一次珍贵反击。
为什么这一局后来被反复提起?
因为它保留了一点人的尊严。
它说明人类并不是完全被碾压。
在某些极端复杂、极端微妙的位置里,人类的创造力仍然可能打破机器的判断。
但这份胜利也带着一种悲壮感。
因为五番棋最终结果是 4:1。
AlphaGo 赢了。
而且赢得非常清楚。
李世石后来退役时,也提到 AI 已经成为无法跨越的存在。
这不是一场普通比赛。
它像是人类智力史上的一个分水岭。
五、Master:当 AI 不再只是赢一场,而是横扫整个棋坛
如果说李世石之战还有戏剧性,那么 2017 年初的 Master 事件,就更像一次彻底展示实力。
AlphaGo 的后续版本以 Master 的匿名账号出现在网络围棋平台上,对阵中日韩顶级棋手,取得了 60 连胜。
其中包括柯洁等当时最强的一批棋手。
这件事给围棋界的冲击更深。
因为它说明 AlphaGo 的强,不是特定比赛准备、特定对手研究、特定场景下的偶然胜利。
它已经稳定地站在了人类顶尖水平之上。
过去几千年,人类围棋经验是一代代棋手积累出来的。
布局、定式、手筋、官子、棋理、胜负感,都是人类长期对弈沉淀下来的知识体系。
但 AlphaGo 用一种完全不同的方式进入了这个体系,然后迅速超越它。
这对职业棋手的心理冲击非常大。
以前棋手追求的是“接近神之一手”。
而现在,一个机器系统不断下出人类看不懂、但又不得不承认正确的棋。
这会迫使整个围棋界重新审视自己的知识。
哪些棋理是真的?
哪些只是历史经验形成的习惯?
哪些所谓坏棋,只是在过去没人能算清楚?
AlphaGo 不只是赢棋。
它开始改写围棋的知识结构。
六、柯洁之战:人类最强者的最后正面交锋
2017 年 5 月,柯洁在乌镇与 AlphaGo 正式进行三番棋。
柯洁当时是世界排名最靠前的棋手之一,也是人类围棋的代表人物。
这场比赛在某种意义上,是人类顶尖棋手与 AlphaGo 的最后一次正式正面对抗。
结果是 3:0。
AlphaGo 完胜。
但比分之外,更重要的是比赛过程。
柯洁不是随便输了。
他在比赛中下出了很高水平,尤其第二局一度把局面推到非常复杂、非常接近的状态。
从人类角度看,那已经是极限发挥。
但 AlphaGo 依然能够在复杂转换里找到更好的道路。
柯洁赛后落泪的画面,后来被很多人记住。
那不是简单的输不起。
更像是一种强烈的无力感:
自己已经下出了非常好的棋,但对手仍然像站在更高处看棋盘。
这是一种很难描述的心理冲击。
不是你犯了低级错误。
不是你状态不好。
而是你发现自己的上限,可能已经低于另一个系统的常态。
这比输一盘棋更难接受。
七、AlphaGo Zero:真正震撼的不是赢人,而是不再需要人类
如果故事到柯洁之战结束,AlphaGo 已经足够重要。
但真正让它成为 AI 历史节点的,是后来的 AlphaGo Zero。
AlphaGo Zero 的关键变化是:
它不再需要人类棋谱。
早期 AlphaGo 还学习过大量人类棋谱。
它先从人类对局中学习,再通过自我对弈强化能力。
AlphaGo Zero 更进一步。
它从零开始,只知道围棋规则,然后通过自我对弈训练。
没有人类棋谱。
没有传统定式。
没有几千年围棋经验作为先验。
它自己和自己下。
然后不断更新自己的策略和评估。
DeepMind 论文中给出的结果非常惊人:AlphaGo Zero 在很短时间内就超过了之前击败李世石的版本,之后继续提升,最终超过所有旧版本。
这件事真正震撼的地方在于:
AI 不只是学习人类知识,它可以自己发现知识。
这和过去很多人理解的机器学习不一样。
很多人以为 AI 的能力来自“喂给它很多人类数据”。
AlphaGo Zero 证明,在规则清晰、反馈明确的环境里,AI 可以从零开始探索出超越人类经验的策略体系。
这就是为什么 AlphaGo Zero 比 AlphaGo 更有象征意义。
AlphaGo 击败了人类棋手。
AlphaGo Zero 则在某种意义上绕开了人类。
它告诉我们:
人类经验不一定是 AI 的天花板。
有时候,人类经验只是 AI 起步时可以参考的脚手架。
甚至连脚手架都不是必须的。
八、AlphaGo 为什么让人觉得机器有了“直觉”
说机器有直觉,听起来很容易被误解。
机器当然没有人的意识、情绪和主观体验。
AlphaGo 不会因为赢棋而开心,也不会因为输棋而难过。
但从功能上看,它确实表现出了一种类似直觉的能力。
所谓直觉,不是凭空乱猜。
直觉是人在大量经验之后,能在复杂局面里快速抓住关键结构。
顶尖棋手看到一个局面,不一定能马上说清楚全部变化,但他会感觉某个方向更好,某块棋更重,某个交换有问题。
这种判断不是简单规则,也不是完整穷举。
AlphaGo 的神经网络做的事情,在某种意义上很接近这个过程。
它不是把所有变化都算到底。
它会评估局面,判断哪些方向更有价值,再结合搜索寻找更优解。
所以 AlphaGo 的可怕之处,不只是算力。
而是它把两件事结合起来:
- 像人一样进行局面判断
- 又比人更稳定、更冷静、更大规模地搜索
这让它表现出一种超越人类的“棋感”。
人类看不懂它的第一反应,常常是觉得怪。
但事后复盘,又不得不承认它有道理。
这就是 AlphaGo 给人的震撼:
机器不只是更快,它可能形成了一套不同于人类的审美和判断。
九、AlphaGo 退役:围棋只是验证方法的舞台
2017 年之后,DeepMind 宣布 AlphaGo 不再参加围棋比赛。
原因很简单:
围棋不是终点。
围棋是一个非常好的验证场。
它规则清楚,胜负明确,复杂度极高,而且长期被认为需要直觉。
如果 AI 能在这样的领域里超过人类,就说明相关方法有更广泛的潜力。
AlphaGo 背后的关键思想包括:
- 深度学习
- 强化学习
- 自我对弈
- 蒙特卡洛树搜索
- 价值网络和策略网络
这些东西后来影响了很多领域。
DeepMind 后续最著名的成果之一是 AlphaFold。
AlphaFold 用 AI 预测蛋白质结构,对生物学和药物研发产生了巨大影响。
它和 AlphaGo 不是同一个任务。
但它们背后有一种共同精神:
在一个复杂空间里,让 AI 学会发现结构、评估可能性,并找到人类过去很难系统探索的解。
这也是为什么 AlphaGo 不应该被看成一个围棋项目。
它更像是一次公开演示:
如果一个领域有清晰规则、明确反馈和巨大的搜索空间,AI 可能用不同于人类的方式找到新知识。
十、AlphaGo 和今天 AI 浪潮的关系
今天我们谈 AI,更多是在谈大语言模型。
ChatGPT、Claude、Gemini、DeepSeek,以及各种 coding agent、search agent、multimodal agent。
它们和 AlphaGo 不一样。
AlphaGo 解决的是围棋这种规则封闭、反馈明确的问题。
大语言模型面对的是开放世界:语言、代码、图像、知识、工具、网页、工作流。
但 AlphaGo 留下的启发仍然很重要。
第一,AI 的突破常常先发生在一个看似狭窄的领域。
围棋只是一个游戏,但它验证了深度学习、强化学习和搜索结合的威力。
今天很多 AI agent 也是这样。
它们可能先在写代码、查资料、做客服、分析数据、控制浏览器这些具体任务里变强,然后再扩展到更复杂的工作流。
第二,人类常常低估 AI 跨过门槛后的速度。
在 AlphaGo 之前,很多人觉得围棋还要很多年。
但一旦方法跑通,进步速度非常快。
今天的大模型也有类似感觉。
某些能力在很长时间里看起来不行,突然某一代模型之后,就从“勉强可用”变成“很多场景已经够用”。
第三,AI 不只是压缩成本,也会改写知识结构。
AlphaGo 出现后,职业棋手不只是输给机器。
他们开始用 AI 复盘,用 AI 学棋,用 AI 重新理解布局和定式。
今天很多行业也会经历类似过程。
AI 不是简单替代一部分工作,而是会改变这个行业内部的判断标准。
什么是好代码?
什么是好文章?
什么是好设计?
什么是好策略?
当 AI 参与进来以后,这些标准都会被重新校准。
十一、人类输给 AlphaGo 之后,围棋并没有结束
有意思的是,AlphaGo 没有毁掉围棋。
它改变了围棋。
今天职业棋手训练离不开 AI。
很多过去被认为不好的下法,被重新评估。
很多布局和定式被改写。
业余爱好者也能用 AI 分析自己的棋,看到过去只有高手才能指出的问题。
这件事很像今天很多行业正在发生的变化。
一开始,人会把 AI 看成对手。
然后发现它太强,产生挫败感。
再后来,人开始把它当工具。
最后,整个领域的学习方式、训练方式和评判标准都被改变。
围棋没有因为 AlphaGo 消失。
人类棋手也没有因为 AlphaGo 放弃围棋。
他们只是进入了一个新阶段:
人类不再只和人类经验对话,也开始和机器发现的知识对话。
这是 AlphaGo 故事最有后劲的地方。
结语:AlphaGo 真正改变的不是围棋,而是人类对机器的想象
AlphaGo 的故事,表面上是一段围棋史。
但它真正改变的,是人类对机器的想象。
在 AlphaGo 之前,很多人仍然习惯把机器理解成工具:
- 更快的计算器
- 更大的数据库
- 更强的搜索引擎
- 更自动化的执行器
AlphaGo 之后,人们开始意识到:
机器不只是执行人类写好的规则。
它也可能在一个复杂空间里形成自己的判断,发现人类没有总结出来的模式,并用一种我们一开始看不懂的方式解决问题。
这就是为什么 AlphaGo 是 AI 历史上绕不开的节点。
它第一次让全世界用一种非常直观的方式感受到:
AI 不只是会算。
AI 也可能会判断。
AI 甚至可能拥有一种不同于人类的直觉。
今天我们再看 AlphaGo,已经不会像 2016 年那样震惊。
因为大语言模型、AI coding agent、多模态模型已经把 AI 带进了更多日常场景。
但 AlphaGo 仍然值得被反复讲起。
因为它像一个预告片。
它提前告诉我们:当 AI 跨过某个门槛后,人类最初的反应往往是怀疑,然后是震惊,然后是失落,最后是重新学习如何和它合作。
围棋已经走过了这条路。
现在,更多行业正在走上同一条路。
参考背景:
- DeepMind / Nature: Mastering the game of Go with deep neural networks and tree search
- DeepMind / Nature: Mastering the game of Go without human knowledge
- AlphaGo vs Lee Sedol, 2016
- AlphaGo vs Ke Jie, 2017
Leave a Reply