AlphaGo 的故事:AI 第一次让全人类意识到,机器可以拥有自己的直觉

AlphaGo 的故事:AI 第一次让全人类意识到,机器可以拥有自己的直觉

说明:本文是基于 AlphaGo 公开历史资料和原始草稿整理的中文科普与解读,不是论文翻译。重点不是复盘每一盘棋的技术细节,而是讲清楚 AlphaGo 为什么会成为 AI 历史上的关键节点,以及它和今天这轮 AI 浪潮之间的关系。


如果要选一个普通人真正开始感受到 AI 冲击力的时刻,我会选 AlphaGo。

不是因为它是第一个会下棋的程序。

在 AlphaGo 之前,机器已经赢过人类很多次。

1997 年,IBM 的 Deep Blue 击败了国际象棋世界冠军卡斯帕罗夫。那件事当时也很轰动,但很多人仍然可以把它理解成一种“超级计算机的暴力搜索”。

国际象棋空间很大,但它的规则、局面和评估方式相对更容易被程序化。只要算力足够强,搜索足够深,机器就能找到非常好的走法。

围棋不一样。

围棋棋盘是 19×19,合法局面数量通常被估算在 10 的 170 次方量级。这个数字大到无法靠穷举解决。

更重要的是,围棋里有大量很难用规则写清楚的判断:

  • 厚薄
  • 轻重
  • 形势
  • 味道
  • 手感
  • 全局平衡
  • 先手和后手
  • 攻防转换

这些词听起来不像数学,更像一种长期训练出来的直觉。

所以在很长时间里,围棋被认为是 AI 最难攻克的智力游戏之一。

很多人相信,机器要达到人类顶尖棋手水平,至少还需要很多年。

然后 AlphaGo 出现了。

它让人第一次清楚地看到:

机器不只是会计算,它也可以形成一种人类看不懂、但事后证明有效的判断。

这就是 AlphaGo 最震撼的地方。

它不是简单地告诉人类“我算得比你快”。

它是在告诉人类:

我可能已经拥有了另一种直觉。


一、为什么围棋曾经被认为很难被 AI 攻克

要理解 AlphaGo 为什么重要,先要理解围棋为什么难。

国际象棋已经很复杂,但围棋复杂得多。

每一步棋可以落在棋盘上很多位置。局面变化分支极大,单纯靠暴力搜索几乎走不通。

更麻烦的是,围棋的很多局面很难直接评价。

国际象棋里,你可以看子力、王的安全、兵型、攻击路线。虽然也很复杂,但很多东西可以相对明确地量化。

围棋里,一块棋现在看起来弱,十几手之后可能变成全局攻击的支点。

一手棋局部看亏,可能换来全局厚势。

一片空看起来很大,后面可能被打入、侵消、压缩。

职业棋手常说“这手棋味道好”“这个形不舒服”“这里厚了”。这些判断来自大量经验,但很难写成固定规则。

这也是为什么围棋一直被看作人类直觉和审美的代表。

它不像一道有明确公式的题。

它更像一个巨大的可能性空间,人类棋手靠长期训练,在里面形成自己的方向感。

AlphaGo 的出现,就是对这种方向感的第一次正面挑战。


二、2015 年:AlphaGo 第一次进入公众视野

2015 年,DeepMind 公开了 AlphaGo。

DeepMind 是一家伦敦 AI 公司,后来被 Google 收购。它的联合创始人 Demis Hassabis 本人也有游戏和认知科学背景。

AlphaGo 第一次真正震动圈内,是因为它以 5:0 击败了欧洲围棋冠军樊麾。

樊麾是职业二段。放在世界范围内,他不是最顶级的棋手。

所以当时很多围棋界人士的反应并不是恐慌,而是半信半疑。

大家会觉得:

机器能赢职业二段,确实很厉害。

但离李世石、柯洁这种世界顶尖棋手,还差得远。

这种反应很正常。

因为人类过去判断 AI 能力,常常是线性外推的。

今天能赢业余,明天能赢职业低段,再过几年也许能接近顶尖。

但 AlphaGo 后来的速度不是线性的。

它像是突然跨过了一个门槛。


三、2016 年:李世石之战,AI 第一次真正破圈

AlphaGo 真正进入全球公众视野,是 2016 年 3 月的李世石五番棋。

李世石九段不是普通棋手。

他是那个时代最具代表性的围棋天才之一,拿过多个世界冠军,棋风锐利、战斗力极强。

当 DeepMind 宣布 AlphaGo 要挑战李世石时,很多人仍然认为人类会赢。

赛前,李世石自己也预测会 5:0 或 4:1 获胜。

这不是狂妄。

在当时的认知里,顶尖人类棋手仍然被认为站在围棋世界的最高处。

但比赛开始后,事情很快变得不一样。

第一局,AlphaGo 赢了。

这已经足够震惊。

更震惊的是第二局。

第二局里,AlphaGo 下出了著名的第 37 手。

那是一手落在右边五路线附近的肩冲,很多职业棋手第一眼都觉得奇怪。

按照人类传统棋理,那不像是常规选择。

但后来复盘发现,这手棋非常深远。

它不是局部抢便宜,而是在全局上改变了节奏和结构。

这手棋后来被很多人称为 AlphaGo 的代表性时刻。

因为它让人第一次强烈感受到:

AI 不是在模仿人类棋谱。它可能真的看到了人类没看到的东西。

到了第三局,AlphaGo 3:0 提前锁定胜局。

那一刻的冲击,不只是李世石输了。

而是人类在一个长期被认为依赖直觉、经验和审美的领域里,被机器击败了。

很多人第一次意识到:

AI 的边界可能比我们想象得远得多。


四、第四局:人类唯一的胜利为什么让人难忘

五番棋里最让人难忘的,反而是李世石赢的那一局。

第四局,李世石在中盘下出第 78 手。

这手棋后来被称为“神之一手”。

它击中了 AlphaGo 判断里的一个薄弱点,让局势突然发生变化。

随后 AlphaGo 开始出现一连串非常反常的着法。

那种错误很特别。

它不像人类棋手常见的失误。

更像是一个强大的系统突然进入了自己不熟悉的区域,局面评估开始失真。

最终,李世石赢下了这一局。

这是他在五番棋中的唯一胜局,也是人类对 AlphaGo 的一次珍贵反击。

为什么这一局后来被反复提起?

因为它保留了一点人的尊严。

它说明人类并不是完全被碾压。

在某些极端复杂、极端微妙的位置里,人类的创造力仍然可能打破机器的判断。

但这份胜利也带着一种悲壮感。

因为五番棋最终结果是 4:1。

AlphaGo 赢了。

而且赢得非常清楚。

李世石后来退役时,也提到 AI 已经成为无法跨越的存在。

这不是一场普通比赛。

它像是人类智力史上的一个分水岭。


五、Master:当 AI 不再只是赢一场,而是横扫整个棋坛

如果说李世石之战还有戏剧性,那么 2017 年初的 Master 事件,就更像一次彻底展示实力。

AlphaGo 的后续版本以 Master 的匿名账号出现在网络围棋平台上,对阵中日韩顶级棋手,取得了 60 连胜。

其中包括柯洁等当时最强的一批棋手。

这件事给围棋界的冲击更深。

因为它说明 AlphaGo 的强,不是特定比赛准备、特定对手研究、特定场景下的偶然胜利。

它已经稳定地站在了人类顶尖水平之上。

过去几千年,人类围棋经验是一代代棋手积累出来的。

布局、定式、手筋、官子、棋理、胜负感,都是人类长期对弈沉淀下来的知识体系。

但 AlphaGo 用一种完全不同的方式进入了这个体系,然后迅速超越它。

这对职业棋手的心理冲击非常大。

以前棋手追求的是“接近神之一手”。

而现在,一个机器系统不断下出人类看不懂、但又不得不承认正确的棋。

这会迫使整个围棋界重新审视自己的知识。

哪些棋理是真的?

哪些只是历史经验形成的习惯?

哪些所谓坏棋,只是在过去没人能算清楚?

AlphaGo 不只是赢棋。

它开始改写围棋的知识结构。


六、柯洁之战:人类最强者的最后正面交锋

2017 年 5 月,柯洁在乌镇与 AlphaGo 正式进行三番棋。

柯洁当时是世界排名最靠前的棋手之一,也是人类围棋的代表人物。

这场比赛在某种意义上,是人类顶尖棋手与 AlphaGo 的最后一次正式正面对抗。

结果是 3:0。

AlphaGo 完胜。

但比分之外,更重要的是比赛过程。

柯洁不是随便输了。

他在比赛中下出了很高水平,尤其第二局一度把局面推到非常复杂、非常接近的状态。

从人类角度看,那已经是极限发挥。

但 AlphaGo 依然能够在复杂转换里找到更好的道路。

柯洁赛后落泪的画面,后来被很多人记住。

那不是简单的输不起。

更像是一种强烈的无力感:

自己已经下出了非常好的棋,但对手仍然像站在更高处看棋盘。

这是一种很难描述的心理冲击。

不是你犯了低级错误。

不是你状态不好。

而是你发现自己的上限,可能已经低于另一个系统的常态。

这比输一盘棋更难接受。


七、AlphaGo Zero:真正震撼的不是赢人,而是不再需要人类

如果故事到柯洁之战结束,AlphaGo 已经足够重要。

但真正让它成为 AI 历史节点的,是后来的 AlphaGo Zero。

AlphaGo Zero 的关键变化是:

它不再需要人类棋谱。

早期 AlphaGo 还学习过大量人类棋谱。

它先从人类对局中学习,再通过自我对弈强化能力。

AlphaGo Zero 更进一步。

它从零开始,只知道围棋规则,然后通过自我对弈训练。

没有人类棋谱。

没有传统定式。

没有几千年围棋经验作为先验。

它自己和自己下。

然后不断更新自己的策略和评估。

DeepMind 论文中给出的结果非常惊人:AlphaGo Zero 在很短时间内就超过了之前击败李世石的版本,之后继续提升,最终超过所有旧版本。

这件事真正震撼的地方在于:

AI 不只是学习人类知识,它可以自己发现知识。

这和过去很多人理解的机器学习不一样。

很多人以为 AI 的能力来自“喂给它很多人类数据”。

AlphaGo Zero 证明,在规则清晰、反馈明确的环境里,AI 可以从零开始探索出超越人类经验的策略体系。

这就是为什么 AlphaGo Zero 比 AlphaGo 更有象征意义。

AlphaGo 击败了人类棋手。

AlphaGo Zero 则在某种意义上绕开了人类。

它告诉我们:

人类经验不一定是 AI 的天花板。

有时候,人类经验只是 AI 起步时可以参考的脚手架。

甚至连脚手架都不是必须的。


八、AlphaGo 为什么让人觉得机器有了“直觉”

说机器有直觉,听起来很容易被误解。

机器当然没有人的意识、情绪和主观体验。

AlphaGo 不会因为赢棋而开心,也不会因为输棋而难过。

但从功能上看,它确实表现出了一种类似直觉的能力。

所谓直觉,不是凭空乱猜。

直觉是人在大量经验之后,能在复杂局面里快速抓住关键结构。

顶尖棋手看到一个局面,不一定能马上说清楚全部变化,但他会感觉某个方向更好,某块棋更重,某个交换有问题。

这种判断不是简单规则,也不是完整穷举。

AlphaGo 的神经网络做的事情,在某种意义上很接近这个过程。

它不是把所有变化都算到底。

它会评估局面,判断哪些方向更有价值,再结合搜索寻找更优解。

所以 AlphaGo 的可怕之处,不只是算力。

而是它把两件事结合起来:

  • 像人一样进行局面判断
  • 又比人更稳定、更冷静、更大规模地搜索

这让它表现出一种超越人类的“棋感”。

人类看不懂它的第一反应,常常是觉得怪。

但事后复盘,又不得不承认它有道理。

这就是 AlphaGo 给人的震撼:

机器不只是更快,它可能形成了一套不同于人类的审美和判断。


九、AlphaGo 退役:围棋只是验证方法的舞台

2017 年之后,DeepMind 宣布 AlphaGo 不再参加围棋比赛。

原因很简单:

围棋不是终点。

围棋是一个非常好的验证场。

它规则清楚,胜负明确,复杂度极高,而且长期被认为需要直觉。

如果 AI 能在这样的领域里超过人类,就说明相关方法有更广泛的潜力。

AlphaGo 背后的关键思想包括:

  • 深度学习
  • 强化学习
  • 自我对弈
  • 蒙特卡洛树搜索
  • 价值网络和策略网络

这些东西后来影响了很多领域。

DeepMind 后续最著名的成果之一是 AlphaFold。

AlphaFold 用 AI 预测蛋白质结构,对生物学和药物研发产生了巨大影响。

它和 AlphaGo 不是同一个任务。

但它们背后有一种共同精神:

在一个复杂空间里,让 AI 学会发现结构、评估可能性,并找到人类过去很难系统探索的解。

这也是为什么 AlphaGo 不应该被看成一个围棋项目。

它更像是一次公开演示:

如果一个领域有清晰规则、明确反馈和巨大的搜索空间,AI 可能用不同于人类的方式找到新知识。


十、AlphaGo 和今天 AI 浪潮的关系

今天我们谈 AI,更多是在谈大语言模型。

ChatGPT、Claude、Gemini、DeepSeek,以及各种 coding agent、search agent、multimodal agent。

它们和 AlphaGo 不一样。

AlphaGo 解决的是围棋这种规则封闭、反馈明确的问题。

大语言模型面对的是开放世界:语言、代码、图像、知识、工具、网页、工作流。

但 AlphaGo 留下的启发仍然很重要。

第一,AI 的突破常常先发生在一个看似狭窄的领域。

围棋只是一个游戏,但它验证了深度学习、强化学习和搜索结合的威力。

今天很多 AI agent 也是这样。

它们可能先在写代码、查资料、做客服、分析数据、控制浏览器这些具体任务里变强,然后再扩展到更复杂的工作流。

第二,人类常常低估 AI 跨过门槛后的速度。

在 AlphaGo 之前,很多人觉得围棋还要很多年。

但一旦方法跑通,进步速度非常快。

今天的大模型也有类似感觉。

某些能力在很长时间里看起来不行,突然某一代模型之后,就从“勉强可用”变成“很多场景已经够用”。

第三,AI 不只是压缩成本,也会改写知识结构。

AlphaGo 出现后,职业棋手不只是输给机器。

他们开始用 AI 复盘,用 AI 学棋,用 AI 重新理解布局和定式。

今天很多行业也会经历类似过程。

AI 不是简单替代一部分工作,而是会改变这个行业内部的判断标准。

什么是好代码?

什么是好文章?

什么是好设计?

什么是好策略?

当 AI 参与进来以后,这些标准都会被重新校准。


十一、人类输给 AlphaGo 之后,围棋并没有结束

有意思的是,AlphaGo 没有毁掉围棋。

它改变了围棋。

今天职业棋手训练离不开 AI。

很多过去被认为不好的下法,被重新评估。

很多布局和定式被改写。

业余爱好者也能用 AI 分析自己的棋,看到过去只有高手才能指出的问题。

这件事很像今天很多行业正在发生的变化。

一开始,人会把 AI 看成对手。

然后发现它太强,产生挫败感。

再后来,人开始把它当工具。

最后,整个领域的学习方式、训练方式和评判标准都被改变。

围棋没有因为 AlphaGo 消失。

人类棋手也没有因为 AlphaGo 放弃围棋。

他们只是进入了一个新阶段:

人类不再只和人类经验对话,也开始和机器发现的知识对话。

这是 AlphaGo 故事最有后劲的地方。


结语:AlphaGo 真正改变的不是围棋,而是人类对机器的想象

AlphaGo 的故事,表面上是一段围棋史。

但它真正改变的,是人类对机器的想象。

在 AlphaGo 之前,很多人仍然习惯把机器理解成工具:

  • 更快的计算器
  • 更大的数据库
  • 更强的搜索引擎
  • 更自动化的执行器

AlphaGo 之后,人们开始意识到:

机器不只是执行人类写好的规则。

它也可能在一个复杂空间里形成自己的判断,发现人类没有总结出来的模式,并用一种我们一开始看不懂的方式解决问题。

这就是为什么 AlphaGo 是 AI 历史上绕不开的节点。

它第一次让全世界用一种非常直观的方式感受到:

AI 不只是会算。

AI 也可能会判断。

AI 甚至可能拥有一种不同于人类的直觉。

今天我们再看 AlphaGo,已经不会像 2016 年那样震惊。

因为大语言模型、AI coding agent、多模态模型已经把 AI 带进了更多日常场景。

但 AlphaGo 仍然值得被反复讲起。

因为它像一个预告片。

它提前告诉我们:当 AI 跨过某个门槛后,人类最初的反应往往是怀疑,然后是震惊,然后是失落,最后是重新学习如何和它合作。

围棋已经走过了这条路。

现在,更多行业正在走上同一条路。


参考背景:

  • DeepMind / Nature: Mastering the game of Go with deep neural networks and tree search
  • DeepMind / Nature: Mastering the game of Go without human knowledge
  • AlphaGo vs Lee Sedol, 2016
  • AlphaGo vs Ke Jie, 2017

Leave a Reply

Your email address will not be published. Required fields are marked *