市面上充满了各式各样的学习理论，学校中各个老师也有着自己的教学方法，那究竟哪一种更有效？本以为这是个无解的问题，却在偶然间了解到神经科学这样一门神奇的学科。从大脑的机制入手，不可能再错了吧。随着了解的深入，我才知道有效的学习方法这个课题早已被研究过无数回，学界也基本上有了几个比较清晰的方法。那用这些科学的方法对比我们的教学，结果怎样呢？我们会发现多少人把“学习”误以为是把信息塞进大脑：多看几遍、多做几题、多熬几晚夜，就应该更懂、更会、更记得。但现实往往相反——越用力，越混乱；越重复，越容易遗忘；明明投入很多时间，却迟迟看不到稳定的进步。现实基本上印证了，这些方法都是错误的，接下来我们还会从神经科学的理论中再次推导一番。

你将依次看到：神经连接如何被强化与修剪；信息如何从短暂的工作记忆转入可长期调用的外显记忆与自动化的内隐记忆；大脑为何本质上是一台“预测机器”，以及这台预测机器是如何预测复杂理论的，还包括“预测误差”如何成为真正学习发生的触发器；相信你在读完文章后，会对学习一事有一个更好的理解，下次看见学习理论的时候，可以迅速分析出其有效成分。

注：文内每章节末尾有记忆卡片。

1.神经可塑性：学习的物理基础#

记忆是如何产生的？过去的科学家们认为脑神经在出生后便停止了发展，仅通过强化已经存在的突触来塑造记忆。然而事实真的如此吗？随着观测手段不断更迭，我们终以窥见神经元发展的真相——神经元不仅能强化现有连接，还能通过一系列手段构建新的物理链路。我们所说的”学习”，在微观层面，就是神经元网络物理结构的改变。

这是一个神经元的样子，我们的大脑就是由 850亿到1200亿个神经元组成的，每个神经元平均有数千个连接神经元链接构成的，在第一章中我们将反复的提到它。

神经元

1.1神经元与信号传递#

注：理解不了的话就跳过吧，1.1基本上就是在讲最底层的神经运作机制。理论上直接看1.2也行。

如果把刚才那张神经元的图放大，你会发现它长得非常像一棵树：

树突（树冠）：负责接收来自其他神经元的信息。
轴突（树干）：负责在神经元内传递信息，是一条长长的输出电缆。
轴突末梢（树根）：负责发送信息到下一个神经元的树突。

当一个神经元被激活时，它会产生一道微弱的电信号，这道信号沿着长长的轴突（树干）飞速传导到末端。末端会连接着下一个神经元，然后重复上述过程进行信号的传导，直到最后一个神经元——它会产生一个动作，或者分泌一些激素。

然而，两个神经元之间并不是无缝连接的。如果我们把连接处放大（如下图所示），会发现中间有一个微小的缝隙，我们称之为「突触」。

神经元传导

电信号到了这里不会直接过去，而是转换为化学信号传递给下一个神经元，然后下一个神经元继续转化学信号为电信号。这些化学信号的名字就是神经递质，他们决定了传递到下一个神经元的电位是正是负，以及信号强弱。整个发生在突触中的过程大概可以分为以下四步：

囊泡存储：在上游神经元的轴突末梢里，神经递质被整整齐齐地包裹在囊泡中等待命令。
释放信号：当电信号传来，这些囊泡就会移动到边缘，将包裹的神经传导物质释放到突触间隙中。
精准匹配（受体）：这些化学信使游过间隙，但这并不算完。在下游神经元的树突表面，长满了特定的受体。神经递质必须像钥匙插进锁孔一样，精准地附着到受体上，打开一个通道，让游离的正电或负电离子进入下一个神经元。只有匹配成功，电离子成功进入，下一个神经元才会被激活，重新产生电信号。
打扫战场（酶）：信号传递完毕后，多余的神经递质必须被清除或者回收，会有专门的酵素来配合处理掉这些完成任务的神经传导物质。

综合神经元内部的传导，和突触间的传导，我们大致可以构建一个“大脑”出来了，但是这颗大脑目前还只会机械地传递信号，看不出有任何可塑性的迹象。这样的话我们的大脑恐怕一辈子也发展不出智力——在这里让大脑产生智力的是这些连接的重塑，它具备根据使用频率改变自身强度的物理能力——这便是神经可塑性。

1.2神经可塑性#

是时候理解神经可塑性了，它在人生的任何阶段都会发生，且这种可塑性并非是单向的（或者说并非总是有益的），有时候你会塑造一个错误的回路，有时候你会剪掉那些不用的神经元。

当你第一次尝试学习一个新概念（比如背诵一个生僻的单词）时，特定的神经元A向神经元B发送信号。起初，这条通路是生疏且低效的，信号传递充满了阻力，可能只有很少的连接。然而，当你不断重复这个单词，神经元A反复高频地激活神经元B，这种持续的重复会导致相关激活的神经发生变化。具体表现为：

髓鞘化：强化现有连接。用一层富含脂质的物质——髓鞘——将神经元的轴突层层包裹起来。这种物质能让神经元的电信号传导速度大幅增加
新生突触：新建连接。神经元的树突会分叉、生长，长出新的树突棘。这些新生的触手会向周围探索，寻找其他的轴突，建立从未有过的全新连接。
神经发生：新建神经元。大脑的生发层会通过干细胞分化，产生全新的神经元。

最终，大脑会优化成一个极其高效的网络，一直强化你平时所使用的技能，让你对其越来越熟练。比如社交技能，比如运动技能。当然，大脑也会遗忘。神经可塑性的另一面是突触修剪——这意味着不使用的技能会被逐渐遗忘。婴幼儿乃至青少年时期都在不断高效的修剪突触，直到成年时期修剪速度逐渐变慢，不过大脑依然在优化这个青年时期形成的网络，这种优化会直到死亡。

在神经可塑性这方面，有一个被提了无数次的例子——出租车司机，他们的海马回系统因记忆地图而变大了：

计程车司机必须依靠认知中的空间地图维生，一项着名研究显示，伦敦计程车司机海马回中此区域比较大。此外，还有一项追踪研究，比较在多年累人的工作及准备伦敦计程车执照考试（《纽约时报》称之为世界上最难的考试）之前和之后，海马回的影像有何不同。经历这个过程之后，海马回扩大了 —— 但只有通过考试的人才会如此。¹

1.3敏感-学习的最佳窗口#

我们发现儿童学习语言的速度非常快，一旦成年后大脑就很难学进去新东西了。不止语言方面，我们能发现儿童几乎在任何领域都有着很强的学习能力。——不少成年人都后悔没有在恰当的时机多学一些东西。事实也确实如此，虽然神经会随着我们每天的行为而发生变化，但是它的调整终归比较细微。在许多脑区里，可塑性只有在有限的时间内才会发挥最强性能，这段时间被称为”敏感期”。它在童年早期被激活并达到峰值，然后随着我们年龄的增长而逐渐减弱。比如感觉区域就会在1-2岁的时候将可塑性提高，随后又渐渐降低，最长也是最晚的一个敏感期来自我们的”额叶皮质”，就是我们青春期才开始发育，一直到20岁左右才会停止的区域。

一个最好解释敏感期的例子来自我们对母语的声音的掌握——每个孩童出生时，他们就能很快的区分任何语言的所有音素。无论他们在哪里出生，有什么基因背景，他们只需要沉浸在语言环境里几个月（可以是单语种、双语种，甚至是三语种），他们的听力就会与周遭语言的音系相适应。成人则几乎无法做到这一点，比如大多数中国人一辈子也只会说中式英语；说日语的人在英语国家生活一辈子，也无法区分R和L的发音；部分国家的人会无法发出印度的卷舌音。对比孩童，一个成年人将需要付出巨大努力才能恢复区分外语发音的能力。

上述的例子虽然向我们展示了敏感期有多重要，但同样的，敏感期之所以是敏感期，就是因为在敏感期之后对应的学习能力虽然会减弱，但是不会消失，并且减弱的程度也因人而异。我们也能看到很多人错过了关键期依然通过大量的努力学会了英语。²

比如这里就有实验证明了，后期训练依然可以重建对语言的掌握（但也确实没有敏感期那么容易）。文中他们尝试训练日本听众识别英语中的R和L，最终结果显示，在完成感知训练 3 个月后，日本受训者在感知识别任务中的表现水平依然保持良好。此外，由以英语为母语的美国听众对日本受训者在训练前、训练后以及 3 个月随访期间的语音输出进行感知评估，结果表明，受训者在英语/r/-/l/词发音的整体质量、可识别性和可懂度方面均保持了长期的提升。³

1.4营养、运动与睡眠#

营养运动睡眠

目前可以确定的是，我们在学习时会发生大量的神经重塑。但是任何重塑都需要一定量的时间，这段时间内也必然伴随着高能耗。那么如此高能耗就一定需要大量营养与高质量的休息。其背后正是饮食，睡眠，运动。但现代人们一般都不注重这些因素——就此埋下了一个长期的隐患。

先谈被忽视的营养，大量且充分的营养对于正在发育的大脑来说是必须的。在这里列举其中一个被严重忽视的物质：Omega-3（来自橄榄油，海鲜等物质）——一篇来自2013年的论文研究了它⁴：

Omega-3是必需的不饱和脂肪酸。但遗憾的是，哺乳动物自身无法合成，必须从食物或补充剂中获取。
它们参与多种生理过程，据报道可能有助于保护神经系统疾病中的神经元，例如衰老或受损的神经元以及阿尔茨海默病。它们对认知和行为功能以及多种神经和精神疾病的影响也已被证实。

比较容易补充的是我们缺少的营养，但现代人不仅面临着营养不足，还面临着营养摄入过量的问题。现代食品工业让我们摄入了过多的糖分和油脂，一篇来自2002年的论文研究指出，高脂肪、精制糖饮食会降低海马体中脑源性神经营养因子、神经元可塑性和学习能力。⁵

不仅在营养方面我们严重失衡，我们还严重缺少日常运动——这也是影响神经可塑性的重要因素之一。一篇来自2014年的论文恰好研究了这点⁶：

运动对认知功能有积极影响，并能增加脑源性神经营养因子（BDNF）的水平，BDNF 是一种重要的神经营养因子。
体育锻炼与多种身心疾病的减少密切相关。现有大量证据表明，体育锻炼不仅能降低心血管疾病、结肠癌、乳腺癌和肥胖症的发病率，还能降低阿尔茨海默病、抑郁症和焦虑症等疾病的发病率。
多项横断面研究和纵向研究证实，超重与学业成绩不佳之间存在关联。有氧运动能力也与认知能力和学业成就相关。

最后是关于睡眠的研究，虽然在饮食和运动方面严重失衡，好在是肯定要睡觉的，只是睡眠质量一言难尽——这也是一个巨大的问题。此处找到了一篇2014年和2022年的论文，其中就提到了⁷ [⁸]：

睡眠被认为在大脑可塑性中发挥着不可或缺的作用。
充足的脑血流能够为活跃的神经元提供氧气，同时清除代谢废物，从而促进神经可塑性.
睡眠时长也会影响主动神经可塑性过程，睡眠剥夺对任务相关脑血流和认知功能的影响就证明了这一点。

1.5小结#

学习是让神经网络发生改变：一条通路被反复激活，突触效率提升、髓鞘化加速传导，甚至出现新的树突棘与新连接；相反，长期不使用的通路会在“突触修剪”中被削弱乃至消失。这种重塑贯穿一生，但在不同脑区存在“敏感期”，不过成人并非失去学习力，只是通常需要更高质量的训练、更多重复与更长巩固周期。最后，神经重塑是高能耗、需时间的生物过程，需要我们为其提供一个良好的环境。

Q: 根据神经科学的微观视角，“学习”的本质是什么？

点击翻转

神经元网络物理结构的改变（即：神经元不仅强化现有连接，还能构建新的物理链路）。

点击继续

Q: 神经信号在神经元“内部”和“神经元之间”的传递形式有何不同？

💡 提示：信号转换过程

点击翻转

内部：电信号（沿着轴突传导）。
神经元之间（突触）：化学信号（神经递质）。

点击继续

Q: 在突触间隙中，神经信号完成传递需要经历哪四个关键步骤？

💡 提示：突触传递四步

点击翻转

囊泡存储（包裹神经递质）。
释放信号（排入突触间隙）。
精准匹配（神经递质与受体结合，像钥匙开锁）。
打扫战场（酶清除或回收多余递质）。

点击继续

Q: 当我们反复高频地激活某条神经通路时（如背单词），大脑会发生哪三种具体的物理变化来优化效率？

💡 提示：重复练习带来的三种物理变化

点击翻转

髓鞘化：包裹轴突，大幅提升电信号传导速度。
新生突触：树突生长分叉，建立全新连接。
神经发生：干细胞分化产生全新的神经元。

点击继续

Q: 什么是“突触修剪” ？

点击翻转

神经可塑性的反面机制：大脑会逐渐削弱并移除长期不使用的神经连接，以优化整体网络效率。

点击继续

Q: 著名的“伦敦出租车司机”实验（Maguire研究）证明了什么核心论点？

💡 提示：关于伦敦出租车司机的研究

点击翻转

成年人的大脑依然具有结构可塑性（只有通过考试的司机，其负责空间记忆的海马回才显著变大）。

点击继续

Q: 什么是大脑发育的“敏感期” ？

点击翻转

大脑特定区域可塑性达到峰值的有限时间窗口（如童年早期的语言学习），此阶段学习效率最高，随后随年龄增长逐渐减弱但不会消失。

点击继续

Q: 成年人错过了“敏感期”后，虽然学习能力减弱，但仍能通过什么方式实现神经重塑？

点击翻转

依靠更高质量的训练、大量的重复以及更长的巩固周期（如Bradlow的研究证明，成年人经训练仍能改善对语音的识别）。

点击继续

Q: 神经重塑是一个高能耗过程，需要哪三大外部生理因素的支撑？

💡 提示：三大要素

点击翻转

营养（原料）。
运动（催化剂）。
睡眠（清理与维护）。

点击继续

Q: 体育锻炼和高糖高脂饮食分别如何影响“脑源性神经营养因子” (BDNF)？

💡 提示：关于BDNF

点击翻转

体育锻炼：增加 BDNF 水平，促进认知功能。
高糖高脂饮食：降低 BDNF 水平，削弱神经可塑性和学习能力。

点击继续

Q: 睡眠在神经可塑性中扮演了哪两个关键角色？

点击翻转

清理废物：通过脑血流清除代谢废物。
巩固重塑：为活跃神经元供氧，巩固清醒时的神经连接变化。

点击继续

1 / 11

2.记忆的分类：从瞬时信号到自动化本能#

如果说上一章回答的是”记忆如何大脑中留下痕迹”，那么与记忆相关的本章节要回答的就是——都有那些类型的记忆？我们每天接触的信息绝大多数都会消失。只有极少一部分，才能从短暂的记忆，变成可以在数天、数年甚至一生后被重新调用的知识。在这一章中，我们依次介绍只能维持数秒的工作记忆，到被长期保存、甚至自动化执行的知识与技能。

2.1工作记忆-思考正在发生的地方#

现在，转头看看四周的环境，尝试去记住它们的样子，然后看回来。如果你真的认真去记了周围环境的样子，你会发现你忘掉了部分文章的内容。这并不是因为你能力不够，而是因为工作记忆容量有限、注意资源被重新分配，原本正在维持的信息就会被挤出。这就是工作记忆。

一个工作记忆包含一次活跃的思维呈现，它会维持几秒的时间。它主要依赖顶叶皮层区及前额叶皮层区里许多神经元的辛勤放电，从而支持其他周围神经区域的神经元。一般来说不会超过几秒钟，并且分散注意力后神经元活动立刻就会消散，会立刻忘记刚刚想起来的事情。就像当你读到这句话的时候，关于前面神经可塑性的记忆可能已经消散了，你已经忘记了什么是”突触”。

工作记忆一般被认为的上线是3-5个，这表示大多数人记不住超过5个的信息——当然，这5个信息被认为是5个独立的，无序的知识。多数人可一次性记住8位到10位的电话号码，网络工程师能一次记住12位的IPv4地址，这些其实都没有超过5个，他们只是把几个数字合并为了一组。——这同样表明针对某些特定任务，工作记忆是可以通过不断组块化提升的⁹——此处不过多展开，在后续章节我们会详细讨论这点。

工作记忆可以短暂维持，但并不等于’写入成功’。后文我们会用著名病例 H.M. 说明：一个人可以保留工作记忆与技能学习，却几乎无法形成新的可回忆经历。

2.2外显记忆-可以被回忆的知识如何被巩固#

当你熟睡在床上时，你的大脑就在飞速的回顾白天所见的信息。其中可能包括这篇文章，偶然间这篇文章又给你留下了强烈的印象，恰好被你的大脑所标记，浅浅的塑造了一些神经元链接。你就会在第二天起床的时候，发现你依然记得本篇文章的一些观点。这就是外显记忆，它以文字的方式存储在你的大脑里，你可以在需要的时候去回顾它。

与工作记忆不同，外显记忆并不是依赖短暂而持续的神经元放电来维持的，其关键在于巩固。我们会把白天不断触发的神经元回路连接在一起形成记忆。还有就是到了晚上休息的时候，大脑会反复“回放”这些模式，并在皮层相关区域同步加强连接。随着时间与多次回放，记忆对海马区域的依赖通常会下降，对皮层联结的依赖上升——这就是外显长期记忆逐渐变得更稳、更容易提取的原因。

正因如此，外显记忆并不是对过去的完美重放。几天之后，我们仍然记得某个公式、某个事实或一次重要的经历，但往往已经说不清当时的具体细节。记忆在保存的同时，也在不断被重构，成为我们理解世界的一部分。¹⁰

2.3内隐记忆-技能如何在无意识中自动化#

最后，也是最难理解的一个记忆，内隐记忆。它既可以从你记忆的外显记忆中转化而来，还可以从直接的动作或者思维中转化而来。它指的是我们对技能和行为方式的记忆。但它并不以具体事实或事件的形式存在，一般体现在”会不会做”之中。例如，骑自行车、打字、系鞋带或使用某种工具，当我们一遍又一遍的重复这些活动，皮层中的神经元和其他皮层下回路最终会调节自身，使信息在将来的使用更加流畅。神经放电会变得更有效、更能被复制，修剪掉依附性活动，像时钟一样不出差错、精确地开展工作。这些能力一旦掌握，往往可以在几乎不经思考的情况下被执行。

与外显记忆不同，内隐记忆通常难以被清晰地用语言描述。我们能够完成某个活动，却很难准确说出每一步是如何实现的。这类记忆的形成并不依赖对经历的回忆，而更多依赖反复的练习和反馈，在长期使用中逐渐被固化下来。从知识写入的角度来看，内隐记忆是一种高度稳定的存储形式。它的获得过程缓慢，却一旦建立便不易消退，甚至可以在多年未使用后被迅速重新激活。这也解释了为什么某些技能在学会之后，即使长时间不用，仍然”身体记得该怎么做”。

在内隐记忆的形成过程中，其他记忆系统往往在早期阶段发挥辅助作用。对于复杂技能而言，学习初期通常需要依赖工作记忆来维持操作步骤，并借助外显记忆来理解规则和目标。然而，随着重复练习的进行，这些显性的控制逐渐被削弱，行为执行开始转由更为自动化的神经回路所主导。当然，内隐记忆并非一定要经历显性的学习阶段。一些简单的技能可以在缺乏清晰意识参与的情况下直接形成。

注：内隐记忆并不仅仅体现在肢体动作中，也包括大脑中高度自动化、几乎不需要意识参与的思维加工过程。且并非所有记忆都会变成内隐记忆，但部分记忆内容可以在反复使用中”程序化”其使用过程。例如，对多数成年人而言，3×4=12 这一结果往往会被直接提取出来，而无需重新回忆或复述乘法规则。这类过程虽然最初可能源自显性的学习，但在反复使用后，其提取方式已呈现出内隐化的特征。¹¹

2.3著名患者H.M.-“能记住 ≠ 学会”#

最后，让我们看记忆研究领域的一个被研究了无数次的经典案例病人H.M.，相信这可以增进我们对这几种记忆类型的理解。

H.M.（Henry Molaison）因严重癫痫接受手术，双侧内侧颞叶（包含海马体等结构）被切除 or 严重受损。术后癫痫在一定程度上得到控制，但他出现了典型且严重的顺行性遗忘症：从此几乎无法形成新的、可长期保存并在之后有意识回忆的记忆¹²。

重要的是，H.M. 并非所有记忆功能都受损。他的总体智力测验表现接近正常，语言与既有知识也相对保留；在实验室中，他的工作记忆在短时间窗口内可以正常维持——只要信息仍处于注意力支撑的”在线状态”，他就能复述 or 操作它；但注意力一旦被打断，信息迅速消散，随后他无法回忆刚刚发生的事情。这表示：工作记忆的短暂维持，不等于记忆已经完成写入。

更关键的证据来自技能学习。Corkin 总结的研究显示：H.M. 在”镜像描摹”等程序性任务中，虽然每次都声称从未做过该任务、也无法回忆训练过程，但他的表现会随着练习稳定提升、错误率逐日下降¹²。这表明他仍然能够获得新的程序性（内隐）记忆，即”会做”的技能可以在缺乏外显回忆的情况下被逐步固化。

综合来看，H.M. 清晰地支持了一个结论：记忆并非单一系统。程序性学习可依赖相对独立的回路继续发生。¹³

2.4小结#

记忆阶段	持续时间	是否稳定	主要功能
工作记忆	数秒	极不稳定	临时维持当前思维内容
外显记忆	数天–终生	高度稳定	存储事实、概念与规则
内隐记忆	数周–终生	极高稳定性	自动化技能与思维模式

Q: 本文将人类的记忆系统主要划分为哪三大类别？

点击翻转

工作记忆：瞬时维持的思维呈现。
外显记忆：可被意识回忆的事实与经历。
内隐记忆：无意识参与的自动化技能与习惯。

点击继续

Q: “工作记忆”的生理机制与容量限制分别是什么？

💡 提示：关于容量与机制

点击翻转

机制：依赖顶叶与前额叶皮层神经元的持续活跃放电（一旦注意力转移即消散）。
容量：通常仅能容纳 3-5 个独立单位。
优化：可通过组块化将分散信息合并，从而在不增加单位数量的前提下提升记忆效率。

点击继续

Q: “外显记忆”是如何从短暂的信号转变为长期存储的（生理过程）？

💡 提示：与工作记忆的区别

点击翻转

依靠巩固过程。大脑（尤其在睡眠时）会重播神经元模式，使记忆存储从依赖海马体逐渐转移并加固到大脑皮层的连接中，从而不再需要持续的神经放电来维持。

点击继续

Q: 为什么说外显记忆具有“重构性”而非“回放性”？

点击翻转

外显记忆不是对过去的完美录像。在提取记忆时，大脑会根据当前的理解重构细节；且随着时间推移，记忆在不断被修改和重新整合，导致细节可能模糊或失真。

点击继续

Q: “内隐记忆”的核心特征及其形成方式是什么？

💡 提示：特征：难以言传，身体知道

点击翻转

特征：非陈述性（很难用语言清晰描述）、高度自动化（几乎不需要意识参与）、高稳定性（不易消退）。
形成：通过反复练习和反馈，调节神经回路效率，修剪冗余活动，直至行为被“程序化”。

点击继续

Q: 内隐记忆的形成通常如何体现“从显性到隐性”的转化？

点击翻转

复杂技能的学习初期通常依赖工作记忆（维持步骤）和外显记忆（理解规则）；随着重复练习，显性控制减弱，自动化神经回路占据主导，最终转化为无需思考的内隐记忆（如成年人直接得出 3x4=12 而无需背诵口诀）。

点击继续

Q: 病人 H.M.（切除海马体）的案例中，保留了哪两种记忆能力？这证明了什么核心结论？

💡 提示：著名病例 H.M.

点击翻转

保留能力：
1. 短时间的工作记忆（只要注意力不中断）。
2. 新的内隐/程序性记忆（如“镜像描摹”技能随练习提升，尽管他完全不记得练过）。
结论：记忆不是单一系统。外显记忆（依赖海马体）与内隐记忆（依赖其他回路）是相互独立的生理机制。

点击继续

1 / 7

3.大脑是一台预测机器：学习必须从“犯错”开始#

学界早在30年前就已确认‘大脑是一台预测机器’，且这一理论在2010年就已完成了严密的科学论证。然而，这种颠覆性的认知至今未能普世——我们对记忆的看法依然是错误的。这种认知偏差不仅让我们误解了大脑，而且让我们严重无解了记忆的真正功能，进而影响我们对学习的定义。

3.2无时不刻在预测的大脑#

让我先假设你身为读者会仔细阅读标题，那么当你看到这一小节的标题的时候，大脑电波大概会激增。因为这与你所记忆的知识不符——所有的章节应该从1开始，所以这一章应该是3.1而非3.2。当然，这种事情很快就会被大脑所解释：“这只是作者的一个小失误”，从而在几秒钟后遗忘。

其实预测不止在你看到第三章第一小结的标题的时候会发生，它会发生在我们日常生活中的任意时刻。一篇来自1980年代的论文就对此有所论证：两位认知科学家在实验中逐字呈现“我的咖啡加了奶油和狗”并记录大脑活动。一般来说大脑自动预测空格里应该出现“糖”，但实验中最后一个词却修改成了狗。在这种情况下将上面这句话逐词呈现给参与者，同时记录他们的大脑活动。结果显示，受试者看到“不合预期”的单词“狗”时，大脑电波激增，约在刺激出现后400毫秒达到峰值，这种特异的脑电模式被称作 N400 效应。这强烈的信号并非因为其语义荒诞从而引人发笑这么简单，因为它打破了大脑的预测。¹⁴

除此之外，我们还能看见大脑在非语言之外的地方预测的样子。这里用一个最经典的现象——视错觉：

视错觉

视错觉之所以会出现，是因为大脑的预测对身体的感觉输入而言拥有更高的解释权，换句话说，当感觉和预测出现偏差，大脑大概率更倾向于相信预测的那个。

在左侧的这张图中，虽然你的眼睛告诉你 A 块比 B 块深，但实际上它们的物理颜色完全相同。这是因为你的大脑不仅在看颜色，还在预测光影。它“预判”了圆柱体会投下阴影，为了让你在阴影中也能看清物体，它自动补偿了亮度。在这个视错觉中我们可以总结到：你的大脑并不关心原始的光波数据，它只关心它认为“真实”的世界。

而右边的这张图则展示了大脑预测的不确定性。当你预测这是一个兔子时，长条状的部分就是耳朵；当你预测这是一只鸭子时，它就变成了嘴巴。有趣的是，你很难同时看到两者。这说明大脑在同一时间只能维持一个主要的预测模型，并根据这个模型来过滤你所接收到的视觉信息。

由此可见，大脑并不是一台追求“如实反映世界”的设备。我们所见的世界，大概率是大脑依据某种事物加工而成的。

3.2记忆为未来构建预测模型#

在继续之前，可以先问自己一个问题——你期待在这一小结的开头看见什么？

在经过了一个本应是3.1的3.2小结后，你可能会开始预测，在这一小结的开头我同样会引入一些例子，目的是让你对大脑在预测这一事的记忆更加深刻。又或者你看见了本章的标题，试图猜测我要论证“我们会根据我们的记忆产生一系列预测”。——恭喜你，猜对了。这也印证一个事情，我们在不断地使用我们过去的记忆来预测未来。“一般来说，每一段小结的开头都会遵循一定格式”、“别的文章都这么写，我正在读的这篇肯定也这样”、“标题很大程度上可以概括作者在这一章想表达的内容”。

过去人们认为，记忆服务过去，而非未来。但越来越多研究指出记忆的核心价值在于面向未来的预测。Bar等人在2013年就在一片回应论文中提出，记忆系统的首要功能是帮助有机体针对未来行动做准备。大脑会将过去积累的片段重新组合、模拟未来情境，从而指导我们当前的决策。大脑中负责记忆形成与提取的关键结构——海马体，在我们展望未来时同样会强烈激活，这表明想象未来和回忆过去在神经机制上密切相关。所以，我们的大脑储存往事，是为了更好地预测将来。无论是工作记忆维持当前情境的信息，长期记忆提供庞大的背景知识，还是内隐学习在不知不觉中积累模式，这些记忆过程都是在为预测服务，帮助我们更有效地应对环境变化。¹⁵

更有力的证据来自另一项2007年神经科学的研究，研究人员发现，当负责记忆的形成与提取的关键区域海马体受损时，人们不仅无法回忆过去，同样无法构建连贯的未来情境。这一发现更进一步的表明，记忆系统的功能是为未来行动提供情境化预测的基础。¹⁶

归根结底，记忆是大脑通过模拟与重组历史参数来应对未来的生存方法。并非像我们所熟悉的存储介质。

3.3没有未知的信息，只有错误的预测#

请想象一下，如果你在大街上看到一个形状极其怪异、从未见过的物体，你的大脑会直接弹出一个“404 Not Found”的空白框吗？或者当你看到一个极其复杂的物理学公式，你真的会觉得自己对此一无所知吗？

绝对不会。你的大脑会立刻开始疯狂运转：“它看起来有点像个巨大的榴莲，或者是一个长满刺的外星飞船，又或者是一个现代艺术雕塑。”或者你的大脑开始对物理公式中的各种符号开始分析，比如假设V代表速度，T代表时间一样。看，哪怕面对你完全未知的事物，你的大脑依然在预测。

神经科学告诉我们，大脑极度厌恶混乱和不确定性。面对一个完全未知的概念对于大脑而言是极度危险且耗能的。因此，大脑采取的策略是：永远不让预测处于空白状态。无论面对什么新奇的刺激，大脑都会迅速检索记忆库中与之最相似的模型，将其强行套用在当前的事物上——哪怕这个预测非常牵强。

这就是为什么我们会在云朵中看到人脸，在火星的岩石照片上看到“大脚怪”。这种现象被称为空想性错觉。

一项2014年的研究揭示了其中的机制：当我们看到模糊图像时，我们的大脑并不是在被动等待图像变清晰，而是由额叶区域自上而下地强行“发射”一个预测信号——“这是一张脸！”，大脑宁愿通过错误的预测来构建幻觉，也不愿面对纯粹的未知。¹⁷

这个原理对我们的学习有着巨大的启示。

我们常以为学习是一个“从无到有”的过程。但从预测加工的角度看，学习实际上是一个“从错到对”的过程。

当你第一次学习量子力学中的“电子”时，你不可能凭空理解它。你的大脑会调用旧的预测模型：你会把电子想象成一个绕着太阳（原子核）转的小球（行星）。这显然是物理学上的错误的预测，因为电子云的性质远非如此。但正是这个错误的预测，成为了你理解新知识的脚手架。随后的学习过程，其实就是你不断发现“小球模型”解释不了衍射现象（预测误差），从而一点点修补、甚至推翻旧模型的过程。

这也解释了为什么成年人学习新概念往往比儿童困难。儿童的预测模型相对贫乏，也就是“先入为主”的偏见较少（Priors are flat）。而成年人拥有庞大而坚固的预测模型，当我们面对新信息时，大脑的第一反应往往是试图用旧模型去“同化”它，从而忽略了那些微妙的差异。这在心理学上被称为功能固着——因为你太确定盒子是用来装东西的（预测模型太强），所以你看不见它其实也可以被钉在墙上当烛台。

所以，真正的学习障碍往往不是因为“信息太新”，一般因为我们的“旧预测太强”。——旧知识会妨碍新知识的学习。

在这个意义上，世界上确实没有绝对的“未知信息”，所有的“未知”，本质上都是等待被修正的“错误预测”。

3.4模型更新的条件-预测误差#

当预测与现实状况出现了偏差时会发生什么？——嘿！是时候更新我们的预测模型了！什么？你不想更新？好吧，可能你现在的预测模型也够你生存了。不过总有模型更新的时候，也就是预测偏差且造成严重后果的时候。毕竟你不会想造成下一次严重的后果的。

——什么？你说你更新的是如何下跪给人道歉的模型，而不是如何避免再犯的！？哦天哪……

上面的那个笑话揭示了当我们预测失误且造就重大后果的时候，我们就会将错误信号传递到脑的高级区域，启动更新模型。一篇来自2018年的文章中提出了预测性编码这一理论，即各层次的大脑区域都会基于以往经验构建内部模型，持续对感知到的输入进行预测，并将这些预测与实际输入进行比较。当预测与现实不符时，就会产生“预测误差”信号向上传递，大脑据此调整内部模型，以减少未来的误差。甚至大脑各级神经回路会抑制可解释的差异，只把那些解释不了的误差当作有价值的新信息加以处理。换言之，我们主动地拿着记忆去丈量现实。例如阅读时，我们依据长期记忆中的语言知识不断预测下一个词，将注意力聚焦在意料之外的信息上。¹⁸

就此我们可以得出，预测失败才会促发学习（Philippe,2006）。如果一切都如预期进行，大脑反而学不到新东西。当预测吻合时，大脑觉得“不惊不喜”，神经活动也维持常态；只有当预测失败时，我们才会进行学习。经典的条件反射实验也揭示了这一点（Miami Symposium on the Prediction of Behavior）：如果一只狗已经学会铃声意味着食物，再同时伴随亮灯出现食物，狗对亮灯却几乎无法形成新的联结，因为食物奖励早被铃声完美预测了——没有预测误差，因而学习被“阻断”。这一著名的“阻断实验”表明，没有惊讶就没有新的学习：学习的发生需要有出乎意料的结果，或说需要“大脑犯错”。从理论上看，现代学习模型（如Rescorla-Wagner模型）指出，学习的驱动力正是期望与结果的差异，每次训练会让预测误差逐渐减少，直至预期与现实相符。只有在差异出现的那一刻，大脑才会真正忙碌起来，去更新相关的联结。¹⁹²⁰

当然，除了预测失误之外大脑一般还会去思考一个因素，就是这到底是否值得我去更新神经回路？毕竟神经回路的更新也是相当耗能的一件事情。所以体现在学习的情况中往往就是当预测失败且伴随重要后果（例如考的巨差）时，虽然这种更新的劲可能只会保持几天。值不值的因素一般与多巴胺这个令不少人熟悉的介质有关，这里有一项实验可以说明这点（Tobler, Philippe）。大脑中的多巴胺神经元会根据预测误差调整其活动：当实际奖励比预期好时，它们会异常的兴奋；当奖励不如预期时，它们沉默下来。无论是多巴胺无限爆发，亦或是多巴胺静默等待。这些都在指导神经突触做出可塑性改变，从而在生理层面“写入”新的经验。现在假设你参加了一场考完就出分的选择题考试，当你实际分数比预期分数高的时候，可能会强化你考前的行为（如认真复习，或者求神拜佛）；当你实际分数比预期分数低的时候，可能会减弱你考前的行为（如打游戏等行为）。¹⁹

这一小结我们就讨论了一条原则——预测偏差且造成严重后果的时候我们会触发神经塑造的回路（在此时开始学习）。这就是我们的核心学习原则，请务必牢记。

3.5为什么大脑可以同时相信矛盾理论#

前面已经提到，学习（模型更新）的第一步，始于产生了主观上的巨大代价的预测误差时，大脑才会愿意消耗巨大的能量，去启动“寻找新模型”的进程。不过在寻找新模型时，也会发生一定的冲突。

首先，让我们看一个最基础的学习场景。为什么我们在物理课上修正一个错误概念相对容易？假设一个学生坚信“重的物体比轻的物体下落快”（这是基于直觉的旧模型）。当老师在一个真空管里同时释放羽毛和铁球，学生看到它们竟然同时落地时，大脑瞬间接收到了一个无法忽视的“惊奇信号”。

在这种场景下，预测误差是清晰可见的。现实数据（同时落地）与预测（铁球先落地）完全冲突，旧模型被瞬间证伪。由于错误太明显，大脑别无选择，只能迅速搜寻并接纳那个能解释这一现象的新模型——牛顿力学。这种“旧模型彻底失效”的时刻，恰恰是知识学习最顺畅的时刻。

然而，当我们离开科学的视角（假设你真的清楚什么是科学的话），就会发现学习中存在的诸多bug。此时我们会发现的新模型往往无法在和旧模型的争论中胜出。

以经济学专业学生为例。他起初通过极其艰难的学习，在大脑中构建了完美的凯恩斯主义模型（政府干预、总需求决定论）。这个模型在他的脑海里运作良好，能解释大萧条，也能应付期末考试。然而，到了高年级，他突然接触到了后凯恩斯主义。新理论告诉他：原来的理解不够彻底，货币是内生的，不确定性是根本的。

此时，旧模型（凯恩斯主义）并没有被彻底证伪，它依然能解释很多现象；但新模型（后凯恩斯主义）似乎在某些情形中提供了更深层的视角。面对这种“没有完全对，也没有完全错”的预测误差，大脑陷入了进退两难的境地。

结果是什么？你此时会强迫自己的大脑执行“分区操作”。它会在脑海中强行开辟出两个区域：一个区域运行“标准凯恩斯模型”，用于应付解释现象；另一个区域运行“后凯恩斯模型”，用于应对另一个考试。这在神经科学上被称为多重模型共存。此时，大脑必须消耗额外的能量去判断当前处于哪个“上下文环境”，从而决定调用哪个模型。在解释经济现象的时候你可能偏向于凯恩斯模型，不过考试的时候解释经济现象可能偏向后凯恩斯模型。

一篇来自2001年的论文中就支持了这一论点。计算神经科学家 Wolpert 和 Kawato 提出的 MOSAIC 模型指出，我们的大脑内部运行着多个模块化的‘微型专家’，它们根据上下文竞争上岗。普林斯顿大学的 Gershman 等人在 2010 年的研究进一步揭示了这一机制的算法逻辑：当预测误差大到一定程度时，大脑会执行‘状态分裂’ (State Splitting)——它不再试图修正旧模型，直接判定当前进入了一个全新的‘潜伏状态’，大脑并为此单独开辟一个新的记忆分区。这就是为什么那个学生脑中可以同时容纳两套矛盾的经济学理论：就像电脑里的双系统，大脑利用海马体的‘模式分离’功能，在物理层面将这两套模型隔绝在了不同的神经回路中。²¹²²

与之类似的情况还有科学和民科的对碰——随着互联网的发展，一帮民科或伪科学观点，或阴谋论逐渐占领了舆论高地。对于一个受过高等教育的人来说，这构成了巨大的挑战。如果在工作中，他必须使用严谨的逻辑和科学思维（模型A）；但在刷短视频或社交时，他又被那些极具情绪煽动性、但违背科学的观点（模型B）所吸引。如果大脑无法有效“分区”，这两套模型就会打架。最后的结果正如上面哪个经济学生一样，他可能在白天工作时，是坚定的科学捍卫者；但一下班回到生活场景，为了融入圈子或寻求心理安慰，他又会瞬间切换到“反智模式”，转发伪科学文章。大脑为了维持内部稳定，将互斥的两个世界彻底物理隔离了。

因此，寻找新模型的前提，是旧模型的预测失效。学习新模型也不需要你彻底否认旧模型，你可以同时持有两者。

也请记住，此处的“失效”是一个主观概念——它指的是“无法用旧模型解释你当前所处的情况”。

在物理课上，旧模型解释不了真空管现象（彻底失效，导致替换）；
在经济学里，旧模型解释不了新理论（局部失效，导致共存）；
在生活中，旧模型解释不了情绪需求（情境失效，导致割裂）。

3.6模型更新-打补丁or重构#

假设此刻的你可能已经下定决心要更新模型了，不过摆在你面前的往往是两条路线，一条是高耗能的彻底转变，另一条是低耗能的打上几个补丁。神经科学告诉我们，大脑是一个极其精明的能量管理者。它不关心模型是否“客观正确”，只关心模型能否以最低的能耗消除当下的预测误差——所以多数时候我们选择了打补丁，但仍有些时候选择彻底重构。

一项来自2012年的研究发现，当环境稳定时（误差小），大脑的“学习率”很低，倾向于忽略偏差或微调（打补丁）；当环境发生突变（误差剧烈），瞳孔会扩张（代表去甲肾上腺素释放），学习率飙升，大脑迅速抛弃旧值，接纳新值（彻底转变）。²³

因此当误差在环境稳定的时候出现时。我们试图在保留原有信念不变的前提下，通过增加一些附加条件（辅助假设）来解释当下的异常。这就是“打补丁”。

最经典的例子莫过于天文学中的“地心说”。古人坚信地球是宇宙中心（核心旧模型）。然而，观测数据却发现火星有时候会“逆行”。这完全违背了旧模型的预测。此时天文学家们没有抛弃地心说，而是给模型打了一个复杂的“补丁”，叫做“本轮” 。他们解释说：火星不仅绕地球转，它自己还绕着轨道上的一个小圈转。如果一个小圈解释不了，那就再加一个小圈。通过增加模型的复杂度，强行消除了预测误差，从而保护核心信念不崩塌。

当然，这种补丁在日常生活中更为常见，它是大脑维持连续性的本能。它可能会用于“维护”科学，比如实验数据对不上，科学家可能会想“是不是仪器坏了”或“有个干扰变量没排除”（给理论打补丁），而不是推翻物理定律；它也会被用于维护迷信，当求雨没成功，信徒会想“是不是心不够诚”或“祭品不够丰盛”（给信仰打补丁），而不是立刻推翻神的存在。

大脑不需要改变神经网络的整体拓扑结构，只需要调整几个参数，或者在海马体中存储几个“例外情况”。这非常省能，能让我们快速消除焦虑。然而，当“补丁”多到让模型变得臃肿不堪，或者预测误差大到无法修补时，大脑可能会倾向于——重构。

正如当地心说的补丁多达几十个时，哥白尼发现只要假设“地球绕太阳转”，所有逆行现象瞬间解释通了。于是，大脑为了追求简洁，抛弃了地心说。同样地，一个深受现代生活重压、感到虚无的人，可能会发现科学解释不了他的痛苦（预测误差）。而某个宗教或伪科学理论（哪怕看起来荒谬）只要一个核心假设——“这一切都是注定的”，就能瞬间解释他所有的遭遇。此时，大脑也会为了追求这种“解释的效力”，抛弃复杂的理性思考，彻底倒向迷信。

彻底抛弃对应的是结构学习。这需要抑制旧的神经回路，并生长出全新的突触连接。这是一次高能耗的行为，通常伴随着强烈的情绪震荡——无论是科学家发现真理的狂喜，还是普通人误入歧途时的狂热，本质上都是大脑完成了一次剧烈的模型重构。

3.7小结#

前几章我们讨论了神经可塑性和各种记忆，现在我们可以看到它们如何作用于大脑的预测功能。工作记忆会随时记下当前情境的关键信息，供大脑即时演算和预测下一步变化；外显记忆则为预测模型提供素材和依据，让我们可以根据经验之“旧”推知未来之“新”。内隐记忆则默默发挥作用，我们在无意识中习得的规律和技能（比如语言语法或骑自行车的平衡感），体现为一种本能的直觉，让我们对环境变化做出及时而准确的预测。所有这些学习形式都依赖于神经可塑性的基础——无数神经元连接的强化或削弱，这塑造出大脑内部不断更新的模型。当预测误差出现时，这些连接经过误差反馈进一步调整巩固，使得相关记忆变成持久的回路。最终，大脑在错综复杂的神经网络中塑造出一个或多个预测模型，让我们能在不可知的未来中稳步前行。

Q: 本文认为大脑处理信息的本质机制是什么？（与传统“如实反映世界”观点的区别）

💡 提示：核心隐喻

点击翻转

大脑不是被动的记录仪，而是一台主动的预测机器。

机制：大脑依据内部模型时刻“预判”感觉输入，只关注与预测不符的偏差。
证据：如 N400效应（语言预测违背时脑电激增）和视错觉（大脑为了符合模型会修改看到的颜色或形状）。

点击继续

Q: 从预测加工视角的角度来看，“记忆”的首要生物学功能是什么？

点击翻转

服务于未来，而非记录过去。大脑通过重组过去的片段来模拟未来情境，辅助决策。

证据：海马体受损的患者不仅无法回忆过去，也无法构建连贯的未来想象。

点击继续

Q: 面对完全陌生的新事物（“未知信息”），大脑通常采取什么策略？

💡 提示：关于未知与空想性错觉

点击翻转

大脑厌恶空白，会强行调用旧模型进行“同化”。它会检索最相似的旧经验套用在当前事物上（如把电子想象成行星，或在云中看到人脸）。结论：学习不是“从无到有”，而是“从错到对”（即修正错误预测）的过程。

点击继续

Q: 神经科学认为，触发“学习”（神经回路更新）的唯一充要条件是什么？

💡 提示：核心学习条件

点击翻转

预测误差。

原理：只有当现实与预期不符（感到惊奇或犯错）时，大脑才会调整活动，驱动突触变化。
反例：如果预测完全吻合（如阻断实验），大脑不会进行新的学习。

点击继续

Q: 当新旧模型冲突但互无法完全证伪时（如解释力不同的经济学理论），大脑会使用什么策略来避免认知崩溃？

💡 提示：关于矛盾观点的共存

点击翻转

状态分裂（或称分区操作）。大脑利用海马体的“模式分离”功能，像电脑双系统一样，根据上下文环境在不同模型间切换（例如：考试时用模型A，生活中用模型B），从而允许矛盾理论在大脑中物理隔离并共存。

点击继续

Q: 在模型更新时，大脑倾向于“打补丁”还是“重构”？区别是什么？

点击翻转

大脑遵循能耗最小化原则，首选打补丁。

打补丁：保留核心信念，增加辅助假设来解释异常（如地心说的“本轮”），能耗低但会导致模型臃肿。
重构：当误差大到无法修补时，彻底推翻旧模型建立新连接（如转变为日心说），能耗极高并伴随情绪震荡。

点击继续

1 / 6

4.从新手到专家：复杂模型如何被逐步建成#

每个人都有预测能力，但各不相同。虽然人们都会预测题目的答案，但显然大多数人都不会觉得自己能预测准确高等数学题的答案。

这一章的核心任务，就是解释我们如何从“错误预测”到“精准预测”，去了解一个复杂的预测模型是如何被我们一步步构建出来的。在神经科学看来，所谓的“学习”，本质上就是通过不断修正预测偏差，在大脑中构建更复杂的生成模型。当我们面对一道复杂题目能脱口而出答案时，就是我们的内部模型完美预测了推演的每一步，将意外降到了零。

4.1组块与长期模型让专家“记得更多”#

该领域有一个极其经典的研究案例——人们发现国际象棋高手往往可以一眼记住复杂的棋子摆放，而新手往往不能做到这一点。在20世纪70年代初期，研究人员开始从事研究这件事情，以理解国际象棋大师怎么做到如此准确地记住棋子位置。

研究人员提出了一个简单的问题：国际象棋大师究竟是能够回忆每个棋子的位置，还是实际上只能记住当时的整个棋局，而把单个棋子的位置作为更大整体中的一部分而记住的呢？因此他们展开了一个简单而有效的实验。他们摆好两个棋盘，对国家级的国际象棋棋手（即国际象棋大师）、水平中等的棋手以及新手进行了测试。在其中的一个棋盘上，摆出一盘别人真正下出来的棋局，在另一个棋盘上，只是较为混乱地摆放了一些棋子。

当国际象棋大师看到别人真正下出来的棋局时，经过5分钟的研究，能够记住大约2/3棋子的位置，但新手却只能记住大约4个棋子.而当他们全都看到随意摆放棋子的棋盘时，无论是水平中等的棋手 or 优秀的大师（纯新手还是落后了），在记住棋盘上随便乱摆的棋子的位置方面，只能记住两三个棋子的位置。此时，经验丰富的棋手的优势不见了。对于大师而言，看到真实棋局时，大脑迅速调用先验模型进行预测。看到的棋子位置与大脑预测的位置高度一致。于是大脑不需要记录每一个棋子的坐标，只需要记录“这是‘西西里防御’变体”这一个信息然后稍加推演即可。²⁴

类似的实验也可以现在再做一次，相信正在阅读本文的每个人都是中文大师，那么现在请你尝试记住：

的在了不我有是人这中大为上个

请花几秒钟看一看，然后合上眼睛，尝试回忆这些字的顺序。

这项任务并不容易。虽然你对这些汉字都非常熟悉，但由于它们是随机排列的，缺乏语法结构和语义联系，导致你无法预测下一个信息，因此你往往只能记住其中的两三个，甚至完全混乱。当然，也许有人会取巧尝试编造某种谐音，或者记忆口诀——这当然是有效的，不过你肯定不会觉得上面这一行字容易记忆。而下一组材料恰好相反，你大概能在几秒之内轻松记住。

现在请再看一组材料：

我们正在研究人类记忆的工作机制

这一次，即使字数明显更多，你也会发现自己几乎可以完整复述。因为你的大脑在读到“我们”时，就已经基于语法习惯自动预测出了后面可能会跟“正在”或“认为”。当眼睛看到“正在”时，视觉输入完美符合预测，大脑几乎不需要消耗能量去处理它。然而在第一个例子里，你只能费劲的尝试去记住单个字词。

综合以上实验，我们发现国际象棋大师与新手之间的差异并不在于工作记忆容量，而在于大师拥有大量长期记忆中的”棋局图式”，能够将多个棋子的位置自动整合为少数几个有意义的记忆单元，从而做出更复杂的预测。而新手不可能做到这一点。不过在面对杂乱无序的棋盘时，他们的表现几乎一致，就如我们这些中文专家在尝试记忆第一组材料一样。由此，我们可以总结出预测复杂事物的前提，是在记忆中构建大量的“组块”（即预测模型）。组块的本质是将大量的不确定性压缩为一个简单的预测单元，从而极大地降低了大脑实时处理预测偏差的算力需求。

4.2认知负荷的来源#

如果在进行复杂推演时，你感到大脑过载（“烧脑”），这在神经科学上意味着你的大脑正在处理过量的预测偏差。我们可以把认知负荷看作是大脑为了消除“意外”和“不确定性”所消耗的系统资源。

那么，认知负荷从何而来？研究者根据来源将这些负荷分在了两个方面：

外在负荷——噪音干扰产生的无效偏差。它与你在学什么没有关系，纯粹是与材料的编排方式，注释程度有关。比如一篇文言文，但是每一段的每一个字都配上了注释，而且配上了彩图，导致原本简单的文章反而变得复杂起来。又或者一份产品说明书，里面写了太多的专业术语（就像我为啥要知道材料学上的名字，告诉我是干啥的不就行了，比如这个是1号，而不是膨胀螺丝）。处理这些无意义的预测偏差浪费了宝贵的脑力。
内在负荷——模型重构所需的必要偏差。比如 $\sqrt{2}$ 比 $1+1$ 难，是因为 $\sqrt{2}$ 涉及的概念（无理数、开方）在你的大脑中尚未建立完善的预测模型。你需要调动资源去理解它，这种由“新知识”带来的预测偏差是学习的必经之路。

好了，现在：

\text{总负荷} = \text{噪音处理负荷 (外在)} + \text{模型重构负荷 (内在)}

所以我们可以得出，当外在负荷（无效的信息呈现）占据了太多空间时，留给内在负荷（理解核心逻辑）的空间就变小了。这就是为什么当我们面对排版糟糕、废话连篇的教材时，即使我们智力正常，也会觉得“脑子转不动了”。

接下来的两节，我们将分别探讨如何通过“优化呈现”来降低外在负荷，以及如何通过“拆解信息”来应对内在负荷。

4.3降低外在负荷-去除冗余#

外在负荷一般与学习材料的呈现方式有关。很多时候我们都能感觉到，一句话能解释明白的东西，很多教科书就非得8句10句的往上累加，最后读完了反而觉得自己理解不了了。这里有一个1993年针对小学生在折纸任务中的研究，其中就很好的探究了相关因素对认知负荷的影响²⁵：

第一个实验是测试将圆形纸片折成一个等腰三角形，在这个任务中他们给A/B两组分配了不同的认知材料：

组 A (图示组)：仅提供自解释的图示，配以极少量的箭头和单词。
组 B (冗余组)：相同的图示，但配上了完整的文字说明。

认知负荷实验-折纸

在测试阶段，图示组的表现显著优于冗余组。后续实验进一步证实了单纯使用图片的效果也远好于”图片+文字” or “纯文字” 。

由此可以总结——当图片已经足以说明问题时，额外的文字说明是否会变成干扰信号。

当然，该论文中的后续实验进一步说明了多余信息于理解任务上的逆向帮助。第一个关于此的实验是多视图的影响——其中一组学生只看正视图。而另一组学生除了正视图，还被要求查看折纸的背面图。结果显示无背面图的那一组在测试中完成任务的时间显著更短。

另一个实验则是区分了说明位置的不同，其中一组的说明书放在左边，纸片放在右边。学生必须在两者之间不断切换视线。另一组的指令（线条、箭头、序号）直接印在要折叠的纸片上。结果显示嵌入式组在习得阶段 or 测试阶段的表现都显著优于其他组

由此实验，我们几乎可以100%确定外在负荷是存在的，材料的呈现方式影响负荷程度。当图片已经能让大脑准确预测下一步动作时，额外的文字说明就变成了干扰信号。大脑不得不分心去处理文字，试图搞清楚“这段文字是不是在说别的？”，结果发现文字和图片说的是一回事。这种重复验证的过程产生了无谓的预测偏差处理成本。

当然，上述实验的对象是小学生，可能会被我们这些成年人所忽略。接下来让我们再看一个在解剖学在线教育中的研究案例。伊朗医科大学（IUMS）的一项针对104名基础医学学生的准实验研究，再次验证了这一物理逻辑²⁶。

研究者将学生分为干预组与对照组，在相同的Big Blue Button平台上进行消化系统解剖教学。干预组的教学材料严格遵循认知负荷理论进行优化。剔除了屏幕中不必要的颜色、线条、噪音以及与教学无关的额外内容。且同步调动听觉与视觉通道，避免呈现冗余的重复文本，利用图像配合口头讲解。数据分析显示，两组学生在干预前的学术投入度无显著差异。但在干预后，遵循认知负荷理论的组别在学术投入度评分显著提升。

由此可见，哪怕在复杂度极高的领域，降低外在负荷对学习材料依然存在着很大的帮助。通过优化呈现方式（如减少冗余、图文整合），我们可以消除那些与学习目标无关的预测偏差，让大脑将所有算力集中在构建核心模型上。

4.4降低内在负荷-分割复杂#

内在负荷涉及知识的本质复杂度，我们无法消除它。例如面对像 Python 的 For 循环这样复杂的概念，如果你试图一次性理解变量、序列、缩进和迭代逻辑，你的大脑会瞬间面临巨大的预测彻底失败——因为未知变量太多，导致旧模型完全失效，无法做出任何有效预测。所以我们需要的是先形成组块，后学习整体的逐步学习，先形成什么是迭代器后再来看什么是For循环，其对应的方法名为——分割材料。

一项来自2024年的论文研究了分割材料在英语教学中的影响²⁷。其中表示面对高负荷材料，最有效的武器是“分割”。研究发现将信息高度集中的 PPT（整合组）拆分成 10 页信息分散的 PPT（分割组），后者的学习效果显著更好。并且论文中分析了分割知识点的逻辑，认为分割是分开了知识点。这给了工作记忆一个分块记忆的机会，让大脑在完成当前单元时只需同时记忆较少信息。其次便是分割材料为小片段，在面对极其复杂的系统时，我们可以先学习单个符号的名称和特征，再学习它们的交互逻辑。这样就可以控制预测偏差的幅度。

接下来以学习 Python 的 for 循环为例，一种低效的分割方式是：先讲变量，再讲列表，再讲语法格式，最后再讲循环逻辑——看似分开了，但学习者在真正写代码时仍需要同时调用所有信息，预测难度对比先前来讲并未降低。

更合理的分割方式是以认知单元为界：

第一阶段（建立序列直觉）：只展示 print(1), print(2), print(3)，然后引入 for x in [1,2,3]。

预测目标： 让大脑建立“哦，这东西就是自动帮我数数”的简单模型。
负荷状态： 仅修正关于“重复”的预测偏差。

第二阶段（引入变量占位符）：演示 for x 和 for y 的效果一样。

预测目标： 更新模型——“原来名字不重要，它只是个代号”。
负荷状态： 仅修正关于“符号命名”的预测偏差。

第三阶段（语法与缩进）：最后讲解冒号和缩进规则。

1
for i in range(5):
2
    print(i)

预测目标： 精细化模型——“只有缩进的代码才会被循环”。

分割材料的本质，是避免让大脑同时面对过多的预测偏差。我们将一个巨大的偏差拆分成了多个小偏差。每一步，大脑只需要处理一小点意外，更新一点点模型。

4.5小结#

所谓“复杂”，不过是因为你的大脑缺乏对应的先验模型，导致预测彻底失效，工作记忆被海量的预测偏差淹没。我们要做的，就是通过优化呈现（降低外在负荷）来减少噪音干扰，通过拆解组块（降低内在负荷）来引导大脑逐步修正模型。当你能下意识的自然的预测出代码的下一行，或者数学题的下一步时，你就成功早就了一个复杂准确的预测模型。

Q: 国际象棋大师能记住复杂的棋局，但面对“随机摆放”的棋盘时表现却与新手无异，这证明了什么？

💡 提示：国际象棋大师实验

点击翻转

专家的优势不在于拥有更大的工作记忆容量（原生智力），而在于长期记忆中储存了大量的“组块”（即预先存在的预测模型）。

真实棋局：大师能调用模型进行预测，将多个棋子压缩为一个单元。
随机棋局：缺乏对应的先验模型，预测失效，导致记忆崩溃。

点击继续

Q: 在神经科学视角下，“组块”是如何降低大脑预测负担的？

点击翻转

组块将大量的不确定性压缩为一个简单的预测单元。通过调用组块，大脑不需要实时计算每一个细节（如每个汉字的顺序），只需预测整体模式（如一整句惯用语），从而极大地降低了算力需求。

点击继续

Q: “认知负荷”（烧脑感）主要由哪两个部分组成？请简述其来源。

💡 提示：总负荷 = ? + ?

点击翻转

外在负荷（噪音）：源自呈现方式（如排版混乱、冗余注释）。属于无效的预测偏差。
内在负荷（重构）：源自知识本身的复杂度（如新概念的理解）。属于构建新模型所必须经历的预测偏差。

点击继续

Q: 为什么在图片已经能清晰说明问题时，增加额外的文字说明反而会降低学习效果？

💡 提示：折纸实验/解剖学教学案例

点击翻转

这产生了外在负荷（冗余效应）。大脑被迫分心去处理文字，并反复验证文字与图片是否一致。这种无谓的“重复验证”过程浪费了宝贵的认知资源，干扰了核心模型的构建。

点击继续

Q: 面对本质上非常复杂、无法简化的知识（如编程中的循环逻辑），应采取什么策略来避免大脑过载？

💡 提示：针对高内在负荷

点击翻转

材料分割策略。将复杂的系统拆解为多个独立的认知单元（如先学变量，再学序列，最后学语法）。目的：控制预测偏差的幅度，避免让大脑同时面对过多的“意外”，确保每一步只修正一小部分模型。

点击继续

Q: 根据本章结论，从“新手”到“专家”的本质转变是什么？

点击翻转

从“预测不断失效”到“完美预测推演”的过程。专家通过构建精密的内部模型，在面对复杂任务时能将意外降到零，实现下意识的、自动化的精准预测。

点击继续

1 / 6

5.真正有效的学习路径：模仿与探索#

对于绝大多数学习场景，我们是幸运的。人类文明最伟大的成就之一，就是建立了庞大的“外部模型库”，让我们此刻只需直接调取。

这种便利恰好契合了我们在第三章得出的结论：大脑作为精明的能量管理者，在重构模型时总是遵循“最小阻力原则”。正是这种生物学上的“节能本能”，驱使我们首选模仿——这是一条阻力最小的捷径。然而，当我们置身于人类认知的最前沿，外部书本与导师往往给不出答案。此时，“捷径”中断，我们被迫踏上另一条截然不同的路径——探索。

5.1起点-发现错误#

在讨论两种学习之前，我们有必要在此讨论一下学习发生的前提。一个常见误解是：只要犯了错误，人就会学习。事实恰恰相反——绝大多数错误都会被大脑系统性忽略。早在3.4模型更新的条件中就有所提及，只有我们遇到主观上的巨大代价的预测误差时，我们才会开始学习。请注意一个词汇——主观，因人而异，且此因素会收到各种环境制约。因此如何注意到错误也值得一提。

当然，这并不被人们所重视，学校也从来不会教你这一点。多数学生在日常学习的过程中会被动的发现错误。例如我们学习数学的路径——先学加减乘除，然后学习更复杂的坐标系到微积分等。只要沿着这个路径走下去，你就会自然的不断发现错误，然后学习到新的知识。这条路径不需要我们主动的去发现错误，我们也会因为考试自然的重视起这些错误。

那么，学校之外呢？

一般来说，在没有“教学大纲”和“标准答案”的现实世界里，大脑不仅不会主动寻找错误，反而会启动一种被称为“确认偏误”的防御机制。当现实与我们的内部模型不符时，大脑倾向于扭曲感知来维护旧模型，而不是推翻它。例如，一个网球初学者可能会把球打飞归咎于“风太大”或“球拍不好”，而不是“我的击球动作模型有误”。这种机制保护了我们的自信，却阻断了学习。²⁸

除了会自动维护旧模型之外，现实的错误往往难以溯源。比如当今社会经常会出现结果延迟，今天做错，半年后才吃亏；因果链太长，大脑很难把误差归因到具体模型。此外也可能会由多个因导致了一个果，而我们很难抓住关键点，如关系变差、工作不顺、学习停滞——这些信号不像数学题那样给你明确答案。

为了应对这些问题，在这里给出一些简单的方法。

首先是面对确认偏误。在这里要明确的是，学界在1990年的研究发现确认偏误一般由于我们的情绪引起，当然会外加一点小小的阻塞（大脑倾向于懒惰）。那么应对方法就很简单了——保持一个“我可能错了”以及“吾爱吾师吾更爱真理”的信念。在下次面对错误的时候一方面可以减少情绪阻塞，因为你预知到自己可能错了，就不会有那么强烈的维护自尊心或者安全感的需求。另一侧则给我们提供了更强的探究真理的动机，让我们应对懒惰的大脑。²⁸

此外，我们要主动了解外界信息。主要是了解重要学科的重要结论，甚至主动深入了解某些学科的进展——它们往往正确，且颠覆认知。基本上每一条都能让你发现错误（正如本文的根基——大脑是个预测机器一样），了解这些结论后，你就能让你的预测模型覆盖大多数需要的场景了。

关于发现错误的方法，目前所拥有的研究似乎不是很多，因此文中只是简单的给出了两个方案，其中一个还是经验之谈。日后可能会有更多了解，到那时，再来更新关于发现错误的方法吧。

5.2模仿-最低成本的学习#

在99%的情况下，当你面对一个难题时，你并不是历史上的第一人。当你不知道为何苹果会落地时，牛顿已经为你准备好了公式；当你不知道如何烹饪时，菜谱已经为你验证了步骤。在这些时刻，大脑不需要去重新发明轮子，它只需要执行一种最高效的操作——模型迁移。

这在神经科学与进化心理学中被称为“社会化学习”。是指通过观察、模仿他人或从文化中获取知识，从而快速习得已有的技能和概念。这种机制被迈克尔·托马塞洛形象地称为“文化棘轮效应”——每一代人都不必从零开始试错，我们像棘轮一样锁定了前人的智慧，从而腾出精力去探索更高的领域。²⁹

社会化学习的神经机制得到了大量研究支持。科学家发现镜像神经元系统提供了模仿学习的神经基础：当我们观察他人执行某个动作时，大脑中与该动作相关的神经元会像自己执行时一样被激活。这种“脑内模拟”让我们无需亲身实践，就能在神经层面体验他人的行为，从而更容易复制。镜像神经元由意大利神经科学家里佐拉蒂等人在上世纪90年代首先发现，体现了大脑对他人经验的“共情性”再现功能。社会学习理论方面，心理学家阿尔伯特·班杜拉早在20世纪就提出人类可以通过观察他人而学习新的行为（著名的波波玩偶实验即验证了儿童通过观察模仿攻击行为）。班杜拉的观察学习理论强调，在许多情况下学习并不需要直接奖励或惩罚，榜样的示范就足以让观察者习得行为。³⁰³¹

社会化学习的一般步骤包括：

认为旧模型是错的（已在5.1讨论），找到可能的新模型理论
学习新理论，快速消除大量结构性误差
通过反馈精细修正习得新模型的残余误差
在时间与睡眠中固化稳定新模型

此外，需要注意的是，在此步骤中找到的新理论如果过于复杂。请回看第四章节——此时我们需要将复杂的知识分割成简单的知识，就像你一个学期的内容总会被分成一周一周的，然后一轮又一轮循序渐进的学习。最终就能掌握新理论了。

此时的步骤大概是：

认为旧模型是错的（已在5.1讨论），找到可能的新模型理论
学习新理论区块1，快速消除大量结构性误差
通过反馈精细修正习得新模型的残余误差
在时间与睡眠中固化稳定新模型
学习新理论区块2，快速消除大量结构性误差
通过反馈精细修正习得新模型的残余误差
在时间与睡眠中固化稳定新模型
学习新理论区块3
……

接下来，我们会逐步讨论如何高效的进行社会化学习。

5.3寻找可信新理论的方式#

学生不需要找到新理论，只需要看教科书就好了。

其实很简单，并且所有人都知道这个方法，那就是找论文。在这里我们简单的给信息源的可信度排个序：

信息源	注意
系统综述 / 元分析/学界指南	看方法是否严谨、纳入研究质量
高质量同行评审 + 可复现数据代码	看设计、功效、可复核性
标准教材 / Handbooks	更新慢；前沿不一定覆盖
预印本 / 技术报告	当线索，不当定论
严肃媒体/科普/讲座	必须追溯原始来源
社交媒体/转述	默认不可信，需核验

一般来说，书籍、高质量论文、系统性论文元分析、学界指南是最为靠谱的一类，往下的信息源基本上不必再看。

比如你要研究“间歇性禁食是否有用”，先搜 “Intermittent fasting meta-analysis”（间歇性禁食元分析）。看综述怎么说，这能帮你避免被个别极端的实验误导。然后再去搜索相关的高引用论文，或者是否有成体系的书籍（书内一定要有大量引用论文，而不是作者在侃侃而谈）。

当然，我也无意在这里否定全部的科普创作者。有些创作者确实做到了高可信度更新，如真理元素——最典型的特征是他们会在文末/简介或者视频结尾附上论文引用。这大大的增加了其作品的可信度，多数时候还包括他们自己做的统计学分析。

还需要注意的一点是，不同领域“可靠性最高的来源”略有差别，例如：

数学/逻辑：同行评审论文 + 形式化证明
医学/公共卫生：系统综述/指南通常高于单篇论文
经济/社会科学/心理学：识别策略、可复现性、外部有效性特别关键（心理学有一个著名的复现性危机，即学界发现部分心理学实验无法复现）
工程/计算机：可复现实验、标准、基准测试、开源实现非常重要
伪科学：别信！若有人说占星术能预言未来，那一定只是想赚你的钱。

5.4模仿-快速消除大量误差#

当你成功的找到了要学习的新理论，你应该做什么？一般来说我们都能在短时间内把一个合适负荷的概念成功掌握，除了还存在少量细节上的瑕疵。本小节关注的就是我们如何最快速的掌握一个理论模型的大概内容，从而获得一定程度的运用能力。

5.4.1看见信息#

如果连看见都没看见，就更别提学习了。所以说看见信息是我们一切学习的前提。你可能觉得这句话就是废话，实则不然。让我们做一个实验——这里有一个视频，请观看这个视频，你的任务是数穿白衣服的人传了几次球。

https://www.youtube.com/watch?v=6E035QRzHbc

相信你看完视频后，会对“看见信息”有全新的理解这是一个非常著名的心理学实验。据统计，往往有超过50%的人会忽略画面中极其明显、甚至“离谱到不该错过”的东西。原因不在于眼睛没接收到，而在于大脑从一开始就把“无关信息”判成了噪音——你的任务是数传球次数，于是大脑会把资源几乎全部押注在“白衣服—球—传递”这条线索上，其他东西哪怕再显眼，也可能被当场过滤掉。在2013年，更有实验人员进一步研究了这个现象，这次请来的是24位放射科医生，研究人员让他们完成一项熟悉的肺结节检测任务。研究人员在最后一个案例中，插入了一只比普通肺结节大48倍的猩猩。结果显示，83%的放射科医生没有看到这只猩猩。眼动追踪数据显示，大多数错过猩猩的医生都直接注视着它所在的位置。因此，即使是经验丰富的专家级检查员，在其专业领域内也可能受到无意视盲的影响。³²

这件事和学习直接相关：课堂上、书本里、网课里，真正决定你学不学得进的，往往不是材料有没有给到，而是你是否把有限的注意力资源投在了“会引发模型更新的信息”上。前一章我们把认知负荷拆成“外在噪音”和“内在建模”，而注意力就是那个开关：开错了，外在噪音会占满工作记忆；开对了，你才有空间处理真正的预测误差。换句话说——注意力决定你在拿什么东西更新大脑的模型。满脑子都是今天中午吃什么的学生是不可能在课堂里学习的。更准确地说，“看见信息”依赖注意力系统的三个功能成分：警觉、定向与执行控制。它们分别回答三个问题：什么时候需要集中注意（when）、应该注意什么（what）、以及如何处理所关注的信息（how）。

警觉指的是大脑维持基础唤醒水平、对“可能出现重要信息”保持准备的能力。它决定了你是否有足够的神经资源进入学习状态。老师在课堂上也会经常的诱发你的“警觉”系统去运作，最常见的情形就是“接下来讲重点了，各位好好听”。警觉不足时，你的大脑更像在“低功耗模式”运行——工作记忆窗口更窄，执行控制更弱，任何稍微复杂一点的材料都会被你主观体验为“好累、好烦、好难”，俗称不放在心上。警觉和生理信号的关系更大，尤其在涉及生死的时候会最大程度激发。由此我们发现电子游戏在这方面的潜力。另外，你也可以主动给大脑提示，固定的学习姿势，或者学习时主动戴上耳机。就像部分人会专门为了学习调整状态一样，这是在告诉大脑现在要进入高警觉任务。

定向是在警觉之后，把注意力指向某个位置、某个特征、某条线索的能力。你在视频实验里错过“明显信息”，本质上就是定向被任务劫持：你只对“球的轨迹与传球动作”定向，其余统统降权。这种形式的注意放大了被选择的信号，也在很大程度上缩小了那些被认为不相关的信号。在学习中，这种定向失败相当常见。比如学生只盯着加粗、标红、老师语气提高的句子，但这些未必是这堂课真正对你有启发的重点。以及可能心不在焉的注意外部消息，如弹窗、消息、同学说话、甚至页面里不必要的高亮和花哨排版，如此也更体现了学习环境的重要性。加上如今唯分数论的情景，学生也更可能定向到“结果”而非“关系，学数学只盯答案，学编程只抄代码，学概念只背定义——我们不能说这种定向毫无效果，只是偏离了我们最初要学的东西。就像一个扫地机器人最终学会了放下垃圾又拿起来一样。

执行控制负责在冲突中做选择：抑制分心、抑制即时奖励、在多个候选线索里坚持任务目标（可能存在多个定向的目标，若不控制则会切换）。它是“我知道应该看哪，但就是做不到”的那部分。这也是为什么很多人把学习失败归因于“我不够自律”，但更准确的说法是：执行控制是有限资源，它会被噪音、疲劳、多任务、情绪消耗迅速榨干。一旦执行控制掉线，你的定向会被环境里最强的刺激牵走，你会回到最省力的模式：刷短视频、重读同一段、抄答案。此时最好彻底的休息一下，进行彻底的休息，比如站起来走一走，这样能让你的执行控制但愿回复其能力，让你再一次的全身心投入学习之中（你可能觉得这是无效的，但是较新的研究印证了人每天的注意力用完了是可以通过暴露在自然环境等方式恢复的，不过休息的时候刷手机是肯定恢复不了的。）。³³

总结便是，全神贯注的注意你真正要学的东西，并且避免干扰。

5.4.2深度加工#

当你想学习如何骑车的时候，你会做什么？买一辆车，然后上去骑车对吧。而不是在一旁看着别人骑车，然后期望自己能通过看别人骑车而学会骑车。否则过几天后，买车的人已经可以摆脱辅助轮了，而看着别人骑车的人只会产生一种我上我也行的错觉。为什么两者的学习效果差距如此之大？

仔细对比，我们会发现两类人的差距在于大脑的模式。当你只是看别人骑车时，你的大脑处于“输入模式”。你接收感官数据，大脑只需解释“我看到了什么”，比如坐上车，然后开始蹬就好了。这里的预测误差趋近于0，自然不会修正任何模型，因为这个现象的阐述过于简单。但当你自己握住车把时，大脑必须生成更多违反旧知识的预测，“如果我用我想象中的力向左转车把，自行车会倒下。因此我要调整我的力气”，我们发现如果比对失败（预测误差），大脑必须立刻修正运动模型。

这个简单的例子凸显了深度加工在学习中的作用。当我们主动投入学习，大脑的相关区域会被全面调动起来。心理学家Neal Cohen等人在一项研究中让受试者记忆屏幕上一系列物体的位置：一组可以主动控制浏览顺序，另一组被动观看相同过程。结果主动探索组在事后测验中记忆表现远胜被动组。功能磁共振成像显示，主动学习者的大脑中海马体等记忆相关结构活动更强，并与前额叶、顶叶等多个区域呈现更高的功能连结同步。相反，被动接受信息时，大脑只是局部零散地被动响应。因此，在学习中摆脱纯粹的被动灌输，尝试自己提出问题、操作实验、组织知识，大脑才能更有效的修正模型。³⁴

多项学校教学研究方面的证据也验证了深度加工的作用。有一篇结合了两百多篇本科STEM（数理）课程教学回顾的研究支持了以上结论。传统教学方法，即老师讲课，而学生被动地听课，是低效的。10与那些促使学生主动参与的教学方法相比，这种传统讲课方式教出来的学生的学业表现较差。³⁵

那么具体到日常学习知识时，我们就要主动的去思考这节课所学习到的知识点，对知识进行加工；或者和课堂的同学一起讨论该理论；又或者自己去做一些实验去验证该现象。上网课的同学可以在知识点讲解后点一个暂停，自己复现一下知识的推倒过程。总之，一切能让你不再被动地坐着听讲的方式都是好的。

不过在此处我们也有必要纠正一个教学方式的问题，这个教学理念相当古老了，但多数教师沿用至今。即卢梭在《爱弥儿》中写道：“我可以在这里阐述一下教育过程中最重要、最有用的原则吗？那就是不要想着节省时间，而是去‘浪费’它。”对卢梭和他的后继者来说，即使这一探索过程需要浪费几小时的时间也是值得的，让孩子自行去发现并建立自己的知识结构是最好的学习方式。然而深度加工的含义指的是让学生参与对学习材料的思考，调动该调动的脑区，这就够了。而不是让学生从零开始构建——这几乎毫无意义，我们怎么能认为学生能在没有外力引导的情况下，在短短几小时内就重新发现人类花了几个世纪才理解的规则？

如今的教育方法已经改成了设计出一系列合理且层层递进的学习活动，其目的就是在学生自己动手实践之前，先由老师仔细演示给学生看。在直接教学法和有启发性的教学材料的指引下，倘若学生能主动地、快乐地、自主地参与到学习过程中，那么学习就会很有成效。而这一点已经被反复验证了。可惜的是，因应用这种教学方法需要耗费大量的精力，至今还未有很多学校将其运用。²

5.5模仿-精细修正残余误差#

快速消除大量误差之后，我们就需要改正那些反复阅读也体会不到的小误差了。——是的，反复阅读终归会忽略一些东西，忽略的东西可能会体现在考试成绩里。

5.5.1测试-错误反馈#

当我们已经大概掌握了该理论后，所需要的就是测试了。在这之前我们无数次提到大脑是预测机器，通过预测误差来更正模型，因此去尝试无数的问题，大脑会将犯下的错误一一记录，从而在下次面对问题是改进。同样的错误越犯，再犯的概率就越小。这种错误反馈可以让我们对学到的知识进行微调，让我们识别到最细小的那些理解区别。

那么如何让你给出回应，主动提出假设，不管你对自己的想法有多么的不确定。其次，你必须马上得到客观的反馈，使你能够改正自己的错误。答案显而易见，就是测试。如今已经有太多的学术文件证明了测试用于学习的有效性，甚至定期测试——该策略已经成为最有效的教育策略之一。定期测试可以使长期学习的效果最大化，可以增强你的记忆。测试直接体现了主动参与和错误反馈原则。因为参加测试会迫使你直面现实，去巩固你所知道的知识，并且认识到哪些知识是你还不知道的。²

然而大多数人意识不到测试于学习的帮助，仅仅把它当作一场终极考试。——当然，他们大概率也不会关注考试的结果，只会关注考试的分数，这会导致测试的错误反馈无处发生。重要的不是你得到的最终成绩，而是你为获取信息所付出的努力以及你得到的即时反馈。从这个方面来说，研究表明，测试的作用至少和课程本身一样重要。

同样我们可以得出结论，即没有错误反馈的学习方式是无效的。可惜的是大多数学生都认为他们学得越多，就应该学得越好。所以大多数学生自发地把大把时间花在课堂笔记和课本上，用不同颜色的荧光笔来标出每一行的重点……然而，这些策略的效果其实都比不上做一个简单的测试。那这背后的原理是什么呢？因为我们无法区分记忆的不同部分。在刚刚看完课本或课堂笔记后，信息立即在我们的脑海中呈现。它以一种活跃的形式存在于我们有意识的工作记忆中。让我们误以为我们掌握了一切。

5.5.2穿插测试#

关于测试，不得不提到的另一点就是在测试中穿插不同类型的题目，会让测试更加有效。我们暂且把测试分为两种，一种是我们常见的课堂小测，称其为集中测试——一般而言也只会测试本堂课所学习的内容。另一种则是我们的期中，期末考试——此时的范围就广的多，大脑需要在不同的预测模型之间来回切换，选择正确的模型进行解题——我们称为穿插测试。

长久以来，人们都误以为集中测试的效果更好，确实有实验证明了这一点，短期内集中测试的效果极佳。但是他们往往忽略了对材料的长期记忆效果，一周以后再进行测试，穿插测试的效果完胜集中测试。

这里有一个小例子。教两组大学生计算4种少见的几何体的体积（楔体、椭球体、锥球体及半椎体），然后让他们解练习题。一组学生的题目按照问题类型区分（先解四道计算楔体体积的题，再解四道计算椭球体体积的题，以此类推）。另一组学生解同样的练习题，只是题目的类型是混合的（穿插安排的），而不是将同一类型的题放在一起。在练习中，按统一类型解题的学生（也就是集中练习的学生）的平均正确率为89%，而按混合类型解题的学生，正确率只有60%。但是在一周后的最终测验上，之前练习统一类型解题的学生的平均正确率只有20%，而进行穿插练习的学生的平均正确率为63%。把问题的不同类型混搭起来，虽说在最初的学习阶段有所阻碍，但这种方法让最终测验成绩提高了惊人的215%。³⁶³⁷

以防误解，这里给出几个穿插测试的例子。——穿插测试不是让你在两个毫不相干的任务间来回切换，一会背单词一会做数学是无效的。

示例	具体说明
数学综合练习	题目交错出现一元二次方程、函数单调性、三角函数与导数问题，学生需先判断使用哪种解题模型
物理力学练习	题目混合牛顿定律、能量守恒与动量守恒问题，要求学生区分不同物理模型后再求解
（反例）单一题型重复练习	连续多道同一类型题目（如连续20道二次函数计算），仅改变数值不改变解题模型
（反例）无关任务交替	数学题与英语单词背诵交替进行，频繁在无关任务间切换，未训练模型识别能力

5.5.3测试不需要分数#

训练神经网络（大语言模型）的时候，我们会利用反向传播算法告诉模型它哪里错了，需要如何改进参数。而不是惩罚神经网络，扣掉一个神经元，这样对训练神经网络没有任何帮助。我们可以把同样的情形类比到小测上——去思考你的分数很糟糕不会对你有任何的帮助，仔细去看自己错在哪里了，应该如何调整自己的预测模型才是关键。

学校经常用分数作为惩罚，以至于我们很难想象不重视分数的学校。然而分数提供的反馈往往又是那么不精确，提供的打击倒是非常精确。糟糕的分数会对学生脑中的情感系统产生巨大的负面影响：沮丧、耻辱、无助……这些反过来让学生更加抵触学习，不仅是心情上的，压力更会影响到实际的学习能力中——实验证明它会阻碍神经元的可塑性。

所以如何看待错误，也是我们学习的关键因素。调整好心态，运用科学的方法，相信自己……虽然老生常谈，但依然重要，不得不提。

5.6模仿-巩固#

短期内，我们记住了该理论，但是我们一定会逐渐的遗忘。所以要想记得长久，日后一定要反复调取它。

5.6.1关于记忆遗忘曲线#

上述内容，无论是注意信息，还是深度加工，或者是错误反馈，都是如何在当时修正我们的预测偏误，而科学家研究发现，想要真正的长久的记住一个东西，我们最需要的是间隔复习。此处最常被提起的就是艾宾浩斯，他通过反复自测记忆曲线，发现了著名的“间隔效应”：相比于一次性集中学习，在更长时间跨度内多次复习，记忆保持显著更好，它还总结出了一条记忆遗忘曲线。这个曲线还被吹捧了多年，至今仍能听见许多人谈论它。

记忆遗忘曲线

不过并不是说艾宾浩斯发现的东西是错误的，只是它的实验并不严谨。这里要进行的是对曲线进行一定程度的修正。先让我们看看原始的实验：

1885年赫尔曼·艾宾浩斯是拿自己做实验，且为了排除既有知识的干扰，发明了“无意义音节”（如 DAX, BOK, YAT）。然后开展了测试。

我想各位都能看出其中的问题——人类记忆通常是语义记忆，涉及理解和关联。你记忆“相对论公式”的效率，绝对高于记忆一串乱码。因此，该曲线反映的是机械记忆的底线。后世（互联网出现之后）的大量重复实验确实证明了曲线的趋势大致是存在的，但是并没有记忆曲线那样的遗忘速度。

如2005年开展的一项基于互联网的大规模研究，研究人员调查了人们对于过去发生的新闻的记忆程度。结果发现对于有意义，且情感冲击力度大的新闻往往没那么容易忘记。就像911事件——多数人听过一到两次后便不会再忘。³⁸

后续有人继续进行实验，改进了记忆曲线的算法。Piotr Wozniak 在1980年代开发了 SM-2 算法——于绝大多数现代学习者，只要稍微引入一点“主动回忆”，遗忘速度就会大幅减缓。Anki 等软件背后的算法也是它（SM-2 算法）。如今它已经进化到了SM-17。其算法的本质大概主张我们不需要每天复习，只需要在遗忘的临界点进行干预。通过算法计算出每一个知识点的最佳复习间隔，可以实现记忆效率的最优。

https://www.supermemo.com/en/supermemo-method

5.6.2主动检索#

明确了我们要进行间隔复习后，我们还需要在复习的时候注意一点——主动检索。也就是时常回想你学到的知识，而不是回看。

一种常见情境是，学生花数小时反复阅读教材，却不如花较短时间自测回忆效果好。这其实也被做过科学的实验，名为“测试效应”：将部分学习时间用于回忆信息，而非一味输入，能够显著增强长期记忆。Karpicke 和 Roediger 的经典实验曾经比较了不同学习策略的效果：当单词已经记住一次后，继续重复学习并不能提高一周后的保留率，而多进行几次自我测验（即尝试回忆单词）却让记忆表现有了 150%以上的提升！换言之，一旦信息已经可从记忆中提取出来，重复阅读并不会带来额外好处，而反复尝试从记忆中检索却能让记忆大幅强化。³⁹

这一发现与我们的直觉相反：很多人在复习的时候宁愿反复看笔记，也不愿测验自己，因为前者感觉更熟悉轻松，后者则吃力且容易暴露遗忘。但正是这种主动检索的过程刺激了大脑更深层的加工——我们得努力搜索脑中的相关联结，调动线索将信息重建出来，相当于主动重走一遍记忆的线索路径。当我们成功回忆时，这条路径就被再次加固；即使一时想不起来，通过对照答案获得纠正，也能形成对比鲜明的记忆痕迹，避免下次再犯。同样的时间，纯阅读只能被动强化已有痕迹。所以，在学习中善用小测验、闪卡、自问自答等方式不断检索所学内容，是我们巩固模型的核心点。

省流：不要直接看答案，用闪卡或者测试等工具复习的时候记得主动检索。

5.6.3睡眠#

我想，大多数人都不重视睡眠的重要性。而近年来的科学研究发现——睡眠并不是一段不活动的时期，也不仅仅是在清理白天脑累积的废物。恰恰相反，在我们睡觉时，脑仍然在活跃，它按照一种特定的算法运行，重演它在前一天记录的重要事件，并将它们转移到我们记忆中储存起来。

此处又可以关联回我们对记忆曲线的研究。在1924年，两位研究人员重新研究了艾宾浩斯的记忆曲线，然后发现了一个异常现象：在学习新知识后的8～14小时内，人们没有出现记忆丧失。回看艾宾浩斯的实验，研究人员注意到8小时是一天内的8小时，即人没有在这个时间内睡觉，然而14小时是第二天进行的测试。为了区分睡眠这个变量，他们进行了一个全新的测试。他们在午夜前后、睡前或早上随机教学生一些音节。结果很明显：根据艾宾浩斯的遗忘曲线，我们在早上学到的知识会随着时间流逝而消失，而在午夜学到的知识会随着时间的推移而保持稳定（前提是学生至少有2小时的睡眠）。换句话说，睡眠可以防止遗忘。⁴⁰

这一发现在后续的神经科学研究中也得到了验证，两位研究人员发现当大鼠睡着时，海马中的位置细胞又开始以同样的顺序放电。这些神经元在追溯大鼠白天走过的轨迹。二者唯一的区别是，在睡眠中的神经元放电速度较实际的速度加快了近20倍，大脑会快速的模拟白天所探索过的轨迹。这确实可以印证上述对艾宾浩斯记忆曲线修正的发现——睡眠的时候确实在巩固我们的记忆。⁴¹

大鼠睡眠

然而科学家对睡眠的研究不止于此。另一项实验说明了我们可能还在睡眠的过程中进行一定的思维活动，这些研究者在白天教受试者学习一种复杂的算法，而这个算法其实有一个隐藏的可以大幅度缩短计算时间的捷径。在睡觉之前，只有极少数受试者知道这一点。然而，睡眠过后，发现捷径的受试者人数翻了一倍，而那些睡不着觉的受试者则从未有这样灵光一闪的时刻。此外，无论受试者在一天当中什么时间接受测试，结果都是一样的。——说明这确实是睡眠的功劳。⁴²

想必睡眠的重要性无需被再次强调，我们基本可以确实睡眠作为一种效果极佳的记忆手段被我们忽视了多年。不幸的是，至今多数学生以及成人都无法睡得一个好觉。这可能来自学校或者工作上课业的压力，可能来自互联网短视频的刺激，也可能来自酒精的影响。

总之，好好睡觉吧，这是你拥有的最高效的记忆巩固手段了。

5.7模仿-小结#

本章把“学习”重新定义为一件更工程化的事：不断优化内部模型。先能发现错误，再以模仿迁移正确结构；用注意力与深度加工提高理解效率；用测试、交错与反馈完成精修；最后用间隔检索与睡眠完成固化。我们十分幸运地身处人类文明的积淀之中，绝大多数时候，我们无需从零开始“重新发明轮子”，而是可以通过社会化学习（模仿），高效地迁移前人的智慧。

Q: 为什么仅仅“犯错”并不足以触发学习？在没有外部标准（如考试）的现实世界中，大脑通常如何处理错误？

💡 提示：学习发生的前提

点击翻转

前提：必须产生主观上代价巨大的预测误差。
大脑机制：默认启动“确认偏误” (Confirmation Bias)，通过扭曲感知（如怪罪环境）来维护旧模型，而非修正它。
对策：保持“我可能错了”的信念，并主动寻找反直觉的高质量信息。

点击继续

Q: 为什么说“模仿”（社会化学习）是成本最低的学习路径？其神经基础是什么？

💡 提示：最高效的学习策略

点击翻转

策略：通过模型迁移直接调用前人智慧（“文化棘轮效应”），避免从零试错。
神经基础：镜像神经元系统。它允许大脑在观察他人行为时进行“脑内模拟”，实现共情性再现。

点击继续

Q: 在“看见信息”这一步，为什么单纯的感官接收不等于学习？（参考大猩猩实验）

💡 提示：注意力的作用

点击翻转

学习依赖于注意力的分配。大脑会根据当前任务（定向）将无关信息过滤为噪音。如果注意力未聚焦于“引发模型更新的信息”上，外在感官输入再强也会被无意视盲 (Inattentional Blindness) 忽略。

点击继续

Q: 为什么“主动探索”（如自己骑车、自己推导公式）的学习效果远优于“被动灌输”？请用神经科学解释。

💡 提示：主动 vs 被动

点击翻转

被动模式：大脑仅解释“看到了什么”，预测误差趋近于零，模型不更新。
主动模式：大脑必须不断生成预测并与反馈比对（深度加工）。这会全面调动海马体与前额叶，在不断修正预测误差的过程中重构神经回路。

点击继续

Q: 为什么“测试”（Testing）是比反复阅读更有效的学习手段？

💡 提示：测试的本质

点击翻转

测试提供了错误反馈 (Error Feedback)。它迫使大脑直面预测误差，识别细微的认知漏洞。

关键策略：穿插测试 (Interleaving)。混合不同类型的题目（而非集中练习同类题），强迫大脑训练“模型识别与切换”的能力。

点击继续

Q: “间隔复习”与“主动检索”分别如何优化记忆巩固？

💡 提示：关于复习

点击翻转

间隔复习：利用间隔效应，在遗忘临界点进行干预（如 SM-2 算法），避免机械重复。
主动检索 (Active Recall)：提取信息的过程比输入更关键。回忆过程重建并加固了神经路径（测试效应），而反复阅读只是被动强化已有痕迹。

点击继续

Q: 睡眠在学习过程中扮演了哪两个关键角色？

💡 提示：睡眠的作用

点击翻转

记忆巩固：海马体以20倍速重演白天的神经活动，将短期记忆固化为长期结构。
思维重组：在潜意识中寻找捷径和规律（如数学算法实验中，睡眠者发现捷径的比例翻倍）。

点击继续

1 / 7

5.8探索#

在1%的情况下，你面对的问题确实是历史上的第一人。当爱因斯坦发现牛顿力学无法解释光速恒定时，他没有任何教科书可供参考。

注：确实没有找到太多关于“如何探索”的文献，故本章节并不可靠，仅仅基于科学哲学和逻辑学简单阐述了一下探索新理论必要的步骤。

此时，大脑被迫切换到高耗能的探索模式。你不再有可复制的知识去应对场景。你需要调动海马体中的记忆碎片，在前额叶的指挥下，像拼图一样尝试构建新的解释框架。你提出一个假设，现实反馈给你一个耳光；你再修补假设，再次遭遇挫败。科学家发现真理前的长久焦虑，本质上是大脑在忍受极高的预测误差，试图凭空构建一个从未存在过的模型。

生成式构建的一般步骤：

旧模型失效。
搜索与试错：
- 提出假设 A -> 验证 -> 失败（误差仍大） -> 抛弃
- 提出假设 B -> 验证 -> 失败（误差仍大） -> 抛弃
- 提出假设 C -> 验证 -> 成功（误差骤降） -> 选中
巩固稳定新模型

不要把探索想得太高大尚，这不仅是科学的前沿，心灵的秘境，很多时候还是民科产生的地方。多数人并不遵循一定的方法进行研究，从而总是得出错误的结果，这些错误的模型相当的有市场，然而总会在某些时候崩溃。所以探索并不是像个神棍一样，打个坐就瞬间悟道了一样。即使是天才的灵光一闪，背后也遵循着严密的认知逻辑。

5.9探索-溯因与多维验证#

在模仿模式中，我们直接复制别人的答案。而在探索模式中，我们必须自己去猜测原理，从而在多个可能的原理中确定一条最可符合当下情形的。探索事物极其艰难，但好在多数人在一生中都不必进行复杂探索。

5.9.1溯因推理#

当误差出现，我们就需要有与之相应的新理论来解释其误差。这个新的理论不是随意提出的，新理论来自严密的逻辑思维活动——溯因推理。简单来说，溯因推理的逻辑方向是从“结果”回推“原因”。我们观察到一个现象，然后根据已有的知识，推测出最可能导致这个现象的原因。它是一种合理的猜测。

例如天文学家发现天王星的运行轨道有些异常，不符合牛顿力学的计算预期。然后根据现有理论计算，如果有一颗未知的行星在附近，它的引力会干扰天王星的轨道。此时的科学家们做了一个溯因推理——在天王星的外侧，一定存在另一颗未知的行星在拉扯它。后来科学家根据这个假设去观测，果然发现了海王星。

换作形式一点的语言就是：

\text{观察到现象 D} + \text{规则} (H \rightarrow D) \rightarrow \text{结论} (H \text{可能是真的})

当然，我们能推出的是H可能是真的，而不是一定是真的，因此溯因推理常常面临失败的情况。让我们把目光转向另一个天文学场景：

19 世纪末，天文学家对水星轨道进行了长期、重复、严密的观测，结果出现了一个极其微小但稳定的误差：水星近日点进动每世纪多出 43 角秒。这个数字虽小但致命。小到它像“误差项”；致命到它在长期观测中反复出现，且无法通过粗糙解释抹掉——它的精度太高了，这个误差有权挑战当时的牛顿引力模型。

于是最自然的策略是（溯因A）：在不动核心生成机制的前提下，补一个隐藏变量，让误差在旧框架内“重新变得合理”。这就是当时许多人提出“祝融星”的原因：假设水星内侧还有一颗未发现的行星，它的引力扰动导致了那 43 角秒。

然后科学家们开始检验，那它应该在哪？什么时候能看到？望远镜对准那里，结果空无一物。一次也许是偶然，多次就不再是偶然。——此时就需要第二条，第三条乃至更多的理论。

此时，另一位科学家登场了。他开始设想是不是我们之前忽略了什么变量，导致我们现有的理论本身就不准确？据此他提出了广义相对论，在这个框架下同样可以很好的解释为何水星会偏移。然后之后的结果想必大家都知道了，爱因斯坦的相对论取得了胜利。祝融星的假设不断的被推翻，我们一直没有观测到这样的一颗行星存在，而相对论预言的光线有1.75 角秒的角度偏差在1919 年被爱丁顿爵士所验证。

5.9.2验证推理#

在溯因推理中我们讲述了一个关于物理学的案例，当然，它还不够完善。广义相对论能在当时占据物理学的主流不仅因为它精确的解释了这几个小现象，它还同时解决了更多物理现象。我们要在本小节探讨的正是我们需要什么样的验证方式，才能为一个理论提供相当可靠的支持。科学的验证方式，还可以分为三类：

数学/计算机科学/逻辑学（抽象世界）

通常教科书上的数学证明其实是“非形式化”的，它依赖人类的自然语言和直觉。比如经常出现显而易见，同理可得。但是一旦到了学界，我们对其内容的证明就需要转化为纯粹的符号运算。上过高数的同学应该都清楚ε-δ证明，这就是最严谨的极限定义。

\forall \epsilon > 0, \exists \delta > 0, \forall x \in D, \big( 0 < |x - c| < \delta \implies |f(x) - L| < \epsilon \big)

比如你要证明一个显而易见的事实：

\lim_{x\to 2}(3x-5)=1

你就需要写：

$\text{Let } \forall \epsilon > 0 \text{ be given.}$

$\text{Choose } \delta := \frac{\epsilon}{3}.$

$(\because \epsilon > 0 \implies \delta > 0)$

$\text{Let } x \text{ satisfy the condition: } 0 < |x - 2| < \delta.$

$\text{Then implies:}$

$\begin{aligned} |x - 2| &< \frac{\epsilon}{3} && (\text{Substitute } \delta) \\ \implies 3|x - 2| &< \epsilon && (\text{Multiply by } 3) \\ \implies |3(x - 2)| &< \epsilon && (|a||b| = |ab|) \\ \implies |3x - 6| &< \epsilon && (\text{Distribute}) \\ \implies |(3x - 5) - 1| &< \epsilon && (\text{Rewrite term}) \end{aligned}$

$\therefore 0 < |x - 2| < \delta \implies |(3x - 5) - 1| < \epsilon$

$\text{Q.E.D.}$

这个例子让我们一览为了严谨这类学科能有多复杂，不过相对来说没有那么好理解。下面还有个例子，更让我们感觉到抽象世界的研究者对严谨性的追求：这是关于四色定理（地图只需4种颜色）的证明，其曾在1976年因依赖计算机暴力穷举而备受数学家质疑（怕程序有Bug）。后来，微软研究院的Gonthier在2005年用Coq语言将整个证明完全形式化，每一行代码都经过了逻辑内核的验证，从此才成为一个事实。

物理学/化学/生物学（经验世界）

和抽象世界不同，因为测量永远伴随误差、噪声、仪器偏差、也可能是理论错误，所以经验科学很少谈“证明”，更多谈“支持”“证伪”“置信度提升”。那么如何确定一个实验的可信度呢？它必然是具备可重复性的。既不同团队、不同仪器、不同地点/条件下得到相同（或统计一致）的结果。因此，在这些学科中发论文都得记录详细的实验方法。

比如在生物医学里，一个经典且直观的例子是 “幽门螺杆菌导致胃炎与消化性溃疡” 的确立过程。在 20 世纪中期，主流观点长期认为溃疡主要来自“压力过大、胃酸过强、饮食刺激”等因素；当时的理论可以解释一些现象，但它很难给出可被反复检验的、稳定的因果链条。后来，研究者在大量患者的胃黏膜活检中反复观察到幽门螺杆菌，并提出：细菌感染是胃炎与溃疡的重要原因。这仍然只是“相关性线索”，并不足以让理论站住脚。

后续来自不同医院、不同国家、不同实验室用各自的取样与培养/染色流程，都能在相当比例的胃炎/溃疡患者中检测到该细菌。该现象成为可重复的稳定事实。然后我们根据理论检验——如果细菌是原因，那么清除细菌应当显著降低复发率。随后大量临床试验表明：与单纯抑酸治疗相比，“抗生素根除疗法 + 抑酸药” 能更稳定地治愈并显著减少溃疡复发。最终，我们才确立了这一点。

历史学/经济学/心理学/医学（复杂系统）

这几个领域因为是复杂系统（变量多、难以隔离、可控性弱、伦理限制强），就基本上难以做到高精度的实验了。

先说比较容易做实验的——心理学和医学。如今最有实证意义的方法一般是随机对照试验，比如你需要设计安慰剂的对照组，并且随机分布受试者，并且受试者的样本量要足够等。但现实中很难做到这一点，所以心理学和医学也经常面对复现失败的危机。甚至心理学在2015年面临着一次大规模的复现危机，很多旧的实验都无法复现。

另外就是无法做实验的——历史学和经济学。为了做研究，你总不能控制历史或者国家经济做实验吧，并且对照组也难以设置。至此，两个学派中发明了一个“比较法”——即寻找类似的历史片段或者经济情况，然后对此做出分析。比如在研究“最低工资会增加失业率吗？”的问题中，研究人员就采取了两个类似的地方，一个提高了最低工资，一个没有。然后追踪两地的某些经济指标，从而得出结论：最低公司不会影响就业显著下降。

情况大概就是这样，有些学科自身的属性就决定了它本身难以开展实验，也决定了它经常被贴上伪科学的标签。当然，这些年这些学科也为了科学严谨化不断的发展，于是以下这些学科就出现了：

比如生物物理学、医学物理学、流行病学、计算神经科学、计量经济学。这些都是比较切实的学科，他们给自己带上了一个物理学或者神经科学的标签，理论上也确实意味着他们更加可靠。

5.10无效探索的兴起#

在我们理清”探索“的过程之后，我们就该将目光转移到现代舆论场了。本小节想说明的是，不要做无效探索，不要在对一个理论了解不全面的时候就肆意的进行溯因推理，且不检验。这么说的原因是现代互联网上已经开始弥漫多数离谱言论了。可能是因为科学概念往往存在滞后性——即一个理论在物理学界已经被修正或限定边界，但在大众文化中却刚刚开始流行，并被错误地泛化。

如笛卡尔的身心二元论，尽管现代神经科学已经通过大量的 fMRI 数据和神经电生理实验证明了意识是神经元复杂网络的属性，但在互联网上，通过“松果体”连接灵魂与肉体的二元论依然盛行。与之类似的还有量子力学，量子效应在宏观尺度下会迅速发生退相干。将普朗克尺度（ $10^{-35}$ 米）的规律强行套用到宏观的人类社会学（米级尺度），是相当荒谬的。这就像试图用广义相对论来计算怎么炒菜一样毫无意义。哦，当然还有本文所介绍的大脑是个预测机器——多数人还将记忆当作事实存储。

这些理论被广泛的应用，大有成为新型宗教的潜力。而细看其内容，在根基上就站不住脚。且在验证方面大量内容依赖个案分析与错误理论之间的互相引用——这就是无效探索。

5.11探索-小结#

探索并非是某种神秘的顿悟，我们仅仅依靠打坐或者闭关是不可能有任何进展的。只有真正的去了解该了解的理论，然后进行溯因推理，最后对其进行验证。我们才能完成一次合格的探索。

Q: 什么时候大脑会被迫切换到高耗能的“探索模式”？其核心心理体验是什么？

💡 提示：探索模式的触发

点击翻转

条件：当历史上的第一人面对全新问题（如爱因斯坦面对光速恒定），且无任何外部模型可供模仿时。
体验：长久的焦虑。这本质上是大脑在忍受极高的预测误差，试图凭空构建一个从未存在过的模型。

点击继续

Q: “生成式构建”新理论的一般步骤是什么？（试错循环）

💡 提示：生成式构建

点击翻转

旧模型失效（预测误差持续存在）。
搜索与试错：
- 提出假设 A -> 验证 -> 失败（误差仍大） -> 抛弃
- 提出假设 B -> … -> 抛弃
- 提出假设 C -> 验证 -> 成功（误差骤降） -> 选中
巩固稳定新模型。

点击继续

Q: 什么是“溯因推理” (Abductive Reasoning)？请结合天王星/水星案例说明。

💡 提示：从结果推原因

点击翻转

溯因推理是从观察到的异常现象回推最可能的原因（最佳解释推论）。

逻辑：观察到现象 D + 规则 (H -> D) -> 结论 (H 可能是真的)。
案例：
- 成功：天王星轨道异常 -> 推测有未知行星拉扯 -> 发现海王星。
- 失败：水星近日点进动 -> 推测有“祝融星” -> 观测失败（后被广义相对论取代）。 :::

Q: 在验证一个新理论时，不同类型的学科分别遵循什么核心标准？

💡 提示：不同学科的验证标准

点击翻转

抽象世界（数学/逻辑）：形式化证明。依赖纯粹的符号运算与逻辑推导（如四色定理的代码验证）。
经验世界（物理/生物）：可重复性。不同团队在不同条件下能得到统计一致的结果（如幽门螺杆菌的验证）。
复杂系统（历史/经济）：对照分析。因难以做实验，常采用随机对照试验（RCT）或自然实验（比较法）来寻找因果线索。

点击继续

Q: 为什么心理学和经济学等学科更容易面临“复现危机”或被质疑？

💡 提示：伪科学 vs 科学

点击翻转

因为它们研究的是复杂系统。变量极多、难以隔离、伦理限制强，导致很难进行高精度的控制实验。因此，这些学科正趋向于与更硬核的学科交叉（如计量经济学、计算神经科学）以提升严谨性。

点击继续

1 / 4

6.尾声#

如果要用一句话概括全文的主线，那就是有效学习是更精准地更新内部模型。神经可塑性告诉我们，改变确实会发生，但它需要反复激活、需要时间巩固，也会因长期不用而被修剪；记忆系统告诉我们，“当下能想起与日后依然记得无关”，而且技能自动化与长期可提取知识的获得都依赖长期的训练；预测机制则进一步说明，学习不是大多数人所想象的那样“从无到有”，而更像“从错到对”——当你能被反馈迫使修正预测，新的回路才会真正形成。

最后的复习卡片：#

Q: 根据神经科学，学习在微观层面的本质是什么？

💡 提示：Ch1 物理基础

点击翻转

神经元网络物理结构的改变。学习不仅仅是信息的输入，而是大脑通过建立新突触、强化髓鞘或生成新神经元来重塑自身的物理过程。

点击继续

Q: 哪三大生理因素是神经重塑（学习）的必要燃料？

💡 提示：Ch1 三大支柱

点击翻转

睡眠（清理废物、巩固记忆）。
运动（产生神经营养因子BDNF）。
营养（提供构建突触的原料，如Omega-3）。

点击继续

Q: 人类的记忆系统主要分为哪三类？各自的特点是什么？

💡 提示：Ch2 记忆分类

点击翻转

工作记忆：极不稳定，仅能维持数秒的当前思维（容量3-5个）。
外显记忆：可被意识回忆的事实与经历（依赖海马体巩固）。
内隐记忆：无意识参与的自动化技能与习惯（如骑车，极难遗忘）。

点击继续

Q: 为什么说大脑是一台“预测机器”而非“记录仪”？

💡 提示：Ch3 核心隐喻

点击翻转

大脑时刻依据旧经验预判感觉输入，它只关注预测误差（即“意外”）。如果预测完全吻合，大脑就不会启动学习机制；只有当现实打脸预期时，学习才会发生。

点击继续

Q: 触发大脑更新模型（即“真正学会”）的唯一核心条件是什么？

💡 提示：Ch3 学习的触发器

点击翻转

预测误差 (Prediction Error)。只有当主观上感到“惊讶”或“犯错”时，神经递质才会调整，驱动突触发生改变。没有误差，就没有学习。

点击继续

Q: 面对新旧知识的冲突，大脑倾向于“打补丁”还是“重构”？

💡 提示：Ch3 更新策略

点击翻转

遵循能耗最小原则，首选打补丁（保留旧观念，增加辅助假设来解释异常）。只有当误差大到无法修补时，才会进行高能耗的重构（彻底推翻旧模型）。

点击继续

Q: 专家（如国际象棋大师）为什么能瞬间记住复杂信息？

💡 提示：Ch4 专家vs新手

点击翻转

因为他们拥有“组块”。专家利用长期记忆中的先验模型，将大量零散信息压缩为一个有意义的单元（组块），从而极大地释放了工作记忆的压力。

点击继续

Q: 学习时感到“烧脑”的认知负荷主要来自哪两方面？应如何应对？

💡 提示：Ch4 认知负荷

点击翻转

外在负荷（噪音/排版差）：通过去除冗余来降低。
内在负荷（知识本身难）：通过分割材料（拆解为小步骤）来逐步消化。

点击继续

Q: 为什么单纯的“看”或“听”（如被动听课）往往无效？

💡 提示：Ch5 注意力机制

点击翻转

因为学习依赖注意力定向。如果注意力没有聚焦在“引发模型更新的信息”上，大脑会将其他输入视为噪音并过滤掉（无意视盲），导致无法形成记忆痕迹。

点击继续

Q: 哪两种复习策略被证明比“反复阅读”更有效？

💡 提示：Ch5 最高效手段

点击翻转

主动检索（测试）：强迫大脑重建神经路径，利用错误反馈修正模型。
间隔复习：利用间隔效应，在遗忘临界点复习，将短期记忆转化为长期记忆。

点击继续

Q: 为什么在练习时应采用“穿插测试”（混合不同题型）而非“集中练习”？

💡 提示：Ch5 穿插测试

点击翻转

穿插测试强迫大脑不断进行“模型识别与切换”。虽然初期较难，但它模拟了真实应用场景，能显著提升长期留存率和迁移能力。

点击继续

Q: 当没有前人经验可模仿时，如何通过“溯因推理”构建新理论？

💡 提示：Ch6 高阶探索

点击翻转

从观察到的异常现象（结果）回推最可能的原因。即：观察到现象D -> 构想规则H -> 如果H成立则D自然发生 -> 暂时接受H为真，并去验证它。

点击继续

1 / 12

本文内容还大量参考了以下几本书籍的内容：

《精确学习》 — 作者：斯坦尼斯拉斯·迪昂（Stanislas Dehaene）。

《认知天性》 — 作者：彼得·C·布朗（Peter C. Brown）、亨利·L·罗迪格三世（Henry L. Roediger III）、马克·A·麦克丹尼尔（Mark A. McDaniel）。

《理解大脑》/《认识大脑：关于大脑的7½堂课》 — 作者：莉莎·费德曼·巴瑞特（Lisa Feldman Barrett）

欢迎留下你的评论QWQ

附上论文：

Maguire, Eleanor A., et al. “Navigation-Related Structural Change in the Hippocampi of Taxi Drivers.” Proceedings of the National Academy of Sciences, vol. 97, no. 8, 2000, pp. 4398–403. ↩
Dehaene, Stanislas. How We Learn: Why Brains Learn Better Than Any Machine… for Now. Viking, 2020. ↩ ↩² ↩³
Bradlow, Ann R., et al. “Training Japanese Listeners to Identify English /R/and /L/: Long-Term Retention of Learning in Perception and Production.” Perception & Psychophysics, vol. 61, no. 5, Springer Science and Business Media LLC, Jan. 1999, pp. 977–85, https://doi.org/10.3758/bf03206911. Accessed 30 Dec. 2025. ↩
Crupi, Rosalia, et al. “n-3 Fatty Acids: Role in Neurogenesis and Neuroplasticity.” Current Medicinal Chemistry, vol. 20, no. 24, 2013, pp. 2953–63. ↩
Molteni, R et al. “A high-fat, refined sugar diet reduces hippocampal brain-derived neurotrophic factor, neuronal plasticity, and learning.” Neuroscience vol. 112,4 (2002): 803-14. doi:10.1016/s0306-4522(02)00123-9 ↩
Meeusen, Romain. “Exercise, Nutrition and the Brain.” Sports Medicine, vol. 44, Suppl. 1, 2014, pp. S47–56. ↩
Frank, Marcos G. “Sleep and Synaptic Plasticity in the Developing and Adult Brain.” Sleep, Neuronal Plasticity and Brain Function, edited by Peter Meerlo et al., Springer, 2014, pp. 123–49. ↩
Pickersgill, Jacob W., et al. “The Combined Influences of Exercise, Diet and Sleep on Neuroplasticity.” Frontiers in Psychology, vol. 13, 2022, article 831819. ↩
Cowan, Nelson. “The Magical Mystery Four: How Is Working Memory Capacity Limited, and Why?” Current Directions in Psychological Science, vol. 19, no. 1, 2010, pp. 51–57. ↩
Dudai, Yadin. “The Neurobiology of Consolidations, or, How Stable Is the Engram?” Annual Review of Psychology, vol. 55, 2004, pp. 51–86. ↩
Squire, Larry R., and Adam J. O. Dede. “Conscious and Unconscious Memory Systems.” Cold Spring Harbor Perspectives in Biology, vol. 7, no. 3, 2015, article a021667. ↩
Corkin, Suzanne. “What’s New with the Amnesic Patient H.M.?” Nature Reviews Neuroscience, vol. 3, no. 2, 2002, pp. 153–60. ↩ ↩²
MacKay, Donald G., et al. “Language, Memory, and H.M.: A Profound Deficit in Pronouncing New Words and Sentences and Its Implications.” Journal of Memory and Language, vol. 57, no. 3, 2007, pp. 375–410. ↩
Kutas, M, and S A Hillyard. “Reading senseless sentences: brain potentials reflect semantic incongruity.” Science (New York, N.Y.) vol. 207,4427 (1980): 203-5. doi:10.1126/science.7350657 ↩
Fukukura, Jun, et al. “Prospection by Any Other Name? A Response to Seligman et Al. (2013).” Perspectives on Psychological Science, vol. 8, no. 2, Feb. 2013, pp. 146–50, https://doi.org/10.1177/1745691612474320. Accessed 28 Mar. 2019. ↩
Hassabis, Demis et al. “Patients with hippocampal amnesia cannot imagine new experiences.” Proceedings of the National Academy of Sciences of the United States of America vol. 104,5 (2007): 1726-31. doi:10.1073/pnas.0610561104 ↩
Liu, Jiangang et al. “Seeing Jesus in toast: neural and behavioral correlates of face pareidolia.” Cortex; a journal devoted to the study of the nervous system and behavior vol. 53 (2014): 60-77. doi:10.1016/j.cortex.2014.01.013 ↩
Friston, K. Does predictive coding have a future?. Nat Neurosci 21, 1019–1021 (2018). https://doi.org/10.1038/s41593-018-0200-7 ↩
Tobler, Philippe N et al. “Human neural learning depends on reward prediction errors in the blocking paradigm.” Journal of neurophysiology vol. 95,1 (2006): 301-10. doi:10.1152/jn.00762.2005 ↩ ↩²
Miami Symposium on the Prediction of Behavior, 1967: Aversive Stimulation p9–p31 ↩
Haruno, M et al. “Mosaic model for sensorimotor learning and control.” Neural computation vol. 13,10 (2001): 2201-20. doi:10.1162/089976601750541778 ↩
Gershman, Samuel J et al. “Context, learning, and extinction.” Psychological review vol. 117,1 (2010): 197-209. doi:10.1037/a0017808 ↩
Nassar, Matthew R et al. “Rational regulation of learning dynamics by pupil-linked arousal systems.” Nature neuroscience vol. 15,7 1040-6. 3 Jun. 2012, doi:10.1038/nn.3130 ↩
Ericsson, Anders, and Robert Pool. Peak: Secrets from the New Science of Expertise. Eamon Dolan/Houghton Mifflin Harcourt, 2016. ↩
Bobis, Janette, et al. “Cognitive Load Effects in a Primary-School Geometry Task.” Learning and Instruction, vol. 3, no. 1, 1993, pp. 1–21. ↩
Sohrabi, Zohreh, et al. “A Comparative Study of the Effect of Two Methods of Online Education Based on Sweller’s Cognitive Load Theory and Online Education in a Common Way on the Academic Engagement of Medical Students in Anatomy.” Medical Journal of the Islamic Republic of Iran, vol. 37, 2023, article 73. ↩
Liu, Dongyang. “The Effects of Segmentation on Cognitive Load, Vocabulary Learning and Retention, and Reading Comprehension in a Multimedia Learning Environment.” BMC Psychology, vol. 12, no. 1, article 4, 2024. ↩
Kunda, Z. “The case for motivated reasoning.” Psychological bulletin vol. 108,3 (1990): 480-98. doi:10.1037/0033-2909.108.3.480 ↩ ↩²
Tomasello, M. (1999). The Cultural Origins of Human Cognition. Harvard University Press. ↩
Figueiredo, Luiz Felipe et al. “The mirror neuron: thirty years since its discovery.” Revista brasileira de psiquiatria (Sao Paulo, Brazil : 1999) vol. 45,3 (2023): 298-299. doi:10.47626/1516-4446-2022-2870 ↩
Mayo, Oded, and Simone Shamay-Tsoory. “Dynamic Mutual Predictions during Social Learning: A Computational and Interbrain Model.” Neuroscience & Biobehavioral Reviews, vol. 157, Elsevier BV, Dec. 2023, pp. 105513–13, https://doi.org/10.1016/j.neubiorev.2023.105513. Accessed 3 Jan. 2026. ↩
Drew, Trafton et al. “The invisible gorilla strikes again: sustained inattentional blindness in expert observers.” Psychological science vol. 24,9 (2013): 1848-53. doi:10.1177/0956797613479386 ↩
Stevenson, Matt P et al. “Attention Restoration Theory II: a systematic review to clarify attention processes affected by exposure to natural environments.” Journal of toxicology and environmental health. Part B, Critical reviews vol. 21,4 (2018): 227-268. doi:10.1080/10937404.2018.1505571 ↩
Voss, Joel L et al. “Hippocampal brain-network coordination during volitional exploratory behavior enhances learning.” Nature neuroscience vol. 14,1 (2011): 115-20. doi:10.1038/nn.2693 ↩
Freeman, Scott et al. “Active learning increases student performance in science, engineering, and mathematics.” Proceedings of the National Academy of Sciences of the United States of America vol. 111,23 (2014): 8410-5. doi:10.1073/pnas.1319030111 ↩
Rohrer, Doug, and Kelli Taylor. “The Shuffling of Mathematics Problems Improves Learning.” Instructional Science, vol. 35, no. 6, Apr. 2007, pp. 481–98, https://doi.org/10.1007/s11251-007-9015-8. ↩
Brown, Peter C., et al. Make It Stick: The Science of Successful Learning. Belknap Press, 2014. ↩
Meeter, M et al. “Remembering the news: modeling retention data from a study with 14,000 participants.” Memory & cognition vol. 33,5 (2005): 793-810. doi:10.3758/bf03193075 ↩
Karpicke, Jeffrey D., and Henry L. Roediger III. “The Critical Importance of Retrieval for Learning.” Science, vol. 319, no. 5865, 2008, pp. 966–968, https://doi.org/10.1126/science.1152408. ↩
Jenkins, John G., and Karl M. Dallenbach. “Obliviscence during Sleep and Waking.” The American Journal of Psychology, vol. 35, no. 4, 1924, pp. 605–12. JSTOR, https://doi.org/10.2307/1414040. Accessed 3 Jan. 2026. ↩
Skaggs, W E, and B L McNaughton. “Replay of neuronal firing sequences in rat hippocampus during sleep following spatial experience.” Science (New York, N.Y.) vol. 271,5257 (1996): 1870-3. doi:10.1126/science.271.5257.1870 ↩
Wagner, Ullrich et al. “Sleep inspires insight.” Nature vol. 427,6972 (2004): 352-5. doi:10.1038/nature02223 ↩

1.神经可塑性：学习的物理基础#

1.1神经元与信号传递#

1.2神经可塑性#

1.3敏感-学习的最佳窗口#

1.4营养、运动与睡眠#

1.5小结#

2.记忆的分类：从瞬时信号到自动化本能#

2.1工作记忆-思考正在发生的地方#

2.2外显记忆-可以被回忆的知识如何被巩固#

2.3内隐记忆-技能如何在无意识中自动化#

2.3著名患者H.M.-“能记住 ≠ 学会”#

2.4小结#

3.大脑是一台预测机器：学习必须从“犯错”开始#

3.2无时不刻在预测的大脑#

3.2记忆为未来构建预测模型#

3.3没有未知的信息，只有错误的预测#

3.4模型更新的条件-预测误差#

3.5为什么大脑可以同时相信矛盾理论#

3.6模型更新-打补丁or重构#

3.7小结#

4.从新手到专家：复杂模型如何被逐步建成#

4.1组块与长期模型让专家“记得更多”#

4.2认知负荷的来源#

4.3降低外在负荷-去除冗余#

4.4降低内在负荷-分割复杂#

4.5小结#

5.真正有效的学习路径：模仿与探索#

5.1起点-发现错误#

5.2模仿-最低成本的学习#

5.3寻找可信新理论的方式#

5.4模仿-快速消除大量误差#

5.4.1看见信息#

5.4.2深度加工#

5.5模仿-精细修正残余误差#

5.5.1测试-错误反馈#

5.5.2穿插测试#

5.5.3测试不需要分数#

5.6模仿-巩固#

5.6.1关于记忆遗忘曲线#

5.6.2主动检索#

5.6.3睡眠#

5.7模仿-小结#

5.8探索#

5.9探索-溯因与多维验证#

5.9.1溯因推理#

5.9.2验证推理#

5.10无效探索的兴起#

5.11探索-小结#

6.尾声#

最后的复习卡片：#

Footnotes#