第6章 反馈:系统如何自我强化
结构决定系统长什么样,反馈决定系统怎么动起来。 很多人对系统的理解,停留在“里面有什么”。有规则,有人,有钱,有信息,有技术,有流程。这些当然重要,但如果只看到这些静态部件,你仍然看不见系统为什么会自己往某个方向越走越远,或者为什么偏了以后还能被拉回来。 真正让系统运转起来的,是反馈。 所谓反馈,就是系统产生结果之后,这个结果又反过来影响系统下一步怎么走。你做一个动作,得到一个结果;结果再改变你的判断、激励和后续动作;于是系统不是一条直线,而是一个回路。 热的时候空调启动,房间降温,降温以后空调减弱,这是反馈。内容更刺激,互动更高,平台就继续推刺激内容,创作者也继续朝刺激方向生产,这也是反馈。一个人运动以后感觉状态变好,于是更愿意继续运动,是反馈;一个人熬夜以后第二天情绪变差,白天效率下降,晚上更需要用手机麻痹自己,这同样是反馈。 没有反馈,你只能看到一次动作和一次结果;有了反馈,你才会明白,为什么很多行为会自己强化,为什么很多系统会自己稳定,为什么一些小偏差最后会滚成大偏差。 反馈大致有两种。第一种是负反馈。负反馈不是“坏”,而是“拉回”。系统偏离了,负反馈把它拉回稳态。体温过高会出汗,库存过多会降价,身体疲劳会要求休息,这些都是负反馈。负反馈的作用,是维持边界,防止系统越走越偏。 第二种是正反馈。正反馈不是“好”,而是“放大”。上涨带来更强预期,更强预期带来更多买入;流量带来更多曝光,更多曝光带来更多流量;社交认同带来更强表达欲,表达越多又带来更多认同。正反馈的作用,不是稳定,而是加速。 一个系统到底会变稳还是失控,很大程度上就取决于:它主要被什么反馈控制,它的反馈有没有延迟,有没有污染,有没有边界。 这也是为什么,很多问题不能只看表面动作。因为真正推动结果的,不是某个单点行为,而是行为之后,系统给了什么回声。如果一个平台不断用流量奖励极端内容,问题不在于极端内容出现了一次,而在于系统正在给它回报。如果一个人每次用冲动解决焦虑都能得到短期缓解,问题不在于那一次冲动,而在于系统已经学会:这种办法虽然糟糕,但很有效。 系统一旦通过反馈学会了某种路径,后面就会越来越像沿着习惯自动滑行。你以为自己在重复一件事,实际上是系统在重复强化一条路。 所以,理解反馈,就是理解系统为什么会“自己动”。有些系统靠负反馈维持稳定,有些系统被正反馈不断推向极端,大多数真实系统则是在两种力量之间摇摆。表面上看,人们好像一直在主动决策;实际上,很多决策早就被前一轮反馈塑形了。 如果你想真正看懂一个系统,就不要只看它做了什么,要看它如何对自己的结果作出反应。因为系统最终变成什么样子,往往不是由初始目标决定的,而是由它持续奖励什么、压制什么、强化什么决定的。 这就是本章最重要的一句话:反馈是系统的记忆,也是系统把一次结果变成长期方向的机制。