第6章反馈：系统如何自我强化

系统

结构决定系统长什么样，反馈决定系统怎么动起来。很多人对系统的理解，停留在“里面有什么”。有规则，有人，有钱，有信息，有技术，有流程。这些当然重要，但如果只看到这些静态部件，你仍然看不见系统为什么会自己往某个方向越走越远，或者为什么偏了以后还能被拉回来。真正让系统运转起来的，是反馈。所谓反馈，就是系统产生结果之后，这个结果又反过来影响系统下一步怎么走。你做一个动作，得到一个结果；结果再改变你的判断、激励和后续动作；于是系统不是一条直线，而是一个回路。热的时候空调启动，房间降温，降温以后空调减弱，这是反馈。内容更刺激，互动更高，平台就继续推刺激内容，创作者也继续朝刺激方向生产，这也是反馈。一个人运动以后感觉状态变好，于是更愿意继续运动，是反馈；一个人熬夜以后第二天情绪变差，白天效率下降，晚上更需要用手机麻痹自己，这同样是反馈。没有反馈，你只能看到一次动作和一次结果；有了反馈，你才会明白，为什么很多行为会自己强化，为什么很多系统会自己稳定，为什么一些小偏差最后会滚成大偏差。反馈大致有两种。第一种是负反馈。负反馈不是“坏”，而是“拉回”。系统偏离了，负反馈把它拉回稳态。体温过高会出汗，库存过多会降价，身体疲劳会要求休息，这些都是负反馈。负反馈的作用，是维持边界，防止系统越走越偏。第二种是正反馈。正反馈不是“好”，而是“放大”。上涨带来更强预期，更强预期带来更多买入；流量带来更多曝光，更多曝光带来更多流量；社交认同带来更强表达欲，表达越多又带来更多认同。正反馈的作用，不是稳定，而是加速。一个系统到底会变稳还是失控，很大程度上就取决于：它主要被什么反馈控制，它的反馈有没有延迟，有没有污染，有没有边界。这也是为什么，很多问题不能只看表面动作。因为真正推动结果的，不是某个单点行为，而是行为之后，系统给了什么回声。如果一个平台不断用流量奖励极端内容，问题不在于极端内容出现了一次，而在于系统正在给它回报。如果一个人每次用冲动解决焦虑都能得到短期缓解，问题不在于那一次冲动，而在于系统已经学会：这种办法虽然糟糕，但很有效。系统一旦通过反馈学会了某种路径，后面就会越来越像沿着习惯自动滑行。你以为自己在重复一件事，实际上是系统在重复强化一条路。所以，理解反馈，就是理解系统为什么会“自己动”。有些系统靠负反馈维持稳定，有些系统被正反馈不断推向极端，大多数真实系统则是在两种力量之间摇摆。表面上看，人们好像一直在主动决策；实际上，很多决策早就被前一轮反馈塑形了。如果你想真正看懂一个系统，就不要只看它做了什么，要看它如何对自己的结果作出反应。因为系统最终变成什么样子，往往不是由初始目标决定的，而是由它持续奖励什么、压制什么、强化什么决定的。这就是本章最重要的一句话：反馈是系统的记忆，也是系统把一次结果变成长期方向的机制。

第6章 反馈：系统如何自我强化

第6章反馈：系统如何自我强化