第一章:现代扑克方法
1.1 什么是 GTO?
GTO 代表 “博弈论最优”。它描述了一种模型,其中两个或更多玩家达到了一个均衡策略。在这种情况下,所有策略都完美平衡,没有任何玩家可以通过改变策略来增加他们的期望值(EV)。如果你桌上的每个人都在 “玩 GTO”,这意味着他们正在玩一种策略,他们没有动力去改变这种策略,因为这样做无法增加他们的 EV。
在这种模型中,每个玩家都了解其他玩家的策略。这意味着如果一个玩家改变了他们的策略,其他玩家会立即理解这一点,并可以开始剥削利用他们的改变。显然,这种模型并不代表现实世界中的情况,因此我们的目标不是盲目遵循 GTO。
我们的目标是使用 GTO 作为框架,然后通过观察对手如何偏离 GTO 来找到最高 EV 的策略。
“GTO” 的具体含义在扑克社区中备受争议,并且带有许多负面标签。人们对 GTO 打法的有用性持有两极分化的观点。一些人认为它是终极解决方案,而另一些人则认为它根本没有帮助,甚至可能误导人。
乍一看,GTO 解决方案可能看起来随机且难以理解。但随着我们更深入地探索,我们会更好地理解相关的模式。最优秀的扑克玩家非常擅长将这些模式与整体扑克原则联系起来。使用 GTO 解决方案并不是要记住成千上万的模型,而是要理解这些模式背后的原则。
1.2 GTO 框架
GTO 作为一个框架,帮助我们构建一个基本策略。在学习玩哪些手牌以及如何玩、是否跟注或 3-bet、是否在翻牌后下注或过牌时,我们需要一个基线策略,为游戏中的每个位置提供一个坚实的基础。
有一个概念叫做 “最大剥削” 与 “最小剥削”。最大剥削是指将你积累的信息和读牌能力发挥到极致,从而对你的策略产生巨大影响。这种策略非常危险,因为如果你的读牌错误,你可能会损失很多钱。
通过对对手进行极端调整,你也可能暴露自己,被对手利用。例如,如果你总是对那个你认为在河牌圈经常弃牌的玩家进行诈唬,他可能会察觉到这一点,因为你诈唬得太频繁了。他可能会通过频繁设陷阱和跟注来反制你。与其专注于针对个别对手进行调整,我想为你提供一个强大的 PLO 策略的坚实框架。一旦建立了这个框架,我们将讨论何时以及如何偏离这个基线策略,以最大化你的 EV。
长期以来,扑克被认为是一个依赖读牌和剥削的游戏。由于这种传统,使用读牌和剥削作为主要决策工具很有吸引力。然而,最好的剥削策略总是建立在初始的坚实基线策略之上。
1.3 GTO 的实践
不出所料,许多早期倡导 GTO 的扑克玩家已经登上了游戏的顶峰。像 LinusLLove、OtB_RedBaron、Sauce123 和 Ben86 这样的玩家都基于 GTO 进行策略,并且被认为是世界上最好的扑克玩家之一。
Ben86 被认为是世界上最好的 PLO 玩家之一,他曾在 Joey Ingram 的 “扑克生活播客” 上被问到以下问题:“世界上排名前 10 的 PLO 玩家与排名前 100 的玩家有什么区别,这两个群体与排名前 1000 的玩家又有什么区别?”
他的回答分为三部分:
- “排名前 10 的玩家对 GTO 有最扎实的基本理解,并且知道应该如何利用实际情况进行剥削。”
- “排名前 100 的玩家具有相同的基本素质,但执行的绝对技能水平较低。此外,还有一部分是剥削型的 ‘Victor 型’(Isildur1)直觉型玩家。他们非常擅长执行剥削型打法,但通常受到波动的影响很大。很难清楚地区分谁只是运气好,谁是真的技术好。”
- “如果每个人都在玩猫捉老鼠的游戏,那么在这个游戏中会有明显更优秀的玩家。但当这些 ‘猫捉老鼠的玩家’ 遇到 ‘GTO 玩家’ 时,他们就无法生存了。”
Isildur1 在单挑 NLHE 中通过极其激进的风格取得了巨大成功。他经常超额下注和诈唬。尽管他没有使用 GTO 策略,但这种策略奏效了。这是因为他的许多对手不够强大,不知道如何反制这种风格。
在低级别的扑克中,你会经常看到这种情况,其中一个玩家在特定的玩家群体中使用一套特定的策略,效果非常好。然而,随着这个玩家升级,他们会遇到更聪明的对手并陷入困境。主要依靠直觉进行游戏并不是长期成功的秘诀。在今天的 NLHE 游戏中,GTO 玩家始终占据主导地位,剥削型玩家则处于劣势。
Ben86 还提到了波动性。排名前 100 的玩家并不总是因为对 GTO 有最扎实的理解而处于这个位置,还因为扑克中存在很大的波动性。不仅仅是全押和坏运气,从你拿到的手牌、位置、谁让弱玩家做出了代价高昂的举动等等,都会产生影响。作为玩家,很难真正知道某人是否真的技术好,还是只是运气好。
排名前 10 的玩家对 GTO 有最扎实的理解,并且能够迅速识别你游戏中的不平衡并进行调整以剥削你。
Ben86 说:“如果每个人都在玩猫捉老鼠的游戏,那么在这个游戏中会有明显更优秀的玩家。” 他的意思是,当每个人都采用剥削型策略时,会有一些人比其他人更擅长利用群体的倾向。他们对当前的元游戏有更深入的理解,并且知道如何利用它。
但当这些主要依赖剥削的玩家遇到 GTO 玩家时,他们无法剥削 GTO 玩家,他们的弱点就会暴露出来。GTO 玩家能够通过理解什么让这些直觉型玩家不平衡来 “剥削” 他们,同时 GTO 玩家也会限制自己的下行风险。这就是 GTO 的真正力量。这就是为什么排名前 10 的玩家都对 GTO 有最扎实的基本理解。
1.4 GTO 对抗弱对手
有一个巨大的误解是,当你对抗弱对手时,你可以专注于读牌并无情地剥削他们,仅仅因为他们玩得很糟糕。然而,如果你不知道对手在做什么,因为他们不可预测,那么使用 GTO 策略会非常有帮助。
我们的最终目标不是遵循 GTO 策略,而是更好地理解对手的游戏。如果你对 GTO 有扎实的理解,读牌通常会更加准确和可操作。如果你能发现对手如何偏离 GTO 以及这如何使他们容易被剥削,你将能够为自己创造优势。这就是我们的目标。
你在桌上遇到的大多数小级别(甚至许多高级别)玩家都会犯下巨大的错误。为了对他们产生优势,你需要理解这些错误是什么以及如何利用它们。
确实,与休闲玩家对战时,相比与职业玩家对战时,采用平衡策略以防止被剥削并不那么重要,因为休闲玩家不会像职业玩家那样严厉地惩罚你。但你仍然希望限制自己的下行风险,尤其是当你对对手没有太多信息时。
确定你的最佳策略有四个步骤:
- 理解基线(识别 GTO)。
- 识别对手如何偏离 GTO(找到漏洞)。
- 利用对手的弱点(剥削)。
- 限制下行风险(限制下行)。
一个简单的例子如下。假设你在 BTN,你必须决定是加注还是弃牌。你知道在 GTO 术语中, BTN 应该加注 50% 的组合,而 BB 在面对一个底池加注时应该防御 60% 的手牌(识别 GTO)。根据你到目前为止对 BB 位对手的倾向,你可能认为他们只会防御 40% 而不是 60%(找到漏洞)。一个可能的剥削策略是将你的 BTN 开池加注范围从 50% 增加到 65%(剥削)。
你仍然不应该将你的 BTN 加注范围扩展得太多,因为你不想被反剥削,而且也有可能你的阅读是错误的(限制下行)。你希望保护自己的下行风险,而做到这一点的方法是通过进行有意义但最小的剥削。坚持你的基线策略,并根据对手的倾向进行轻微调整。如果你这样做,你可以确保在你的对手察觉到你的调整或你的阅读错误时,你的下行风险得到保护。
1.5 如何学习 GTO
我们只能通过扑克求解器的输出来看到 GTO 的结果。例如,一个 PLO 求解器建议在 UTG 用 A-A-5-2 开池加注,但用 J-8-5-2 弃牌。通过数十亿次计算,求解器计算出其中一手牌是 +EV 的加注,而另一手牌不是。这就是我们得到的求解器输出。求解器不会告诉我们为什么一手牌应该加注,所以我们不知道原因。这就是我们作为人类发挥作用的地方。
我们的工作是通过应用逻辑来理解这些输出。我们识别模式,并将想法和原则附加到这些模式上。我们通过提出假设、运行求解器实验并比较情况来进行测试。然后我们在现实世界中实施和测试这些策略,以更深入地理解正在发生的事情。
好消息是,你不必担心 GTO 的概念或处理任何求解器输出,因为我已经完成了这项工作。自 2017 年第一个 PLO 求解器问世以来,我一直在做这件事。我花了数千小时研究 GTO 的基本原理,并在这本书中以易于应用的概念呈现给你。你将经历构建你的坚实基线策略的过程,并开始学习如何在其他玩家偏离 “GTO 策略” 时最大化你的权益。
1.6 主要要点
- 对抗未知玩家时,从平衡策略开始,以在最小化下行风险的同时打出强大的游戏。
- 一旦你获得更多关于对手的阅读和信息,你可以开始偏离你的基线策略。
- 确保不要过度调整,因为这样做会使你面临重大风险。
创建最佳策略有四个步骤:
- 理解基线并用它来构建坚实的原则。
- 识别对手如何偏离 GTO。
- 利用对手的弱点。
- 限制你的下行风险。