Skip to content

第一章 博弈论简介

在扑克还没有像现在这样发达的年代,你可以尝试比对手高一个层级,让他玩错的打法。当时的基本技巧是一手牌玩得比对手更好,从而获利。近年来,随着大量培训资料的出现,人们想要仅仅通过一手牌玩得比对手更好就获得巨额利润已经变得相当困难。现在很少有玩家会犯大错。如今,即使是实力较弱的玩家也或多或少地知道,在多人底池中,Q 高同花通常不太好,或者在非常湿润的公共牌面上,顶三条并非超级坚果牌。游戏变得更加理论化,尤其是在博弈论对扑克的影响下。

当今游戏和教程中的圣杯是所谓的 GTO。总有一种策略可以创建一个无论对手如何操作都无法被击败的策略。这被称为 GTO 策略,其关键要素包括合理的游戏计划、从博弈论角度对扑克游戏的总体理解以及你想要应用的策略。

在第一章中,我们想重点介绍这个重要的主题,以帮助玩家提高 PLO 的水平。我们将讨论游戏计划方法,以及两种主要的扑克博弈论方法:GTO 和剥削策略。由于本书专门讨论 PLO,我们不会深入探讨这个数学和理论性很强的主题。关于扑克博弈论的书籍有很多,因此我们不会对其进行深入介绍。

首先,让我们从博弈论的角度回顾一下什么是扑克。它是一种信息不完全的纸牌游戏,玩家必须在每一手牌的游戏中做出多个决策。其理念是,最终的牌不会决定任何事情,因为它们是随机的 (即受机会影响),并且从长远来看对所有玩家都是一样的。因此,赢家的差异在于其决策的质量。

赢家会用赢牌赢得更多,用弱牌和输牌输得更少。他的胜率取决于他的决策,而不是发到他的牌。如果某人短期内赢了,他可能只是拿到了比对手更好的牌。但从长远来看,这种说法站不住脚。长期来看,赢家会做出更好的决策,并因此获胜。提高胜率的关键不仅仅是一手牌比对手玩得更好。这只是你成功的一个因素。关键在于全面提升你的决策能力。

你可以将扑克视为一系列决策,在这种情况下,你可以创建决策表。当你坐在牌桌旁玩牌时,你需要做出许多决策,但即使在你坐下之前,也有很多你可能甚至没有意识到的决策。在这张牌桌上玩牌对你有利吗?还是桌上只有更优秀的玩家?你会坐在有利位置,还是你的左边会有实力强大的玩家让你处境艰难?你能在稳健的资金管理下玩得起这些级别的牌局吗?还是说这就像一场掷骰子游戏?你的心情适合玩吗?你专注力强吗?类似的问题还有很多,但你应该明白我的意思了。我们将在 “心态” 章节的后面讨论游戏选择、牌局管理和职业生涯管理。让我们回到牌桌。

当你进入一手牌时,你会被发牌,你必须下盲注。这时,决策就开始了。你想弃牌、跟注还是加注?其他玩家也一样。每个人都开始了自己的决策树。决策树总是以弃牌结束,但预期结果仍然可能是负数。如果你在盲注位置弃牌,你将输掉盲注 (尽管你的弃牌被认为是 0 EV)。如果你决定跟注,其他人可能会加注,迫使你做出另一个决定。如果你到了翻牌圈,决策又重新开始。你可以弃牌、过牌、跟注或加注。转牌圈和河牌圈也可能出现同样的情况。

这还不能称之为策略,它只是游戏的结构。如果你根据牌桌上掌握的信息 (例如你的位置、你的牌或其他玩家的倾向) 做出决定,它就变成了一种策略。当你进一步思考你的决定并尝试制定策略时,你会得出一些假设。例如,在 UTG 位置,你想用 15% 的牌加注;在 BTN 位置,你想加注 50% 的牌;在盲注位置,你想防守 40% 的牌;翻牌后,你想用边缘牌跟注,用强牌和弱牌加注;在转牌圈,你想用 20% 的牌诈唬,等等。任何扑克游戏中都有无穷无尽的选择,即使在单挑游戏中也是如此。

游戏计划是所有包含你所需策略的决策树的总和。现在,你有几种玩牌的方式,从翻牌前开始,一直到后面的几条街。你可以根据对手的不同策略,调整游戏计划,以获得最高的 +EV 结果。理想情况下,你应该针对每手起手牌和位置制定一个游戏计划,以确保在对抗一个或多个对手时获得最佳结果;你应该知道如何用你的全部范围玩 A-K-5-r (“r” 代表 “彩虹”) 公共牌,以及 10-9-8 单调 (三张同样的花色) 公共牌或 4-2-2 公共牌;你应该知道如何应对特定转牌圈的过牌 - 加注,或河牌圈的底池大小下注。

当然,像扑克这样复杂的游戏,尤其是 PLO,不可能制定出一个完整的计划。你不可能想出所有 270,725 种可能的起手牌,以及所有可能的牌桌场景 (单挑、3 人桌到 10 人桌、对手的倾向、筹码量等等) ,所有可能的翻牌、转牌和河牌 (如果不考虑底牌,则有 2,598,960 种组合) 和所有可能的下注场景。通常,当你开始学习和玩这个游戏时,你对游戏的玩法只有一个模糊的概念。你会模仿赢家的风格,或者参考互联网上的策略讨论。但仅仅模仿其他玩家的玩法并不能带来巨大的收益。你无法复制他们的整体策略,因为它太复杂了。所以你必须制定自己的游戏计划。

在没有完整描述的游戏计划的情况下,你必须根据原则做出决策。从博弈论的角度来看,你的策略中只有一个不变的因素:你总是希望做出能够保证最大价值的决策。但实现这一目标的方法有很多。

理论上,你可以找到两种方法:剥削策略和 GTO 策略。这两种方法在面对不同类型的对手时各有优势,一个实力雄厚的玩家应该能够同时运用这两种方法。你可能会选择剥削策略来对抗较弱的对手,而选择 GTO 策略来对抗非常强硬、善于思考的玩家。但最终,这两种策略是同一枚硬币的两面,因为它们都是最大化你的 EV 的方法。

剥削策略

我们首先要定义剥削策略。每种策略都应以最大化 EV 为目标,因此这两种策略之间的区别必定在于其他方面。当你试图剥削对手时,你的决策基于一个单独的因素,无论是你的牌还是对手的倾向,你都会试图通过发现对手牌局中的漏洞并基于这些假设采取最有利可图的玩法来最大化你的 EV。

假设有人在 EP 开池加注太多牌,并且每次 3-bet 都立即跟注。面对这样的对手,和 EP 只开池加注 15% 的对手相比,我们会在有利位置的情况下更多 3-bet。同样的原则也适用于翻牌圈之后。如果某人持续下注过多,并且在转牌圈和河牌圈都持续下注,我们更有可能选择慢玩强牌,在转牌圈或河牌圈过牌 - 加注,并在翻牌圈用弱听牌、对子加后门听牌或可能在转牌圈和河牌圈被超越的牌过牌 - 加注。

剥削策略会寻找对手的漏洞,并试图最大限度地利用它们。这会导致你的策略变得脆弱,因为你偏离了最佳博弈论方法。举一个简单的例子来说明这一点。假设你的对手如果过牌到你,他总是会在河牌圈对一个底池大小的下注弃牌。这个信息非常有用,因为你每次都可以在河牌圈做一个底池大小的诈唬,而他总是会弃牌。为了获得更多价值,你肯定需要不同的价值下注规模。虽然这种策略对付这个对手非常有效,但其他玩家可能会利用它。如果你用同样的策略对付他,他会知道一个底池大小的下注代表诈唬,而一个较小的下注代表价值下注。他总是会对你小于底池大小的下注弃牌,而当你下注底池时,他会跟注或加注。选择剥削策略,你就让自己变得容易被利用了。

由于剥削策略的重点是最大化你的利润,以对抗对手的漏洞,无论是身体暗示 (诈唬时脸红)、时机暗示 (诈唬快速下注,用超级坚果牌长考)、下注模式 (从不连续三枪下注诈唬) 还是其他类型的解读,剥削他人策略是一个脆弱而动态的过程。如果你的对手从未从错误中吸取教训,玩扑克就会容易得多,你的决策也更不容易出错。但他们确实会学习,并且会改进自己的游戏,有时甚至会利用自己的漏洞来对付你。让我们再来看看时机暗示的例子。你的对手意识到,当他用强牌长考,并快速用弱牌诈唬时,他露出了马脚,而且他知道你已经察觉到了这一点。于是他改变了策略,当他诈唬时,他开始长考,并快速对你进行价值下注,给出相反的暗示,并利用你的剥削策略。现在轮到他剥削你了。

这种动态过程有时被称为 “均衡战”。我知道对手知道我只用坚果牌使用时间银行,但既然他知道我知道,我就应该用坚果牌使用时间银行,因为他会认为我只在诈唬时使用。这与古希腊哲学家埃庇米尼得斯的 “说谎者悖论” 颇有相似之处,他曾说过:“克里特人总是撒谎。” 但他本人就是克里特人,所以他撒谎了,这意味着他讲的是实话。我们必须运用逻辑来解决这些难题。

归根结底,剥削玩法很大程度上依赖于直觉,因为你必须猜测真相。当你的决定错误时,你的策略就会失败。但逻辑在这里可以提供帮助。你可能不知道对手在某个特定场合是否在诈唬,但你或许可以分析他诈唬的频率。如果你知道他 70% 的时间用于价值下注,30% 的时间用于诈唬,你就可以利用这些信息来利用他。你不知道他是否在某个特定场合诈唬,但你可以根据他的诈唬频率计算出你的最佳跟注频率。如果他不是以 GTO 的方式诈唬,你就可以利用这个事实获利。这就是 GTO 打法的用武之地。

GTO 策略

GTO 策略的基本含义是,无论对手采取何种策略,都无法盈利,因为你的玩法是完美平衡的。由于你总是以理论上完美的频率进行游戏,对手跟注或弃牌没有差别,因为他的行动不会获得任何 EV。

GTO 策略是一种防御性策略,因为你不会专注于在特定场合最大化你的期望值。你更倾向于采用平衡策略,不让对手利用任何漏洞。假设你在河牌圈下注底池。在这种情况下,你应该在 67% 的时候价值下注,33% 的时候诈唬。你的对手无法通过跟注或弃牌赚钱,只要你的范围构建和频率控制完全正确。无论对手做出何种决定,他都只能保持收支平衡,至少理论上如此。一般来说,采用 GTO 策略,你需要创建具有最佳频率的完美平衡范围,这样你的对手跟注或弃牌没有差别,也无法使用剥削策略。

例如:你拿到 J-J-8-7-ss (单同花),并决定平跟一个松散的 UTG 开池玩家。翻牌是 J-9-9。你几乎知道对手会在每一轮转牌和河牌圈下注。面对一个玩法强硬的常客玩家,出于平衡考虑,你可能想在翻牌圈加注。你想在这种场合保持平衡,所以你决定在翻牌圈平跟,让你的牌看起来像是弱的 9-x-x-x 或对子和弱听牌。此外,你还想构建一个结构良好、难以对抗的加注范围。你可以用 J-J-x-x、A-9-x-x、Q-10-x-x 以及摊牌价值不大的弱同花听牌加注。为了保持你的跟注范围强大且受到保护,你可以用 J-9-x-x、弱的 9-x-x-x、Q-Q-10-x、K-K-10-x 以及其他具有摊牌价值的听牌进行平滑跟注。

另一方面,你可以肯定地认为,如果你开始用非常强的牌在特定场合加注以追求价值,而对强硬对手平跟,那么非常弱的对手不会很快察觉。对抗弱牌手时,你的游戏计划完全不会受到影响,因为弱牌手不会做出正确的调整。虽然你会选择在相同场合跟注强硬的常客玩家,以保持平衡并保持你的范围足够强以应对后续回合,但你更应该使用剥削策略来对抗弱牌手。

假设你拿到 J-J-5-5,你在 UTG 位置加注,一个非常弱的玩家在 BTN 跟注。翻牌是 J-J-5-r。对抗坚实的熟客玩家时,你应该在翻牌圈下注,就像你用几乎整个范围下注一样 (有些场合,你应该用 Q-Q-x-x+ 过牌 - 跟注翻牌圈来对抗特定类型的对手)。现在,一个非常弱的对手,不理解整体游戏计划的含义,会将牌玩的很明显。在这种情况下,你会在翻牌圈过牌,希望他能拿到听牌或对子,并在转牌圈或河牌圈凑成底葫芦。你还可以根据你认为他手上的牌以及他愿意支付的最大金额,调整你的下注大小,从而操纵他在转牌圈和河牌圈的跟注范围。

在这里,你可以看到剥削玩法和 GTO 玩法都是整体游戏计划的一部分。一个合理的游戏计划是这些策略的结合。正如我们上面所说,不可能为所有可能的情况制定一个明确的游戏计划。你必须理解游戏的原则并将其应用于具体情况,对一些标准情况进行深入分析,并在常见场合制定有利可图的频率和路线。这样,你就能为大多数标准场景制定出一个合理的游戏计划,并能够根据你的知识在困难的场合进行游戏。你应该以 GTO 的方式制定你的游戏计划,让自己难以被利用,并改变你对抗弱手的策略,利用他们的漏洞,产生更高的 EV。有些 (博弈论) 原则可以帮助你成为一名成功的玩家。

博弈论原则

位置意识

要制定合理的游戏计划,理解位置的价值至关重要。如果你决定进入底池,通常你在不利位置时需要有一个比在有利位置时更强的范围。在有利位置,你可以在每条街决定是下注、过牌还是加注。这让你能够控制底池的大小。由于对手必须先行动,你将在整手牌中拥有信息优势。

位置通常是决定是否 3-bet 还是平跟的一个因素。尤其是在深筹码 PLO 游戏中,在有利位置时,用任何可玩的牌 3-bet 基本上都不会错 (然而,平跟或许才是合适的玩法)。但是,当你处于不利位置时,你真的需要一手非常强、连接良好的牌来 3-bet。在很多翻牌圈,当你在有利位置时 3-bet,你可能会决定随后过牌,拿一张免费牌,从而更频繁地实现你的权益。当你在不利位置时 3-bet,看到一张对你范围来说非常糟糕的翻牌时,对手通常会下注,所以你无法免费看到转牌。

这会导致翻牌前位置的决策至关重要,并决定在前位、中位和后位玩哪些牌。当然,当弃牌到你在 BTN 位置可以玩的牌比在 UTG 位置玩的多得多。如果牌桌上都是高手,你需要一个完美的翻牌前和翻牌后游戏计划。然而,如果盲注位置的玩家较弱,如果 CO 和 BTN 没有过度跟注或 3-bet,那么在 MP 或 UTG 位置做较小的开池是有利的。在 9 人游戏中,你有时会在前位用某些牌——甚至是所有你想玩的牌——溜入,并计划用其中一些牌溜入 - 加注。不时检查你根据位置调整的整体胜率,以了解这个概念的重要性。

相对位置

在翻牌前防守盲注加注时,进攻方的相对位置是一个巨大的优势。假设 UTG 位置开池,CO 和 BTN 位置都跟注,而你在 BB 跟注补齐。在这种情况下,你是每条街第一个行动的人,但在翻牌圈,你将拥有相对翻牌前加注者的有利位置,因为如果他在翻牌圈下注,你是最后一个行动的人。

无论你想缠打、加注、跟注还是诈唬对手放弃底池,位置都很重要。占据有利位置会让你在每条街都拥有信息优势。如果你是翻牌前的激进玩家,并决定连续开枪三次,你可以决定是在河牌圈过牌 (如果你已经拿到了足够的摊牌价值击败对手的牌),还是把你的牌变成诈唬牌。通过随后过牌,你可以阻止对手在任何街加注。

众所周知,在 PLO 中,实现权益至关重要。面对一个从不在任何街下注或总是给你正确听牌赔率的被动玩家,没有理由不在翻牌前用任何牌跟注。因此,如果你的对手在不利位置,你应该尽可能地给他施加压力,阻止他实现权益。同时,你希望通过降低每条街被加注的风险来争取摊牌。

以下是一个例子

你在 BTN 用 A♥-Q♥-J♦-5♣ 加注,BB 防守。翻牌是 10♥-6♠-4♦。这个翻牌实际上并没有击中你的范围,你无法跟注过牌 - 加注。另一方面,这张翻牌的连接性相当强,而且由于 BB 翻牌前没有 3-bet,他不太可能拿到高牌。你可以假设他翻牌圈击中某些牌的次数比没有的次数多。更不用说他经常在这个翻牌圈过牌 - 加注,既可以诈唬,也可以追求价值。

想想哪些转牌可以提高你的权益或给你摊牌价值。任何 A、Q、J 或 5 都能让你组成对子;J♥ 和 5♥ 也能带来同花听牌。9 可以组成顺子听牌,K 可以组成小的包牌。这意味着你可以在 20 张转牌圈继续下注,跟注或加注,并在对手过牌时下注,如果下注没有价值或你认为对手可能会过牌 - 加注,也可以随后过牌。

如果你在转牌圈有 20 张补牌,这将改善你的牌型并让你有可能继续下注到河牌圈,那么 44.44% 的情况下,你会把翻牌圈的空气牌变成摊牌价值或不错的听牌。在 PLO 游戏中,了解你手中的牌在未来几街的可玩性至关重要,这通常决定了你是想继续下注诈唬,还是随后过牌以实现你的底牌权益。

现在,让我们将你的底牌改为 K-K-J-2-r。在这种情况下,你更倾向于在翻牌圈下注,作为一种诈唬,或者为了保护或价值,以诱使对手弃掉他范围中最弱的部分。你应该在这里下注,迫使他放弃他的权益,并防止你在转牌圈被诈唬掉最好的牌。如果你认为任何一张 A、9、8、7、5、3 或 2 都能完成听牌或给你的 K-K 带来一张高牌,那么有 27 张转牌 (概率为 60%) 可能会迫使你弃牌。

在这种情况下,翻牌圈你开始创建下注和过牌范围。为了保持平衡,你应该用最强牌和最弱牌都下注,并用中间的牌过牌,这可以在某些转牌圈获得丰厚的权益。你的一些牌组将不得不在糟糕的翻牌圈放弃,大多数转牌圈你只能过牌然后弃牌。

一如既往,下注、加注或过牌最重要的一点是,在脑海中有一个你想要代表的范围。正如本章开头所讨论的,面对非常弱的玩家,这并不太重要。然而,在与强势对手对战时,你确实需要制定一套完善的、没有漏洞的策略,使其不会被剥削利用。

一个很好的例子就是你在特定牌面结构下的翻牌持续下注频率,例如低连接度或锁定牌面,例如 4-5-8-r。如果你在 UTG 位置开池,你很少与这种牌面结构产生连接,因为你的开池范围更倾向于高牌。因此,除非你读懂对手在翻牌圈或者转牌圈和河牌圈面对持续下注弃牌太频繁,否则你根本不应该在这些牌面持续下注。更不用说你的对手很容易在翻牌圈缠打,然后在转牌圈下注,或这翻牌加注,因为他们认为你很少会继续跟注,这使得他的诈唬加注非常有利可图。

另一方面,你肯定领先于对手的范围,但你必须考虑你的 UTG 范围在这种翻牌圈结构下的可玩性。你需要制定一个针对特定范围的策略,该策略应该包括过牌 - 跟注或过牌 - 加注,而不是持续下注。如果你决定不在这些类型的翻牌圈下注,你的对手可能会开始频繁地用空气牌下注抢下底池,或者错误地进行价值下注或保护他的手牌。假设你在翻牌圈被加注的次数合理,过牌也能让你有更好的价格实现你的权益。

正如你所见,占据有利位置非常重要。最后行动,尤其是在多人底池中,能让你更好地了解对手的范围。面对 UTG 开池在 MP 或 CO ,你必须担心 BTN、SB 或 BB 的挤压;在某些情况下,最初的加注者甚至可能会反加。与其他位置相比,在 BTN 进行轻度 3-bet 更容易隔离弱手或剥削利用开池范围过宽的玩家。你将能够在翻牌圈不想下注随后过牌,在转牌圈和河牌圈实现权益,控制底池或在有利牌面诈唬。占据位置——或者至少是相对位置——是一个不容低估的巨大优势。

实现权益

本书最重要的主题之一是实现底池权益。这个概念对 PLO 至关重要,以至于人们可能会认为所有策略都是为了实现自己的权益并阻止对手实现其权益。

理解实现权益的概念将使您成为更强大的玩家。它是一个数学概念,是所有扑克行动和策略的基础。在 PLO 中,这个概念尤为重要,因为游戏中的牌型权益非常接近。您可能会想,如果权益如此接近,为什么玩家在实现权益方面会遇到困难?这正是 PLO 中的问题所在。在德州扑克中,如果您弃掉一手弱牌,通常只会损失一小部分底池,通常为 20% 或更少。在 PLO 中,即使是您认为是垃圾牌,与给定的底池赔率相比,也可能拥有巨大的权益。

人们常说,德州扑克中最大的错误是跟注过多。在奥马哈游戏中则相反:玩家最大的错误是弃牌过多。面对底池大小的下注 (PLO 中的最大下注额),你只需要不超过 33.3% 的权益就能继续游戏,理论上即使是边缘牌也能玩。当然,事情并非如此简单,PLO 中最大的问题是评估是继续游戏还是弃牌。

现在我们将定义 “冷热权益” 这个非常有用的概念,这将为后续讨论奠定坚实的基础。

冷热权益

冷热权益仅仅是玩家在一手牌特定时刻持有的牌的权益。这个时刻可以是任何时间点,但通常指翻牌前的权益。例如,假设你持有 A♠-A♥-K♣-J♣,而你的对手持有 6♥-5♥-4♠-3♠。你手牌的冷热权益在翻牌前为 55.61%。这是你在这手牌中没有进一步行动时的权益,不考虑牌局进行过程中可能出现的结果。

这对于 6-5-4-3 尤其重要,因为从可玩性角度来看,很多翻牌都很糟糕。假设你在 SPR 很高的情况下翻牌拿到了低同花听牌,并且没有再听牌。你的同花听牌可能仍然不错,但如果对手继续保持强势,你就得玩猜谜游戏了。面对更好的同花听牌,你可能已经听死牌了。因此,你在面对所有没有同花听牌的强牌时不得不弃掉大量潜在的权益,以避免被免费反超。你无法兑现自己的权益,因为你可能已被压制。

冷热权益指的是没有进一步行动的权益。让我们以前面的例子为例,仔细看看这些数字。

你在 CO 加注 6♥-5♥-4♠-3♠,BTN 3-bet,你跟注。你知道对手在 BTN 3-bet 的频率接近 12%。你面对这个范围的翻牌前权益是 42.15%。假设翻牌是 K♠-Q♠-2♥,给你一个同花听牌。问题就来了。你的权益是 37.7%,而他的 3-bet 范围只有 12%。除了后门同花听牌和后门顺子听牌之外,你最大的希望就是翻牌圈的同花听牌。问题在于评估对手有多少次拿到更高的同花听牌 (在这种情况下你几乎已经没机会了) 以及有多少次他没有同花听牌而你的权益还不错。

你的对手大约有 20.8% 的机会拿到更高的同花听牌,这会将你的权益降至只有 13.8%。如果他没有同花听牌,你的权益将接近 44%。因此,你的权益在 20.8% 的情况下是 13.8%,在近 80% 的情况下是 44%。这就引出了组合 EV 的计算,你必须根据频率来评估你的盈利能力。

除了比较手牌对抗手牌或手牌对抗范围的场景外,你还应该牢记对手和自己的范围。从游戏计划的角度来看,你需要观察你的整体范围在某些公共牌面的表现,以及你是否能够跟进。

你还应该进行范围对抗范围的分析,这样你就可以在多种公共牌结构中使用你的常规 3-bet 防守范围制定一个可靠的游戏计划。

我们将进一步讨论这些范围场景。目前,请确保你理解实现权益以及热冷权益的概念。

频率

频率在扑克中扮演着非常重要的角色。你应该了解它们的含义以及它们的用途。通常,频率与下注有关,例如持续下注、过牌 - 加注或诈唬的频率。所有这些频率加起来构成了总攻击频率,即玩家攻击性操作 (下注、加注) 的次数除以总操作 (下注、加注、跟注) 的次数。攻击频率高的玩家通常比攻击频率低的玩家更容易诈唬,尤其是在翻牌前玩得松的情况下。另一方面,当与非常紧的玩家或石头牌型的玩家对抗时,攻击频率可能会具有欺骗性。这些玩家通常攻击频率很高,但这并不意味着他们经常诈唬。由于他们只玩非常强的牌,因此大多数时候都拥有很高的权益,这使得他们在大多数公共牌结构上都能非常积极地游戏。

频率在当今游戏中最重要的用途与博弈论有关,特别是在特定街道 (尤其是河牌圈) 的下注频率。这是一个非常复杂的话题,因为对于诸如诈唬必须多少频繁才能盈利等问题,存在着不同的观点。

最简单的情况是,摊牌时你赢得底池的机会为 0。你唯一的获胜机会就是诈唬,你必须确定你的诈唬成功的频率。这个问题有一个简单的解决方案,它与底池赔率直接相关。如果你在 $100 的底池中下注 $100,那么你必须至少有 50% 的概率诈唬成功才能收支平衡。从博弈论的角度来看,更广泛地看待诈唬和下注频率时,收支平衡点或无差异点非常重要。

上述模型可以通过三种方式简化。首先,你通常不会在河牌圈拥有 0 权益。你通常至少会有一些权益。并且你通常会有一个诈唬范围和一个价值下注范围。其次,你通常不会在这种简化的条件下游戏。例如,上述场景假设你的对手永远不会加注。最后,你手中不仅仅有诈唬牌。你还有价值牌,你想用这些牌来下注以求价值。这会极大地改变局面,因为从博弈论的角度来看,诈唬就是平衡你的价值范围和你的下注行为。

如果你从不诈唬,只用强牌下注,那么聪明的对手会对你所有的下注弃牌,除非他非常确定自己有一手更强的牌。而如果你过牌,他会知道你没有强牌,所以他每次都会诈唬,把你从底池里赶走。因此,始终拥有一个包含强牌和诈唬牌的混合下注范围非常重要。你也应该用一个包含强牌和中等强牌的平衡范围过牌。让我们来试着计算一下如何计算合适的下注频率。

最佳诈唬比率的真正价值在于,你变得难以被剥削利用,因为它会让你的对手在跟注和弃牌之间变得没有差别。最佳诈唬频率取决于你价值下注的频率以及你选择的下注金额。如果你的牌力非常均衡,你就不会被剥削,对手对弃牌或跟注变得没有差别。如果底池已经很大,这是一个相当不错的结果,因为你的对手不得不冒很大的风险,而且没有正预期。我们现在将解释如何计算最佳下注和诈唬频率。

需要考虑的因素包括:

  • p:你持有最佳牌型的概率
  • b:诈唬频率
  • P:底池大小
  • B:你的下注大小
  • y:跟注频率

博弈论认为,如果对手所有选项 (在本例中为跟注或弃牌) 的 EV 相同,则你的诈唬频率为最优。因此,他对你的价值下注和诈唬的 EV (或者从对手的角度来看,他的跟注和弃牌选项) 必须相等,从而得到理想的诈唬频率。EV 是你摊牌获胜时的 EV 加上你诈唬时的 EV 之和。让我们先分别分析一下这些情况,然后再综合起来。

我们有以下几种情况:

[1] 你持有获赢牌,并进行价值下注。你的 EV 为:

E(w) = y(P+B) + (1-y)P

这个 EV 计算相当简单。第一项是对手跟注的概率乘以你在该情况下的赢利。第二项是他弃牌的概率乘以底池大小。

[2] 当你持有输牌时,公式会更加复杂。在这种情况下,EV 为:

E(l) = (1-b)(0) + b[(1-y)P - yB]

第一部分反映了你没有用输牌诈唬的情况 (1-b),因此你放弃并且无法获胜,你的 EV 为 0。第二部分涵盖了你用输牌诈唬的次数。你的对手以 (1-y) 的频率弃牌,你赢得了底池。他以 y 的频率跟注,你输掉了底池和你的下注。第一项为 0,因此你可以将等式简化为:

E(l) = b[(1-y)P - yB]

[3] 你下注,对手弃牌。如果对手从不跟注 (y = 0) ,你的 EV 就是 E (l, y=0) = bP,这意味着你每次下注都会赢。因此,你应该始终诈唬以最大化你的价值。另一方面,如果对手总是跟注,你也不应该诈唬,因为你的 EV 将是 -bP。

在上面的等式中,我们假设你的对手要么总是跟注,要么总是弃牌,并且你总是持有赢牌或输牌。从博弈论的角度来看,这些就是所谓的纯策略。这些假设在现实扑克中很少成立。你的对手会以不同的概率跟注,从而导致所谓的混合策略。

博弈论告诉我们,诈唬频率和跟注频率之间始终存在一种均衡,即无论对手选择哪种策略,诈唬频率 (b) 和跟注频率 (y) 的收益都相同。我们分别将这些值称为最优诈唬频率和最优跟注频率,分别为 b(opt) 和 y(opt)。如果对手以最优频率跟注,那么他选择哪种频率跟注或弃牌都没有差别,因为如果你以最优频率 b(opt) 诈唬,他的 EV 始终相同。这样,无论选择哪种方式,他都能获利,因为他的 EV 根本不会改变。这就是完美平衡策略的巨大威力。

最优跟注频率可以通过求解 y(opt) 的以下方程来计算:

[1 - y(opt)]P - y(opt)B = 0

因此,最优跟注频率为

y(opt) = P/(P+B)

非常有趣的是,最优跟注频率与你的诈唬频率无关,而仅取决于底池赔率。这是因为你的最优跟注频率会让你的对手对他选择的策略漠不关心,他的行动既不会增加也不会减少他的预期收益。最优跟注频率 y(opt) 仅取决于底池大小和下注额。这也表明,最优跟注频率并非总能带来最高的 EV。它只是阻止了你的对手从你的价值下注和诈唬中获利。

这就是我们之前提到的 GTO 打法和剥削性打法在策略方法上的区别。如果你知道你的对手要么总是诈唬,要么从不诈唬,你就必须适应这一点,并针对他的打法选择正确的策略。但如果他使用混合最优策略,你可以用以下公式计算你的应对策略。我们可以计算出对手眼中你最佳诈唬频率 b = b(opt):

E(opt) = -pyB + p(1-y)(0) + (1-p)[by(P+B) + b(1-y)(0) + (1-b)P]

让我们一步一步地解释这个等式。整个 EV 是上述各项 EV 的总和。第一项涵盖了你持有赢牌,你下注,他跟注输掉的情况。第二项计算了你持有赢牌,他弃牌,他的 (0) 回报。其余项处理他领先的情况。在第一项中,你诈唬,他跟注,赢得了底池和你的下注。在第二项中,他持有最好的牌,但弃牌,让你赢得了底池。在最后一项中,你放弃,他毫无争议地赢得了底池。消去零项后,公式如下:

E(opt) = (1-p)[by(P+B) + (1-b)P] - pyB

由于当你选择正确的诈唬频率时,他的跟注频率的 EV 无差别,因此 y = 0 和 y = 1 必然得出相同的值。由此可得出最佳诈唬频率:

b(opt) = pB/[(1-p)(P+B)]

我们来试试这个公式。假设我们有一半的时间可能拿到最好的牌,并会进行底池大小的下注。在这种情况下,我们也应该有 50% 的时间进行诈唬。

b = 0.5/(1-0.5) (1/1+1) b = 1(0.5) = 50% b = 50%

如果我们在一半的时间里拿到最好的牌,并决定下注半个底池,会发生什么变化?我们来计算一下。

b = 0.5/(1-0.5)(0.5/1+0.5) b = (1)(0.33) = 33% b = 33%

如果你下注半个底池,你应该少诈唬,多价值下注,因为你的对手更倾向于跟注。如你所见,你的下注大小甚至会影响你的诈唬频率。你下注越小,你的诈唬频率就应该越低,反之亦然。这是因为你给了对手更好的底池赔率。

我们再举一个例子。你有 30% 的概率拿到最好的牌,并且会进行一个底池大小的下注。那么你的诈唬频率应该是:

b = [(0.3)(1)/0.7]/(1+1) = 0.214 b = 21.4%

如果你有 30% 的几率拿到最佳牌,并且以 21.4% 的频率用底池大小的下注诈唬,那么无论对手跟注或弃牌的频率有多高,他都无法从你身上获利。但只要你的诈唬频率偏离最优值,并且对手察觉到了这一点,他就能获利。如果你的诈唬频率低于 21.4%,他应该总是弃牌。相反,如果你的诈唬频率高于 21.4%,他应该总是跟注。由于你没有选择最优频率,他就能利用你。同样,当对手跟注频率不正确时,你可以通过调整你的诈唬频率来利用他。

这就是最优策略的真正含义:如果你使用最优频率,你的对手将无法利用你,也无法找到对付你的更高 EV 的策略。这些最优诈唬和跟注频率,分别为 b(opt) 和 y(opt),提供了不可利用的策略,并形成了所谓的纳什均衡。要知道,只有在对手无法从你身上获得 EV 的情况下,它们才是最优的。

了解对手是否以最优频率跟注,或者他是否容易被利用,这一点非常重要。如果他是一位非常优秀的玩家,并且频率均衡,你应该用最优频率诈唬。否则,你可以通过找到针对他策略的最佳应对策略来利用他。如果他跟注过多,那么你应该少诈唬,多做价值下注;如果他弃牌过多,那么你应该多诈唬。

总结

  • 最优诈唬频率的目的是让对手在跟注和弃牌之间无差别。
  • 通过以最优方式诈唬,你的诈唬权益将能够持平 (纳什均衡)。
  • 最优诈唬频率会让你无法被利用。
  • 博弈论中的诈唬和跟注频率,只有当你的对手也以最优方式玩牌时才是最优的。
  • 剥削性策略在面对非完美频率时具有更高的 EV。