GPT의 도움을 받아 엄청 긴호흡으로 써봄.
오로지 내 생각의 흐름을 바탕으로 정리한 거라 오류가 있을 수 있음.
개인적으로는 토너먼트 GTO(ICM모델포함)의 맹점을 짚고, GTO를 활용하는 방식을 재검토할 수 있는 꽤 혁신적인 이론이라고 생각함.
1. 서론: GTO는 언제나 최선인가?
GTO, 즉 Game Theory Optimal. 포커 전략 이론에서 GTO는 "상대가 어떤 전략을 쓰더라도, 나에게 손해가 되지 않는 완벽한 균형 전략"으로 널리 알려져 있다. 특히 캐시게임에서는 반복 가능한 구조 덕분에 GTO 전략을 따르면 안정적인 수익이 가능하다는 인식이 강하다. 그래서 많은 플레이어는 GTO를 일종의 '정답'처럼 받아들이고, 그대로 따르는 것이 가장 안전하다고 생각한다.
하지만 토너먼트는 다르다. 칩이 곧 돈이 아닌 구조에서, 생존과 순위가 기대값에 개입한다. 한 플레이어의 탈락이 다른 플레이어의 EV에 영향을 주는 비선형적 구조에서는, GTO 전략이 항상 나에게 최선이 되지 않을 수 있다.
이 글은 GTO라는 이론이 토너먼트 환경에서는 어떤 한계를 갖는지, 그리고 실전 전략 구성에 있어 어떤 시야 전환이 필요한지를 살펴보려는 시도다. 단지 수학적으로 존재하는 균형이 아니라, 실제로 도움이 되는 전략이 무엇인지 묻는 여정의 시작이다.
2. GTO의 이론적 구성 요소
GTO(Game Theory Optimal) 전략은 이론적으로 포커라는 게임 내에서 '이길 수는 없지만, 지지도 않는' 전략을 의미한다. GTO 전략은 상대방이 어떤 전략을 사용하든지 간에, 나에게 손해가 발생하지 않도록 설계된 전략적 균형점이다.
이 전략은 단순한 계산 결과 이상의 구조를 지닌다. 그 안에는 포커라는 게임의 수학적 성질, 상대의 선택 가능성, 무한 반복에 따른 평균 기대값 등이 복합적으로 엮여 있다. 따라서 GTO는 이론적 완전성이라는 상징을 획득하며, 많은 플레이어들에게 '전략의 종착점'처럼 받아들여지곤 한다.
그러나 GTO가 진정한 전략의 종착점이 되기 위해서는 두 가지 조건을 만족해야 한다. 첫째, GTO는 상대방의 EV(기대값)를 억제해야 한다. 둘째, 동시에 자신의 EV를 극대화할 수 있어야 한다.
이 두 조건은 겉보기엔 조화를 이루는 것처럼 보이지만, 실전에서는 이 둘이 충돌하는 경우가 발생한다. 특히 토너먼트라는 구조에서는 이 균형이 무너지기 쉬운 환경이 자주 등장한다.
반면, 캐시게임에서는 이 두 축이 완벽하게 양립한다. 칩이 곧 돈이고, 상황은 반복되며, ICM이나 순위 EV가 개입되지 않기 때문이다. GTO를 따르면, 상대가 어떤 전략을 쓰든 상관없이 장기적으로 수익이 쌓이는 구조다. 그래서 캐시에서는 GTO가 곧 전략의 기준이자 최적점으로 받아들여진다.
하지만 토너먼트에서는 이 구조가 흔들린다. GTO 전략을 수행하는 것이 상대의 EV를 억제하는 데에는 성공할 수 있어도, 나의 EV를 희생하게 만드는 상황이 발생할 수 있다.
이 글이 다루고자 하는 바로 그 지점이 여기다.
전략이 이론적으로 균형을 이루었다고 해서, 그것이 곧 실전 수익의 극대화로 이어지는 것은 아니라는 사실. 우리는 지금, 그 균형의 이면을 들여다보려 한다.
3. ICM이 만드는 전략적 왜곡
GTO가 작동하는 전제는 칩이 일정한 가치를 지니며, 그 가치가 승자에게 그대로 전이된다는 구조 위에 세워진다. 이 전제는 캐시게임에서는 완벽하게 성립하지만, 토너먼트에서는 그렇지 않다. 토너먼트 구조는 칩의 절대 가치를 부정하며, 대신 상대적 생존성과 순위 기반 보상 구조에 따라 칩의 가치를 왜곡한다.
이 왜곡을 수치화하려는 모델이 바로 ICM(Independent Chip Model)이다. ICM은 각 플레이어의 칩 보유량을 바탕으로 현재 상황에서의 '상대적 순위 기대값'을 계산한다. 이때 중요한 점은, 칩 EV와 실제 EV가 일치하지 않는다는 사실이다.
칩이 많다고 해서 실전적으로 EV가 높은 것이 아니며, 때로는 소극적으로 플레이하며 생존을 선택한 쪽이 더 큰 EV를 얻는 상황도 빈번하다. 한 플레이어의 탈락이 다른 플레이어의 수익으로 직결되는 구조에서는, 교전 자체가 다른 이들의 이득이 되는 경우도 발생한다.
이런 구조 속에서 GTO는 균형 전략을 도출하려고 시도하지만, 그 균형이 '자신의 EV 극대화'를 보장하진 않는다. 오히려 전략적으로 타당해 보이는 행동이 구조적으로 손해를 낳는 상황이 생긴다.
ICM-GTO는 존재한다. 하지만 이 GTO는 더 이상 캐시게임에서의 그것과 같은 성질을 지니지 않는다. 그 전략은 상대의 EV를 억제하는 데는 성공할 수 있으나, 내 EV를 희생할 수 있는 구조적 가능성을 내포한다.
GTO가 여전히 전략의 기반이 될 수는 있지만, 그 기반 위에 세워진 균형이 실전에서 항상 나에게 유리하다는 보장은 없다. 이 점이 바로 토너먼트 GTO의 작동 방식이 구조적으로 흔들리는 지점이며, 그 흔들림은 ICM이라는 틀에서 기인한다.
4. 실전에서 벌어지는 균형의 붕괴
이론에서 말하는 균형은 수학적으로 정합하다. 하지만 포커는 테이블 위의 사람들이 만들어내는 심리적, 전략적 동학의 게임이며, 실전에서는 이 균형이 예기치 않게 무너진다.
예를 들어보자. 파이널 테이블 6인, 스택 분포는 20bb~80bb. ICM에 대한 이해도가 전혀 없는 어그레시브 웨일이 30bb 정도의 스택 뎁스를 가지고 매우 루즈한 레인지로 오픈 / 콜 / 3벳을 하고 있다. 거의 폴드를 선택하지는 않는 상황.
평균 스택은 50bb. 나는 EP에서 50bb를 들고 있고, 손에 든 카드는 AQ offsuit다. GTO 차트 상으로는 이 핸드는 오픈에 적합하고, 상대의 셔브에 대해서도 콜이 가능한 핸드다.
그러나 문제는 이 오픈 자체가 특정 상황에서는 구조적으로 비수익적일 수 있다는 점이다. ICM 구조에서는 내가 오픈을 하고 뒤에서 광범위한 레인지로 셔브가 들어오면, 그 셔브에 콜을 하든 폴드를 하든 모두 실질적인 EV 손실이 발생할 수 있다. 심지어는 셔브가 들어왔을 때 콜을 해서 이기더라도, 탈락한 플레이어의 기대값은 다른 생존자들에게 분산된다.
즉, 내가 GTO적으로 맞는 액션을 했음에도 불구하고, 위험을 감수한 나보다 아무 행동도 하지 않은 플레이어들이 더 많은 EV를 얻는 아이러니한 구조가 발생하는 것이다.
토너먼트의 비선형적 가치 구조는 이러한 선택을 손해보는 플레이로 전환시킨다. 이처럼 균형 전략이 더 이상 내 수익을 보장해주지 않는 순간들이 분명히 존재한다.
이것이 바로 이론의 균형과 실전의 균형이 충돌하는 지점이며, 우리가 그 균열을 직시해야 하는 이유다.
5. 기존 이론의 한계와 침묵
이론은 알고 있다. GTO 전략이 토너먼트 상황에서, 특히 ICM이 강하게 작동하는 구조 안에서는 실전 EV 손해를 초래할 수 있다는 점을. 수많은 GTO 기반 솔버와 토너먼트 전용 툴에서도 이 사실은 전제 조건으로 암묵적으로 깔려 있다. 하지만 이상할 정도로 이 현상은 개념적으로 정리되지 않는다.
'GTO는 손해를 보지 않는 전략'이라는 구호는 여전히 반복되고, 플레이어들은 그것을 맹목적으로 따르기도 한다. 이는 마치 이론이 알고 있는 불완전함을 말하지 않은 채, '그럼에도 불구하고 GTO는 기준이다'라는 태도로 일관하는 것처럼 보인다.
그 결과, 실전에서는 전략적 판단이 멈추는 순간들이 생긴다. 특정 스팟에서 "이건 GTO니까 정답"이라는 말과 함께 액션이 확정되고, 그 뒤에 따르는 위험 구조나 손해의 분포는 더 이상 논의되지 않는다. GTO는 전략의 사고를 멈추게 만드는 '정답주의'로 오용될 위험을 갖고 있다.
균형이라는 단어는 실제로 '균형'을 보장해주지 않는다. 실전에서 중요한 건 언제나 '내 EV의 보존과 성장'이다. 그런데 기존 GTO 이론은 그 균형이 내 EV에 미치는 영향을 구조적으로 분해하거나, 그것을 의심하도록 유도하지 않는다.
ICM-GTO 역시 존재하지만, 그것이 실전 수익과 어떻게 어긋날 수 있는지를 명시적으로 설명해주는 구조는 부족하다. 결국 실전 플레이어는 GTO라는 프레임 안에서, 그 균형이 나에게 불리하게 작동하는 순간조차도 '이론적으로 옳기 때문에' 따르게 된다.
이런 침묵과 회피가 바로 기존 이론의 가장 큰 한계다. 전략이 단지 이론적으로 정합하다는 이유만으로 최선이 되는 건 아니다. 우리는 그 이론의 빈틈을 말할 수 있어야 하고, 때로는 그 균형 자체를 의심할 수 있어야 한다.
6. 제안: 실전 토너먼트 전략의 새로운 프레임
지금까지 우리는 GTO 전략이 토너먼트 환경에서 균형은 유지할 수 있어도, 내 EV의 극대화를 항상 보장하진 않는다는 사실을 살펴보았다. 그렇다면 우리는 어떤 전략적 관점 위에 서야 할까? 이 장에서는 GTO에 대한 새로운 접근법을 제안하고자 한다.
첫째, GTO는 절대적인 기준이 아니라 전략 설계의 출발점 중 하나로 인식되어야 한다. 수학적 균형은 중요한 지점이지만, 그것이 실전 수익을 자동적으로 만들어주는 마법의 솔루션은 아니다. GTO는 특정 이상 조건 하에서 유효하며, 현실의 변수와 왜곡된 보상 구조(ICM 등)를 모두 포함하지 않는다.
둘째, 전략의 중심을 '상대의 EV 억제'가 아니라 '나의 EV 극대화'로 이동시켜야 한다. 기존 GTO는 상대의 최적 대응에 맞서는 안전한 전략을 제공한다. 하지만 토너먼트에서는 손해를 감수하고라도 '상대보다 오래 살아남는 것', 또는 '제3자의 실수를 유도하여 수익을 극대화하는 것'이 실제 목표가 된다.
셋째, 균형이라는 개념 자체를 맹신하지 말아야 한다. 균형은 정지된 구조 안에서 유의미하지만, 토너먼트는 끊임없이 변화하는 스택 구조, 포지션, 상금 분포 속에서 역동적으로 작동하는 게임이다. 그 안에서 전략은 유연하게 조정되어야 하며, 경우에 따라 '균형을 일부러 깨뜨리는 것'이 더 높은 EV를 가져올 수 있다.
마지막으로, 실전 전략은 단순히 이론을 구현하는 데에 그쳐선 안 된다. 오히려 이론이 실전의 요구를 따라가야 하며, GTO는 실전 데이터를 통해 끊임없이 재검토되어야 한다. '이건 GTO니까'라는 말로 판단을 멈추는 순간, 전략은 더 이상 살아 있는 도구가 아니다.
결국, 실전 토너먼트에서의 전략적 프레임은 '이론의 충실한 복제'가 아니라, '이론을 의심하고 변형하는 감각'에서 비롯된다. 그것이 우리가 진정으로 추구해야 할 포커 전략의 방향이다.
7. 비판에 대한 반박
GTO에 대한 비판적 재구성은 언제나 반론을 불러온다. 이 장에서는 예상 가능한 대표적인 반박들에 대해 정리하고, 그에 대한 전략적 대응을 제시한다.
1) "GTO는 원래 내 EV 극대화가 아니라, 상대 EV 억제가 핵심이다"
이 주장은 수학적으로는 맞다. GTO의 정의는 "상대가 어떤 전략을 쓰든 손해를 보지 않는 균형 전략"이다. 하지만 실전 포커는 단순한 수학이 아니다. GTO가 실전 전략으로 의미를 가지려면, 그것이 내 수익을 실제로 만들어줘야 한다. 수학적 정합성만으로 실전 전략의 유효성이 보장되진 않는다. 이론이 아닌 현실에서, 우리는 내 EV의 결과로 전략을 평가해야 한다.
2) "ICM-GTO는 이미 그런 점을 반영한 조정된 GTO다"
그렇다. ICM-GTO는 칩 가치의 비선형성을 반영한 균형 전략이다. 하지만 ICM-GTO도 여전히 상대 EV 억제를 우선하는 계산 결과일 뿐이다. 그리고 중요한 점은, 이 전략이 항상 나의 EV 극대화로 이어지지 않는다는 데 있다. 즉, GTO는 여전히 부분적인 해답일 뿐이며, 실전 상황에서는 언제나 그 전략의 EV 구조를 직접 해석하고 판단하는 과정이 병행돼야 한다.
3) "결국 실전에서는 GTO든 아니든 조정은 필수다. 너의 주장은 결국 뻔한 말 아냐?"
표면적으로는 그렇게 들릴 수 있다. 하지만 차이는 조정의 출발점이 어디냐에 있다. 대부분은 GTO를 '기준'으로 두고 그 위에서 조정을 논의한다. 반면 우리가 말하는 관점은 GTO 자체를 조건적으로 수용한다. 상황에 따라 GTO를 완전히 넘어서야 할 수도 있다는 사고 전환이다. 이는 단순한 조정이 아니라, 전략 설계 철학의 변화다.
4) "결국 GTO든 뭐든, 상황 따라 조정하는 건 똑같잖아. 그럼 다를 게 뭐야?"
이 비판은 단순한 반론이 아니라, 실제로 많은 실전 플레이어들이 갖고 있는 핵심적인 의문이기도 하다. 어차피 실전에서는 GTO든 exploit이든 상황에 따라 조정해야 하는 게 필수라면, 굳이 GTO를 비판적으로 재검토할 필요가 있는가?
이 질문이 중요한 이유는, 이 반론이 전략 설계의 출발점과 사고 구조 전체에 대한 질문이기 때문이다. 즉, 우리는 단순히 전략을 '조정하느냐 마느냐'가 아니라, 무엇을 기준 삼아 조정하느냐를 묻고 있다.
많은 이들은 GTO를 전제로 깔고, 그 위에서 조정을 이야기한다. 마치 GTO는 절대 틀릴 수 없는 기준이고, 현실이 그것에 맞지 않으면 조정하는 것이라는 식이다. 이때의 '조정'은 본질적으로 GTO를 중심에 두고 움직이는 파생 행동이다.
하지만 우리가 제안하는 전략적 사고는, GTO를 반드시 중심에 둘 필요가 없다는 전제에서 시작한다. 우리는 먼저 상황의 EV 구조를 분석하고, 필요하다면 처음부터 GTO 자체를 우회하거나, 의도적으로 그것을 깨는 플레이도 전략의 일부로 포함시킨다. 이는 단순한 수동적 '조정'이 아니라, 주체적인 전략 재설계다.
결론적으로, 전략의 행위 자체보다 중요한 것은 그것이 어떤 철학과 구조 위에서 만들어졌는가이다. 같은 액션이라도, 그 출발점이 수동적인 이론 수용인지, 능동적인 전략적 의심과 설계인지에 따라 플레이어의 사고 깊이, 리딩 능력, 리스크 대응 방식이 달라진다. 실전에서 이 차이는 곧 퍼포먼스의 차이로 이어진다.
결국 이 모든 반박은 GTO의 유용성을 부정하려는 것이 아니다. 우리는 GTO를 비판하는 것이 아니라, GTO를 절대화하는 전략 사고의 습관을 경계하는 것이다. 그리고 실전에서 살아 있는 전략이 되기 위해, 그 균형조차 의심하고 재해석할 수 있어야 한다.
8. 결론: GTO 이후의 전략
GTO는 여전히 강력하고 유효한 전략 이론이다. 수학적으로 정합하며, 캐시게임과 같은 고정 구조의 게임에서는 탁월한 수익 안정성을 제공한다. 하지만 토너먼트라는 구조는 이론과 현실 사이의 균열을 드러낸다. 칩의 가치가 비선형적으로 작동하고, 한 사람의 탈락이 제3자의 이익으로 환산되는 환경 속에서, GTO는 더 이상 절대적인 전략 기준이 될 수 없다.
토너먼트에서의 전략은 단지 균형을 맞추는 것을 넘어서야 한다. 플레이어는 상황에 따라 균형을 일부러 깨뜨려야 할 수도 있고, 상대가 비GTO적 플레이를 할 때 더 적극적으로 전략을 재조정해야 할 수도 있다. 이 모든 상황을 관통하는 기준은 단 하나다: 나의 EV를 최대화할 수 있는가?
따라서 우리는 GTO를 성역화하지 말고, 도구로서 활용해야 한다. 이론은 중요하지만, 실전의 데이터와 상황을 중심에 두고 전략을 설계해야 한다. GTO를 전략의 종착점이 아닌 출발점, 혹은 참고 기준으로 다시 위치시키는 것이야말로, 토너먼트 플레이어가 가져야 할 성숙한 전략 태도다.
균형은 목표가 아니라 수단이다. 진짜 목표는 수익이다. 수익을 위해서라면, 때로는 이론적 균형도 벗어날 수 있어야 한다. 그것이 포커의 진짜 전략이고, 토너먼트의 복잡한 역학을 이겨내는 실전 감각이다.
2025.04.10 21:11:28
일단 장문추
추가 댓글은 읽고 나서 ㅎㅎ
2025.04.10 21:17:06
챗지피티한테 요약해서 써달라하자
2025.04.10 21:18:03
@매드제이
1. 토너먼트에서는 GTO 전략이 항상 내 EV를 극대화하지 않으며, 균형 자체가 실전 손해로 이어질 수 있다.
2. ICM 구조 속에서는 전략의 중심을 '상대 억제'가 아니라 '내 생존과 수익'으로 재정립해야 한다.
3. GTO는 정답이 아니라 참고 도구이며, 실전 전략은 이를 넘어선 판단력과 유연함을 요구한다.
2025.04.10 21:18:37
@Eussit
와씨 감사 추천함
2025.04.10 21:19:17
@Eussit
사실 토너의 경우 사실상 테이블 밸런싱 되기 전까지의 플레이어 익스플로잇 존나 중요한듯
2025.04.10 21:20:00
@Eussit
그리고 ICM이 개입되는 순간 AA폴드 같은 선택지도 그렇고 엄청나게 차이 나는듯
2025.04.11 13:58:53
@매드제이
어떤 ICM이 개입되도 AA폴드는 없지않나요? 새틀라이트 제외하구요
2025.04.11 14:47:19
@배지안
난 있다고 보는데 아닌가
2025.04.10 21:18:23
5번까지 읽다가 감탄하면서 BB 누르고 계속 읽습니다.
중간중간 명문이 많네요. 저도 "이거 GTO임 ㅇㅇ 반박불가" 이러고 거기서 그냥 뇌를 멈춰버리는 사람들을 톡방이나 온라인에서 너무 많이 봤는데 칩 != True EV라는데 동의합니다
GTO가 내부적으로 어떻게 작동하는지에 대한 이해나 의심 없이 그냥 하는 사람들이 너무 많습니다
2025.04.10 21:20:27
특정핸드 X를 플레이 했을때 내가얻는 $EV가 남들이 얻는 $EV보다 적은 상황이 존재하는데, 내 +$EV를 포기해야할 타당한 이유를 순수 게임이론내에서 증명 가능함?
2025.04.10 21:24:45
@호옹이
문장이 의미하는 바가 뭔지 좀 헷갈림. 다시 댓점
2025.04.10 21:29:48
@Eussit
'심지어는 셔브가 들어왔을 때 콜을 해서 이기더라도, 탈락한 플레이어의 기대값은 다른 생존자들에게 분산된다.
즉, 내가 GTO적으로 맞는 액션을 했음에도 불구하고, 위험을 감수한 나보다 아무 행동도 하지 않은 플레이어들이 더 많은 EV를 얻는 아이러니한 구조가 발생하는 것이다.'
2025.04.10 21:35:11
@호옹이
? 뭔가 좀 이상한데.
본문에 셔브 상대로 항상 이긴다고 기술되어있진 않잖아.
콜해서 이긴다고 하더라도 $EV가 적다는 것은, 셔브 상대로 승리했을때의 기댓값이 엄청나게 낮아지는 모델임을 표현하고자 했던 예시임.
이겼는데도 EV가 적다는 건 그만큼 리스크-리워드 비가 나빠졌다는 구조적 시그널이고, 오픈이라는 전제부터 다시 검토해야 한다는 말임.
2025.04.10 21:36:36
@Eussit
그건 맞고 ICMizer에서 나머지 풀고 한명 레인지 락하면 바로 결과나옴
그렇다면 결국 'GTO는 nonGTO상대 MES가 아니며 어드저스트 한 결과값이 MES'라는 명제로 한줄요약되잖아.
2025.04.10 21:38:34
@호옹이
+인 icm ev값 조차도 그 ev값이 분산될 수 있기에 폴드가 가능하다는거 아님? 물론 글을 다 읽진 못함
2025.04.10 21:39:38
@A하이콜
나도 본문(GPT)이 그렇게 서술했기때문에 그에대한 오류를 지적한거임. 결국 9명중 나는 +1이고 나머지 +2고(매우 간략한 단순화) 한명이 -15 펀트 했을때 이걸 거부할 이유가 심리적인 띠꺼움 말고 없잖아?
2025.04.10 21:41:49
@호옹이
글을 다 읽진 못했지만 토너에서 마지널한 +$ev값은 충분히 복합적으로 고려할 필요는 있는 것 같음
엄연히 스택사이즈에 따른 엣지가 다르니까 퓨처게임이 좀 더 중요해서
근데 님 말대로 이걸 이론적으로 증명이 가능하냐? 하면 현재 툴로서는 그걸 증명할 방법은 없겠지
근데 케니, 홀츠, 치드윅 인터뷰 들어보면 그 부분을 제일 강조하고
그래서 토너는 아직 초하이스테이크 사이에서도 엣지가 남아잇다는 식으로 얘기하더라고
2025.04.10 21:50:36
@호옹이
아니 댓글 쓰다보니까 문득 깨달은건데 이게 상대가 애니핸드 셔브를 하는 웨일이라고 가정하면 우리가 극단적으로 오픈을 덜 해야 하는게 맥스+$ev 전략인데, 이건 GTO를 개혹사시켜도 도출이 안될 것 같은데? 결국 넓게 콜해라밖에 도출안될거같은데? 한번 돌려줄 수 있나?
2025.04.10 21:51:33
@Eussit
그에 대한 MES는 바로 도출됨. 프리플랍 애니핸드셔브 웨일 락하고 나머지 풀면 나머지 균형전략 바로 나옴
2025.04.10 21:53:18
@호옹이
웨일이 뒷포지션이라고 가정하고, 한번만 돌려주라 결과값점보게
나 아씨마이저 구독끝난지 좀 됐음
2025.04.10 21:54:00
@Eussit
나도 없음
2025.04.10 21:47:17
@호옹이
솔직히 예시가 조금 부적절했을 수도 있다고 보긴 함.
실전에서라면 뭐 이 전제를 깔던 안 깔던 레인지 락 걸고 ICMizer로 최적 조정해버리는 건 당연한 수순이고, 그 조정이 들어가면 내 ev 극대화 전략도 자연스레 도출되지 않을까 싶음(안돌려봐서 모르겠음). 근데 노드걸면 내 오픈 자체가 얼마나 타이트해질지 궁금하네.
근데 애초에 노드를 걸어도 이전 스트릿이 변화가 되나? 난 안되는걸로 알고있는디
어쨌든 그럼에도 본문의 주장 자체에는 큰 변화는 없을듯
핵심은 토너먼트 환경에서 GTO는 상대 EV 억제라는 한 측면만을 달성하고, 정작 내 EV의 최댓값 증대라는 본질적인 목표를 놓치는 전략적 착시로 작동할 수 있다는 거고, 그걸 타파해야 한다는 거기에
2025.04.10 21:53:23
@Eussit
그래서 내가 말한건 '본문의 예제는 잘못되었으며 이는 GPT의 할루시네이션 현상으로 보인다'는 거고
굳이 토너먼트 GTO 가져올 필요 없이 캐쉬에서도 얼리스트릿에서, 예제를 들면 UTG RFI에서 믹스핸드의 대부분은 비하인드 플레이어들의 액션의 영향을 매우 크게 받지
2025.04.10 21:54:42
@호옹이
ㅇㅋ일단접수
2025.04.10 21:40:04
다 읽진 못했지만 대충 글 취지에는 100% 동의 개추
근데 토너에서 +$ev가 가 캐시보다 덜 중요한 이유는 개인적으로
핸드 수의 제한과 스택에 따른 퓨처 게임 ev가 달라지기 때문이라고 생각하는데 이 부분 혹시 어떻게 생각함?
2025.04.10 21:47:59
@A하이콜
퓨처게임까지 가버리면 대가리 터지긴 하는데, 나중에 한번 고려해보겠음
2025.04.10 21:50:04
@Eussit
예를들어 필드 좋은 토너에서
100핸드당 10비비 ev를 가질 때 이 ev를 실현하기 위해서 30비비 이상의 스택이 필요하고
이게 20비비로 떨어지면 옵션이 적어져 스택 ev가 100핸드당 5비비로 낮아지는 상황이라고 가정했을 때
30비비에서 오픈하고 15비비 잼을 맞을 때 굉장히 마지널한 ev들은 폴드할 가치가 충분히 생기고
이런걸 인게임에서 결국 올바르게 적용하는게 굉장히 중요한거 같아서
꼭 프리플랍 뿐 아니라 포스트에서도 유의미하게 작용할거고
2025.04.10 21:51:26
@A하이콜
ㅇㅇ 퓨처게임을 고려하는 쪽으로 메타가 옮겨가고 있는 현상은 알고있음 그걸 균형전략으로 녹여내는게 대가리가 아프지
2025.04.10 21:53:41
@Eussit
이게 실제로 치드윅 팟캐스트에서 나오는 부분인데
트라이튼 1밀리언 바이인에서 4명이 남았을 때 케니가 칩리더이고 치드윅 세컨일때
케니가 슈퍼 어그레션으로 모두를 찍어누르고 있는 상황이라
치드윅이 77파켓으로 20비비 올인에 콜하는 것이 굉장히 마지널함에도
케니가 퓨처게임 ev가 너무크고 나머지는 그에 희생하는 구조라
그 ev차이를 줄이기 위해 콜했다고 하거든
이런게 솔버로 아직 풀지 못한다는 점에서
토너의 굉장히 큰 매력인 것 같음
그리고 이런 부분 때문에 캐시에 비해 토너에서는 gto충들이 더 성적을 내기 어려운 것도 맞는거 같고
2025.04.10 21:55:08
@A하이콜
나도 그거 봄 ㅋㅋㅋ 확실히 매력적임 퓨처게임을 집어넣는건
2025.04.10 22:19:11
GPT 글 "GTO는 언제나 최선인가?" 10줄 요약
GTO는 이론적으로 완벽한 균형 전략이지만, 주로 캐시게임에 적합하다.
토너먼트는 칩 가치가 돈과 직결되지 않고 생존/순위가 중요해(ICM) GTO의 효과가 다르다.
ICM 환경에서는 GTO를 따르는 것이 오히려 내 실제 기대값(EV)에 손해일 수 있다.
상대를 억제하는 '균형'보다 '나의 EV 극대화'가 토너먼트의 실질적 목표여야 한다.
기존 이론은 GTO의 이러한 토너먼트 내 한계를 명확히 다루지 않는 경향이 있다.
따라서 GTO를 절대적 '정답'이 아닌, 전략 설계의 '출발점' 또는 '도구'로 봐야 한다.
상황에 따라 내 EV를 높이기 위해 의도적으로 GTO에서 벗어나는 플레이가 필요하다.
ICM-GTO 역시 완벽한 해답은 아니며, 여전히 내 EV 희생 가능성이 있다.
단순히 GTO를 따르기보다, 매 순간 실제 EV 구조를 분석하고 판단하는 것이 중요하다.
결론적으로 토너먼트에서는 이론적 균형보다 실질적 수익과 생존을 위한 유연한 전략이 우선이다.
길어서 읽기싫은애들은 등교할때 엄마가 싸주는 꼬마김밥마냥 이거라도 읽으렴
2025.04.10 22:36:02
읽어보니까 토너는 하는게 아니다
2025.04.10 22:58:19
솔직히 공감하기 힘든 부분이 좀 많음
GTO은 서로 전략을 수정할 유인이 없어지는 평형점일 뿐이지, 가장 수익적인 전략이라는 뜻이 아님. 토너먼트에서 GTO가 EV의 극대화를 보장하지 않는다는 건 사실 당연한 말임. 그리고 이건 캐시게임에서도 똑같고.
뒷자리의 웨일이 넓게 들어온다고 했을 때 GTO 전략이 손해보는 것 또한 캐시게임에서도 같음. 그렇다고 우리가 캐시게임의 GTO 오픈 레인지가 반쪽짜리라고 하진 않음. 그냥 환경에 대응할 필요가 있다고 말할 뿐이지.
그리고 chipEV 모델의 한계를 자꾸 비판하는 것도 불공평하다고 생각함. 토너먼트에서 GTO를 논할 것이면 ICM을 고려한 평형전략을 논하는 것이 당연한 일임.
이건 마치 chipEV 캐시게임 GTO 전략은 레이크를 고려했을 때 손해를 볼수 있으니 GTO가 의미없다고 말하는 것과 같음. 당연히 레이크도 고려 하는 게 맞는 건데, 레이크를 고려 안 하면 부정확하다고 GTO를 비판하는 것은 말이 안 되듯이.
물론 GTO 전략이 다른 사람의 실수로 인해 손해보는 경우가 토너먼트에서 더 많긴 하겠지만, 애초에 GTO 전략의 의미는 EV 극대화가 아니기 때문에 GTO가 반쪽짜리라는 결론에 도달할 수는 없음.
2025.04.10 23:01:41
@라큐
한줄요약: GTO는 애초에 정의가 EV 극대화 전략이 아닌데 타인의 실수에 의한 EV 손해를 GTO 비판 근거로 삼는 것이 말이 안 됨.
만약 GTO를 EV 극대화 전략이라고 생각한 사람이 있었다면 그건 그 사람이 GTO를 오해한 것이지, GTO에 문제가 있는 것이 아님. GTO는 원래 딱 그정도의 것.
2025.04.11 10:05:45
@라큐
"만약 GTO를 EV 극대화 전략이라고 생각한 사람이 있었다면 그건 그 사람이 GTO를 오해한 것이지, GTO에 문제가 있는 것이 아님. GTO는 원래 딱 그정도의 것."
맞는 말임. 나도 GTO의 정의를 모르는 게 아니고, GTO를 평형지점 이상의 의미로 받아들이지 않음. 근데 학술적으로 말고, 실질적으로 우리에게 받아들여지는 GTO의 의미는 가능한 모든 전략을 상대로 한 모든 핸드의 맥스ev 추종이니까.
2025.04.11 09:28:32
@라큐
'이건 마치 chipEV 캐시게임 GTO 전략은 레이크를 고려했을 때 손해를 볼수 있으니 GTO가 의미없다고 말하는 것과 같음. 당연히 레이크도 고려 하는 게 맞는 건데, 레이크를 고려 안 하면 부정확하다고 GTO를 비판하는 것은 말이 안 되듯이.'
-이거와는 본질적으로 다른 문제임.
레이크가 있다고 하더라도 캐시게임에서의 GTO는 히어로에게 의미가 있음. 상대방의 실수로 손해 본만큼의 EV가 나머지 플레이어들에게 분산되어 분배되지 않고(이건 토너먼트의 특성임) 오로지 히어로에게만 분배되는 캐시 게임 특성상, 균형 전략은 그 자체로 상대방의 가능한 모든 전략 상대로 히어로의 모든 핸드의 맥스ev를 달성할 수 있는 최선의 전략임. (GTO의 원래 정의가 맥스ev를 달성하는 것이 아니라고 할지라도, 실질적으로 캐시게임에서는 상대방의 ev억제와 나의 ev증대는 같은 의미를 지님.)
GTO가 익스플로잇 이외에도 근본적으로 플레이어에게 의미가 있는 지점이 여기에 있음. 균형을 보고 조정하는 것 자체도 중요하지만, 기본적으로 균형 전략은 플레이어를 절대 지게 만들지 않으니까.
이 사실은 레이크를 고려해도 전혀 달라지지 않음.
레이크 낸 뒤 그 지점부터의 무적전략이 GTO니까.
2025.04.11 10:10:48
@Eussit
레이크 5% 노캡이라 치고 팟 5bb, 보드 AKQJT에 스택 97.5bb일 때 OOP에서 GTO 전략은 모든 핸드로 셔브하는 거임.
왜냐면 상대방은 레이크때문에 콜을 할 수 없기 때문임.
근데 상대방이 실수로 내 셔브를 콜하면 나랑 상대 둘이 같이 손해봄.
여기서 상대방이 실수로 손해본 EV는 내가 아닌 카지노에게 흘러감.
이건 제일 이해하기 쉽도록 극단적 상황을 가정한 것이고, 일반적으로 빅블라인드가 레이크 무시하고 넓게 콜하는 거 자체가 오프너와 블라인드에게 서로 EV 손실이고 여기서 발생한 EV 손실은 카지노에게 흘러감.
2025.04.11 10:19:00
@라큐
"일반적으로 빅블라인드가 레이크 무시하고 넓게 콜하는 거 자체가 오프너와 블라인드에게 서로 EV 손실이고 여기서 발생한 EV 손실은 카지노에게 흘러감."
- 이거 얼마나 확신함?
애초에 그런 상황을 다 감안해서 나온 레인지가 각 레이크별 오픈 레인지일텐데?
2025.04.11 10:27:30
@Eussit
100% 확신함. 솔버로 계산 가능.
그리고 이렇게 인간이 즉시 계산을 못하는 영역을 제외하더라도 AKQJT의 예시만으로도 이미 반례가 있으니 충분하다고 생각함
애초에 그런 상황을 다 감안해서 나온 레인지가 각 레이크별 오픈 레인지일텐데? -> 솔버는 상대방이 레이크를 고려해 적절히 폴드할 것을 고려한 레인지이기 때문임. 솔버는 상대방이 최선으로 한다는 가정이기 때문
ICM GTO 전략에서 상대방이 ICM 무시하고 달려들면 내가 손해보는 거랑 같음.
2025.04.11 10:41:49
@라큐
맥락은 이해했음.
캐시게임에서도 레이크의 존재 때문에 GTO는 그 자체로 무적 전략이 아니다. 라는 거지?
그럼에도 불구하고 토너먼트와 캐시게임에서의 GTO 의미차이는 분명히 존재한다 생각함.
레이크는 애초에 특성 자체가 가변적인 변수이고 다른 것들과 독립적이라서(존재 자체가 사라져도 게임의 진행과는 무방한 변수라서) 그냥 쉽게 제거할 수 있음.
막말로 만일 우리가 노레이크 캐시게임을 한다고 가정하면, 상기한 모든 문제가 다 사라짐. 그리고 그 순간 GTO는 모든 핸드의 맥스ev를 추종하는 것과 동일한 의미를 가짐. 고로 이 때에는 무적전략이 맞음.
그런데 토너먼트의 경우에는 ICM이 개입된 구조적 특성상 GTO의 의미가 그 자체로 절대로 무적전략이 될 수 없다는 것임.
말하다보니 생각난 건데, 그러면 그냥
"GTO는 현실에서 절대로 우리의 승리를 보장해주지 않는다"
- 토너먼트에서는 당연하고, 레이크가 포함된 캐시게임에서 역시 그렇다
- GTO가 우리에게 승리를 보장해주는 조건은 레이크가 존재하지 않는 진공의 상태일 때 뿐이다
이렇게 정리 가능한건가?
2025.04.11 10:50:24
@Eussit
ㅇㅇ 그치 (뒷플레이어가 내 오픈에 루즈하게 반응하는 것도 내게 손해긴 하지만 그런 정도는 일단 무시한다면)
토너먼트에서도 1등 상금만 주고 ICM을 배제한다면 레이크 없는 캐시게임처럼 GTO전략이 거~의 승리를 보장하겠지.
엄밀히 말하면 헤즈업 싯앤고 or 노레이크 헤즈업 캐시게임은 GTO가 승리를 보장하겠고. 이건 이해관계 엮인 게 둘뿐이니 확실함.
사실 GTO를 해석하는 관점은 너나 나나 개념적으론 같은 거 같은데, 토너먼트에서의 GTO라는 언어적 표현으로 옮긴 데서 차이가 나는 거 같음.
내 생각엔 그건 토너먼트 포맷의 문제가 아니고 참가자가 여럿인 게임의 본질적 문제였고, 그건 캐시게임도 똑같으니 토너먼트에서의 GTO 자체의 문제로 표현할 건 아니었음.
그냥 내가 토너먼트 플레이어로서 걱정한 건 사람들이 '토너는 GTO 의미 없네ㅋ'라고 결론을 가져가는 게 위험하다고 생각했고, 그래서 댓글 남겼음.
2025.04.11 10:51:47
@라큐
이해완료
의견 고마움
2025.04.11 10:58:26
@Eussit
나도 유튜브 잘 보고 있음 굿런
2025.04.11 09:39:33
@라큐
'GTO 전략이 다른 사람의 실수로 인해서 손해보는 경우가 토너먼트에서 더 많긴 하겠지만'
- 이게 단순히 더 많다로 치부될 문제라고 볼 수 없음.
ICM의 개입으로 상대방의 실수가 나의 밸류로 곧바로 직결되지 않는다는 것은 그것보다 더 큰 의미를 지님. 이렇게 전제했을 때에는, 균형 전략 자체가 단순히 평형만을 의미하고, 히어로에게는 수익이라는 의미가 없어진다는 뜻이니.
뭐 쓰다가 느꼈는데 어떻게보면 너가 말했던 "GTO는 애초에 EV극대화 전략이 아니다"와 내가 말하는게 본질적으로 다르지 않기도 한 것 같음. 내가 말하고자 하는 바가 바로 그거니까.
다만 캐시게임에서는 그 본질적 특성상 GTO를 EV극대화 전략으로 봐도 전혀 무방함. 거의 그렇게 써도 문제가 없을 정도임. 그래서 공부 방향을 균형 추종으로 잡아도 전혀 문제가 없는데, 토너먼트는 아니라는 거.
2025.04.10 23:36:32
요즘 토너 하시나요?
2025.04.10 23:38:08
퓨처게임이 뭐임?
2025.04.11 11:36:48
@블러핑중독자
퓨처핸섭!!!!!
2025.04.11 12:19:22
@Eussit
진지하게ㅇ
2025.04.11 12:34:41
@블러핑중독자
토너먼트의 경우고, 해당 팟이 끝난 이후의 게임을 의미하지
ICM이 걸려있으면 내가 미들링스택일 때의 게임보다 테이블 보스일 때 보통 편하잖아. 이런것까지 의사결정의 요소로 삼는거임
2025.04.11 12:43:47
@Eussit
글쿤... bb
2025.04.11 01:53:23
캐쉬에서 내쉬균형 전략을 따른다 -> 절대 - EV 가 불가능함
토너에서 내쉬균형 전략을 따른다 -> -EV가 가능함 (그 이유는 내 뒤에 ICM 이 뭔지 모르는 병신이 앉아서 자신에게도 - EV 이면서 나에게도 - EV 를 가져다 주는 전략을 사용할 수 있기 때문에)
그냥 단순하게 이 주장인거라면 이건 정확한 주장인데?
2025.04.11 01:55:12
@비둘기마스터
이 주장을 확장하면 캐쉬에서 뇌 빼고 균형전략을 외운대로 시행하는건 덜 병신짓이지만, 토너에서 하는건 개병신짓이다 가 되는거고, 이것도 전혀 문제 없는 주장임
2025.04.11 07:57:54
@비둘기마스터
ICM을 모르는 병신이 어떻게 내쉬균형을 따름
혹시 모두가 아니라 히어로 혼자만 GTO대로 플레이하는 상황을 말하는거라면 당연히 캐쉬게임에서도 -EV가 생길 수 있는데?
2025.04.11 13:34:02
@WPLOO
? 그건 불가능함 EV 의 손실이 있을 순 있어도 0을 기준으로 nevative의 ev를 가지는 건 불가능하지
2025.04.11 14:08:06
@비둘기마스터
EV가 음수인 경우를 말하는거구나
그런 부분에서라면 캐쉬랑 토너가 유의미한 차이가 있네
본문내용도 그런부분을 말하고 싶은거군
ㄱㅅㄱㅅ
2025.04.12 10:13:16
@WPLOO
첨에는 EV 잘 말하더니 갑자기 왜 -ev 이러세염
2025.04.11 09:08:01
무슨 말 하는지는 알겠는데 뭔가 좀 너무 딥하게 생각하다가 꼬인 느낌인듯
2025.04.11 09:42:22
@주장
꼬이지 않았음
2025.04.11 09:44:06
@Eussit
시비거는건 아니고 너 유튜브도 간간히 보는데 애초에 내쉬라는 관점 자체를 바라보는 시선이 근본적으로 공감할 수 없는 본문내용이 좀 있어서 그래
2025.04.11 10:00:32
@주장
나도 시비 아님
시비라고 느껴졌으면 미안하네
어떤 점이?
2025.04.11 10:06:48
@Eussit
GTO는 언제나 최선인가?
-> 매순간 적응하는 상대(GTO) 상대로는 최선이다.
GTO는 이길 수는 없지만, 지지도 않는 전략을 의미한다.
-> 아니다 이건 이기려고 하는 전략이다.
-> 다만 상대가 너무 적응을 잘 해서 평형점일 뿐이다.
-> 근데 GTO는 GTO 끼리 하니까 현실에서는 다르자나?
-> 노드락을 배제하고 이 논리를 구축하면 안돼지
"손해가 발생하지 않도록 설계된 전략적 균형점"
-> 이 말이 근본적으로 공감이 안돼
-> 최대 EV를 추구하다 보니까 나온게 GTO 균형점인데 본문에서는 이게 손해를 막기 위한 전략으로 발전한 느낌을 주거든
2025.04.11 10:08:54
@주장
'GTO는 이길 수는 없지만, 지지도 않는 전략을 의미한다.'
이건 GPT가 븅신짓했네. 나도 보면서 슥 넘기다 보니 눈치를 못 챘음
GTO는 이기려고 하는 전략이 맞음. 이건 수정이 필요함.
2025.04.11 10:14:36
@Eussit
나도 기분이 나쁜건 없었고 너가 나빴을까봐 댓글 단거고 그래서 너가 말하려는 흐름이 "GTO를 기반으로한 조정으로 최대 EV를 선택해서 토너먼트의 비선형적인 구조와 균형을 현실에서 무너트리고 수익을 내야한다" 라는 것에는 동의하고 GTO 툴에서 반영하지 못하는 가치들이 있음에도 공감하는 부분이 있는데 위 댓글 내용과, EV억제 등의 단어들이 애매하게 섞여있어서 좀 뭔가 뒤틀린것 같다고 얘기한거야 !
2025.04.11 10:15:10
@주장
GPT의 똥을 검토를 못한 내 탓임
2025.04.11 10:18:52
@Eussit
여튼 100방에서도, 유튭에서도 다 잘 보고 배우고 있음 개추
2025.04.11 10:33:23
쌌다... 몇 년 사이에 포커가 이렇게 발전하다니
이젠 온라인 포커는 취미의 영역으로 남겨야할 것 같기도 하네
너무너무 잘봤어
2025.04.11 10:41:14
@cloverrrr
1050불 이상 하이롤러 토너를 치다보면
GTO에서 완전히 벗어난 플레이를 하는 어그레셔 들이 많은데
+EV 선택을 하는게 아닌 상대에게 -EV 선택을 강요하는 느낌이었음
20bb~60bb 상황에서 btn 오픈 sb 3bet 상황에서 bb 4 벳이 많이 나옴 k2s, k10o 같은 핸드로 말이야
레귤러 입장에서 GTO에 벗어난 어그레시브 플레이를 할 이유가 없는데
그랬던 이유가 이제야 납득이 되네
2025.04.11 10:45:08
@cloverrrr
요즘 토너에서 스택 상관없이 2bb 오픈 상대로 5bb, 5.5bb 3벳하는 플레이가 굉장히 흔한데
데드머니 생각하면 작은 3bet 이 좋지않다고 생각하는데 ICM 관점에서는 또 다르다고 생각함
이 부분도 분석해줄 수 있나
2025.04.11 10:49:18
@cloverrrr
이건 뭐 전통적인 토너먼트 이론에서 증빙이 가능히지
칩을 쌓는 것보다 칩을 덜 잃는 게 더 수익적인 것이 토너먼트고(칩은 쌓이면 쌓일수록 더 증대가치가 줄어듬)
애초에 스택뎁스가 얕아서 3스트릿에 올인이 가능하니까
2025.04.11 10:56:22
@Eussit
15~40bb 5bb 3벳 상대로는 기존 차트대로 대응하면 -EV 인 것 같아서
내 체감으로는 4벳 블러프 레인지를 넓게 가져가는게 수익적이었음
너 말대로 3스트릿 올인이 가능하기 때문에 콜레인지를 줄이고 푸쉬 폴드를 하는 느낌?
2025.04.11 11:09:50
와 댓글 핫한거 뭐야
2025.04.11 11:35:00
@조찐이
포고에 신선한 떡밥 가져오는거 누구????
2025.04.11 11:23:31
bb
2025.04.11 12:59:42
댓글까지 너무 맛있네요 감사합니다
2025.04.11 13:43:18
그 누구도 이 글을 제대로 이해를 못하고 있는 이 상황이 너무 안타깝네 ㅋㅋㅋ
상대가 내쉬 균형 전략을 사용하는지 사용하지 않는지 모르는 상태에서 내쉬균형 전략을 그대로 시행하는 것이 캐쉬 게임에서는 negative EV 를 불러 오는 것이 절대로 불가능한데 비해, 토너먼트에서는 ICM 요소를 모르는 상대의 실수 때문에 negative EV 를 불러 일으킬 수 있다는 주장이고, 이건 100% 맞는 얘기임.
여기서 negative EV 란 최대 EV 를 실현하지 못한 값을 의미하는게 아니라 0보다 작은거
근데 뭐 GTO 가 원래 EV 를 최대화 하지 않는다 어쩌구.. -> 이거 당연히 맞는 말인데 그게 중요한게 아니라 내쉬균형 전략을 따르는 행위가 0보다 작은 EV 를 가져올수 있냐고 없냐고 이게 중요한 쟁점이지
이 글이 물론 GTO 와 내쉬균형 전략을 자꾸 interchangable 하게 사용해서 헷갈리고, - EV 라는 것이 Maximize 된 EV 에 대한 EV 손실을 의미하는지, 아니면 실제로 0보다 작은 negative value 를 의미하는지 정확히 말해주지 않아서 헷갈리는 점은 있음.
근데 이정도로 아무도 이해 못할만한 글은 아닌데 ㅋㅋㅋ
2025.04.11 13:48:22
@비둘기마스터
생각보다 되게 번뜩이는 직관인 것 같았는데..
이전에 이거랑 비슷한 글을 본 기억도 없고(철학적 패러다임의 전환이라는 점에서)
그래서 내 글이지만 개인적으로는 귀한 아이디어라고 생각함.
다만 내가 이걸 정밀하게 다듬기에는 너무 삶이 바쁨. 어쩔수없다
2025.04.11 13:53:02
@Eussit
사람들이 일단 "EV 손실" 과 "0보다 작은 EV" 의 차이를 아예 구별하지 못해서 글이 전달이 전혀 안된듯 ㅋㅋㅋㅋ
2025.04.11 13:58:10
@비둘기마스터
사실 나는 GTO 추종전략의 결과가 음숫값을 낼 수 있다는 것 자체가 엄청난 충격으로 받아들여졌는데. 쩝 딱히 그 부분에 대해서 놀라움을 표현하는 사람이 없네
2025.04.11 14:01:14
@Eussit
나도 그렇게 생각함 ㅋㅋㅋ 그렇기 때문에 "상대가 뭔 짓을 하든 내쉬균형전략을 따르는 행위" 가 캐쉬게임에서는 꽤 나쁘지 않은 전략임에도 불구하고 토너먼트에서는 반쪽짜리 전략일 뿐이라는 말에도 동의함 ㅋㅋㅋ
2025.04.11 15:26:33
@비둘기마스터
캐시게임도 GTO가 negative EV를 가질 수 있으니까 반론을 단 거임.
2025.04.11 16:29:30
@라큐
뭔소리임 ㅋㅋㅋ 내쉬균형전략은 캐쉬게임에서 negative EV 를 가질 수 없음.
내쉬 균형에 대해서 뭘 어떻게 배운건지 모르겠지만, 포커의 내쉬균형에서 플레이어가 도달할 수 있는 최소 utility (포커 세계에선 EV라고 칭하는 것) 가 0보다 큼은 contradiction proof로 증명할 수 있음.
캐쉬게임은 레이크가 없다는 가정 하에 플레이어가 건 칩을 나누어 가지는 제로섬 게임임.
만약 니 말대로 GTO 로부터 나온 내쉬 균형 전략 A가 negative EV 를 가지게 만드는 상대전략 B 가 있다고 가정하자. 그러면 해당 전략 B는 positive EV 를 가짐. 왜냐하면 포커는 제로섬 게임이기 때문에.
그렇게 되면 니가 주장하는 내쉬균형 전략인 A 를 조정함으로써 negative EV 를 더 올릴 수 있기 때문에 해당 전략이 내쉬균형 전략이라는 가정에 contradiction이 생김.
2025.04.11 17:25:46
@비둘기마스터
내가 위에 댓글로 이미 적은 예시가 레이크에 관련된 거임.
캐시게임이 둘이서만 이해관계를 가지는 게임이라면 당연히 내쉬균형은 상대방이 전략을 수정해도 내가 손해볼 여지가 없지만, 실제 캐시게임은 결국 카지노와 다른 플레이어도 이해관계를 공유하기 때문에 GTO 전략도 상대방의 전략 수정에 의해 negative EV를 가질 수 있음.
물론 헤즈업 노레이크 캐시게임이면 GTO는 무적 맞음.
근데 그렇게 제한을 둘 거면 토너먼트도 헤즈업 싯앤고면 GTO가 무적인 건 똑같으니 캐시와 토너먼트에 차이를 둘 필요 없다는 의견인 거임.
2025.04.11 18:07:04
@라큐
오... 그렇긴 하네 레이크의 영향이 그정도로 셀줄은 몰랐음 ㅋㅋㅋ 근데 다른 플레이어가 이해를 공유하는 것은 내쉬 균형 전략의 minimum utility 가 항상 0보다 크거나 같다는 사실에 영향을 주지는 못함.
근데 과연 우리가 기준점을 0 보다 큰지 작은지에서 dynamic constant 인 레이크보다 큰지 작은지로 변경한다고 해서 결과값이 크게 차이가 날까? 물론 레이크가 5% 노캡이라는 가정하에 팟의 20배를 벳하는 것이 내쉬균형 전략인 극단적인 반례에서는 레이크의 영향으로 인해 양쪽 모두 negative utility 인 지점이 생기겠지만 그 외의 일반적인 경우에서는 전혀 변함이 없을것 같은데?
2025.04.11 18:11:33
@라큐
그리고 내쉬균형전략의 negative utility 가 존재하는지 여부에 대한 증명과 관계 없이, 뇌빼고 균형전략을 구사하는 것이 캐쉬게임에서와 토너먼트에서 같은 정도로 나쁘다는 주장은 솔직히 전혀 공감 안가고 그냥 글에 약간의 빈틈과 모순점이 있는걸 발견해서 억지로 까내린다는 느낌밖에 안듬.
내쉬균형전략이 negative utility 를 만드는 경우가 토너먼트에서 훨씬 더 자주 있고 매우 일상적으로 일어난다는 사실은 너도 동의할거 아님 ㅋㅋㅋ
2025.04.11 18:31:59
@비둘기마스터
보드찹에서 셔브하는 경우를 예시로 든 이유는 인간이 직접 계산으로 명확하게 결론낼 수 있는 스팟을 제시하기 위해 간단한 예시를 사용한 것임.
그냥 일반적인 경우를 생각하면 BB는 레이크를 고려해 훨씬 타이트하게 콜을 해야하고 오프너는 이 점을 이용해 스틸을 시도할 수 있는데, BB가 실수로 콜을 더 해버리면 여기서 오프너와 BB가 동시에 손해를 보고, 이 EV 손실은 카지노에게 흘러감. 이정도면 되게 흔하게 볼 수 있음.
그리고 캐쉬게임에서와 토너먼트에서 같은 정도로 나쁘다고 주장한 적은 없음. 원래 댓글에서도 토너먼트에서 그러한 경우가 더 많다고 말했음.
다만 GTO 이론을 얘기할 때 보통 상대방이 전략을 수정해도 내 EV 변화는 최소 +-0이라는 것이 중요한 점인데, 이게 제3자를 고려했을 때 0이 아니고 음수일 수 있다는 점은 그 절댓값의 크기와 무관하게 이론적으로 치명적이라는 점에서 캐시와 토너에 차이가 없다는 말인 거임.
한줄요약: 상대방의 실수에 의한 GTO의 손실은 토너먼트 포맷의 특징이 아니고 그냥 제3자가 끼면 원래 그런 것임을 강조하고 싶다. 그리고 토너에서 GTO가 중요하지 않다는 듯한 뉘앙스로 보이는 표현을 사용하면 혼란이 있을 것이라 생각한다
2025.04.11 18:41:06
@라큐
그냥 일반적인 경우를 생각하면 BB는 레이크를 고려해 훨씬 타이트하게 콜을 해야하고 오프너는 이 점을 이용해 스틸을 시도할 수 있는데, BB가 실수로 콜을 더 해버리면 여기서 오프너와 BB가 동시에 손해를 보고, 이 EV 손실은 카지노에게 흘러감.
이건 수학적으로 잘못된 주장임.
만약 내쉬균형 전략 A 가 있다고 가정하고, 레이크의 크기를 dynamic constant 인 r(t) (>0) 라고 했을 때 내쉬 균형 전략 A 의 average utility 를 -r(t) 보다 작게 만드는 전략 B 가 있다고 가정하자.
그렇다면 해당 전략 B 는 항상 -r(t) 보다 더 큰 average utility 를 가짐. 왜냐하면 둘의 utility 의 합은 dynamic constant -r(t) 의 값과 같아야하기 때문임.
그렇게 되면 전략 A는 내쉬균형전략이 아니므로 가정에 모순임.
이건 game theory에서 흔히 쓰이는 증명 방식임. 뭔가 잘못된 개념을 가지고 있는듯 싶은데
2025.04.11 18:44:41
@비둘기마스터
물론 보드찹에서 팟 20배 박는건 정확한 반례가 맞긴 하지만. 내가 지금 생각하기로는 그것이 유일한 반례가 될것 같은데 (레이크가 n% 일때100/n 팟벳 이상) 그정도는 봐줘도 되지 않음?
2025.04.11 18:59:03
@비둘기마스터
위자드 돌려보면 결코 작지 않음
2025.04.11 18:58:36
@비둘기마스터
A의 폴드: A +0 B +0 카지노 +0
A의 오픈 후 B의 폴드: A +5 B -5 카지노 +0
A의 오픈 후 B의 콜: A -10 B -10 카지노 +20
이 경우 A는 오픈하고 B는 폴드하는 것이 서로의 균형 전략. 이 경우 서로 전략을 바꿀 유인이 없고 평형 상태에 도달함.
하지만 B가 전략을 바꿔 균형에서 벗어나 콜을 할 경우 B는 물론 A도 손해를 봄.
네 설명에서 B의 전략에 따라 카지노의 손익이 바뀌는 부분이 빠짐.
이렇게 3인 이상이 참여하는 게임의 경우엔 예외가 있을 수 있음. 이해하기 쉽게 반례 들어줬음.
2025.04.11 19:12:02
@라큐
이것은 잘못된 예시임. 정확히는 너가 들었던 레이크가 n% 일때100/n 팟벳 이상 치는 예시랑 같을 뿐이잖아...
지금 빅블라인드가 5인 상황에서 프리플랍에 오픈하고 bb 가 콜했을 때 레이크가 20이 쌓이는 상황을 가정하고 반례를 들면 어떡해 ㅋㅋㅋㅋ 그럼 노캡 5% 라는 가정 하에 오픈 사이즈가 2000bb 였겠네 ㅋㅋㅋㅋㅋ 이건 정확히 너가 말한 찹보드에 잼박는 반례랑 동일한 반례를 가져온것 뿐이야
2025.04.11 19:14:41
@비둘기마스터
단위가 뭔지 알고? 그냥 예시로 숫자를 적은 것 뿐인데
저기 1이 0.0몇 bb라고 생각하면 됨
2025.04.11 19:17:11
@라큐
아니 그니까 프리플랍에 오픈하고 콜하면 블라인드의 5배 레이크가 떼지는 상황을 가정한거라고... 그럼 일반적인 5% 레이크 구조에서 도대체 몇bb 오픈을 가정한거냐고?
그러니까 애초에ㅜ니가 가정한 상황이 프리플랍에 팟이 1bb 일때 그것의 20배 +를 오픈해서 레이크의 영향을 존나 최대화 한 상황이라니까?
2025.04.11 19:18:14
@비둘기마스터
아니 왜케 숫자에 꽂혔어 그냥 포커와 무관하게 수학적인 반례를 설정해서 제시한 건데
그냥 내가 헤즈업 프리플랍 노드락 걸고 ev 비교 보여주면 되겠어?
2025.04.11 19:19:51
@라큐
아니 너의 반례가 수학적으로 잘못됐는데 어떡함 ㅠ 한쪽에 노드락을 걸고 -ev 가 어디서 나오는지 알려줘봐 이건 그냥 팟 20배 박는 반례랑 정확히 같은 반례일 뿐이야
2025.04.11 19:26:02
@비둘기마스터
100bb 헤즈업, 레이크 5% 3bb
콜/폴드 빈도 핸드들 폴드 비율을 전부 콜로 바꿈
오프너 EV 보면 0.48에서 0.45로 거의 6% 떡락함.
그냥 솔빙 결과를 보여줘도 안 믿으면 할 말은 없고..
2025.04.11 19:28:22
@라큐
아니 정확히는 특정 핸드가 아니라 전체 전략의 EV 가 0보다 작아짐을 보여줘야 하는거네. 여전히 0.45는 0보다 한참 큰데?
2025.04.11 19:29:29
@비둘기마스터
그건 팟에 이미 블라인드가 들어가서 그럼
2025.04.11 19:33:38
@라큐
아니 그래서 위자드로 솔빙한 결과물을 보고 우리가 이미 들어간 블라인드 adjust 한 값을 알 수 없으니 어쩔 수 없네...
난 여전히 레이크가 n% 일때 팟의 100/n 배를 벳할때 이외에는 내쉬균형 전략 A 의 utility을 -r(t) 보다 낮게 만드는 전략 B 가 존재할 수 없다는 나의 증명이 틀렸다고 생각하지 않음....
뭐 어떻게 이건 솔빙도 안되고 너도 딱히 이해하는것 같진 않으니 방법이 없다
2025.04.11 19:36:34
@비둘기마스터
아니 그냥 지금 주제의 핵심인 오프너가 GTO 전략을 쓰는데 상대가 전략을 수정하니 GTO 전략의 EV가 크게 감소하는 걸 보여줬는데도 인정을 안 해
2025.04.11 19:42:09
@라큐
오 아니 방금 이해함 그니까 오프너 + 콜러의 EV 가 레이크의 총량이 바뀌지 않았음에도 불구하고
균형에서는 0.48+0.75 이고 노드락 건거에서는 0.45+0.73 으로 줄어들었네? 그럼 내가 생각했던 둘의 utility 의 총합이 -r(t) 이어야 한다는 가정이 잘못된 거였구나
2025.04.11 19:44:43
@비둘기마스터
ㅇㅇ 맞음
그래서 내가 아까 네 설명에서 B가 콜하면 카지노의 손익이 바뀌는 부분이 계산에서 빠졌다고 말한 거임.
전체 총량은 항상 0이어야 하는데 B가 콜하고 나서 카지노의 수익이 늘어나면 A와 B의 EV합은 필연적으로 줄어듦
2025.04.11 19:49:49
@비둘기마스터
아니 다시 읽어보니 뭔가 이상한데
레이크의 총량(기댓값)이 바뀐 거지 플랍 진행률이 높아지니까
2025.04.11 20:00:38
@라큐
ㅇㅇ r(t) 가 전략에 따라 변동이 가능해서 자폭전략이 생길 수가 있어지네 ㅋㅋㅋ 레이크의 영향이 생각보다 존나 쎄구나
2025.04.11 20:09:06
@비둘기마스터
맞음 이게 콜의 경계선 핸드들은 EV가 +-0.1bb 사이에 몰려있기 때문에 작은 레이크 변화로도 큰 레인지 차이가 생기고, 그걸 기반으로 오픈 레인지가 정해지기 때문에 콜러가 레이크를 무시하면 오프너도 영향을 꽤 크게 받음
공격적으로 말한 건 미안 딱 봐도 너가 수학적인 부분을 잘 이해하고 있는 앤데 그냥 논점 회피하는 거라 생각해서 순간 욱했음 ㅋ;
2025.04.11 20:41:25
@라큐
나는 토너 예시에서 균형전략 따르는 히어로와 자살전략 쓰는 빌런이 만났을때 다른 플레이어들이 나눠갖는거만 생각해서 캐쉬게임에서 카지노가 훔쳐가는 ev를 엄청 제한적으로 생각하고 있었음 ㅋㅋㅋ 혹시 답답했다면 미안하다
2025.04.11 19:13:10
@라큐
GTO 가 돌아가는 방식을 알지 모르겠는데 GTO 는 expected rake of future street 를 모델에 포함시키지 않아... 지금 니가 든 예시는 bb가 5인데 프리플랍에 레이크 20 쌓이는 예시임...
2025.04.11 19:15:12
@비둘기마스터
전체 전략의 평균 나타낸 거임
2025.04.11 19:18:13
@라큐
아니 future street 의 레이크는 고려ㅜ대상이 아니라서 너의 예시가 프리플랍에 오픈-콜 했는데 빅블라인드의 4배가 레이크로 쌓이는 예시라니까? ㅣ
이건 너가 처음에 들었던 보드찹에 팟 20배 박는거랑 정확히 같은 예시야
2025.04.11 19:23:07
@라큐
그니까 너가 반례 A와 반례 B 가 있다고 처음에 알려줬고, 나는 반례 A 는 맞지만 반례 B 는 수학적으로 잘못됐다고 알려줬고,
너는 반례 B 의 증거라며 예시를 들었지만 그건 사실은 반례 A와 같은 상황에서만 가능한 예시일 뿐인거야 이건 이해가 가나?
2025.04.12 10:32:52
@비둘기마스터
내가그래서 캐시의 경우 레이크에 따른 자살쇼는 인정한거임.
다만 토너먼트는 애초에 구조적인 특성상 균형전략이 그 자체로 -ev를 창출해낼 수 있음을 내포함에 반해, 캐시게임의 경우에는 레이크라는 제 3의 변수를 가정해야만 -ev를 창출해낼 수 있음을 집은 것도 그때문임.
해즈업 싯앤고는 ICM의 영향을 애초에 받지 않는 포맷이기에, 이걸 토너먼트도 그럴 수 있다! 라는 반례로 삼기는 적절치 않다고도 생각함.
2025.04.11 16:32:47
@라큐
그렇다면 토너먼트에서는 어떤 다이내믹이 변경되냐?
토너먼트에서는
GTO 로부터 나온 내쉬 균형 전략 A가 negative EV 를 가지게 만드는 상대전략 B 가 있다고 가정하자. 그러면 해당 전략 B는 positive EV 를 반드시 가지지 않음. 왜냐하면 ICM 의 존재로 인하여 건 칩 ev 상의 제로섬 게임이 더이상 아니기 때문임.
그렇기 때문에 해당 전략을 구사하는 상대의 전략에 반드시 adjust 해야만 negative EV 에서 벗어날 수 있는 것이고, 내쉬균형전략의 Utility 의 최댓값이 0보다 작을 수 있는것임.
게임이론에 얼마나 지식을 가지고 있는지 몰라서 최대한 간단하게 설명했는데 이해가 됐을지 모르겠네
2025.04.11 17:29:28
@비둘기마스터
위에 말했지만 캐시도 레이크 포함 시 제로섬 아님.