조회 수 1651
추천 수 7
2024.03.12 23:13:38
사실 난 원래 적당히만 번역하고 요약하려 했는데 대충 영상의 90프로 이상을 다 번역해버렸네.
참고로 여기에는 영어 단어를 그냥 대놓고 똑같이 쓰거나, 용어가 난무하는 편인데, 이건 초보자 보라고 만든 영상이 원래도 아니였고 번역하면서 더더욱 그런 가능성을 제거했다.
다시 말해, 읽는 난이도가 어느 정도 존재할 수밖에 없는 글이다.
출처는 아래에 기입한다.
잘 봐줘라.
---
GTO의 최종 목표는 exploit 당할 수 없는 전략의 생성이다. 메타게임, 전략적인 꼬리물기, 그리고 수읽기 전투에서 벗어나기 위한 것이다. (...) GTO의 최종 목표는 균형이다.
흔히 GTO 플레이에 대해서 가지는 질문은 총 네 가지다.
1. GTO 플레이 패턴은 어떻게 만들어지는가?
2. 어째서 GTO 플레이는 exploit 당할 수가 없는가?
3. GTO는 상대방이 GTO를 플레이하지 않더라도(대충 한옵 같은 환경) 여전히 유효한가?
4. 그래서 GTO는 어떻게 이윤을 창출하는가?
일단 GTO 플레이는 exploit, 즉 상대방이 약점을 찌를 수 있는 껀덕지 자체를 없애는게 첫째 목표이고, 완벽한 상대방과 싸운다는 가정 하에 취할 수 있는 가장 완전한 전략이다. 또한, GTO플레이는 근본이 방어적인 전략이다. 자신의 약점과 EV 손실을 최소화함과 동시에, 가장 다양한 플레이어들에게 효율을 보이는 전략이다.
당연히 가장 좋은 전략은 가장 많은 이윤을 창조하는 전략이다. GTO는 그걸 과학적으로 이루는 수단일 뿐이다.
여기서 우리는 내쉬 균형에 대해 확실히 숙지할 필요가 있다. 내쉬 균형은 그 어느 플레이어도 전략을 변경해서 이윤을 더 창출할 수 없는 상태를 뜻한다. 이것이 위에서 말한 "균형"의 진정한 의미이다.
그래서 GTO 전략은 어떻게 만들어지는가?
사실 굉장히 간단하다. 솔버라는 프로그램을 통해 만들어진다. 솔버는 EV를 극대화하는 소프트웨어로서, GTO 전략의 생성은 솔버 A와 솔버 B를 서로 붙게 만들고, 그 둘이 처음에는 랜덤하게 전략을 취할 수 있게 하다가 솔버 A의 전략을 고정시키고, 솔버 B가 그것을 exploit 하게 한다. 그다음에 B의 새로운 전략을 고정시키고, A가 exploit하게 만들고, 그 전략을 고정시킨 후 exploit 시키고, 그것을 끊임없이 반복하면 결국에 균형, 즉 내쉬 균형에 도달하게 된다. (물론 이런 방법 외에도 GTO 전략을 만들 방법들은 많지만, 일단 이게 원론적인 방법이다.)
이래서 GTO는 exploit 당할 수가 없다. 이미 수천, 수만번 exploit 당한 전략들은 결국에 모든 약점과 EV 손실이 일어날 가능성의 플레이들이 제거된 형태로 정화가 이뤄지고, 그 상태를 우리가 내쉬 균형이라고 부르게 된다. 결국에 GTO를 상대할 수 있는 가장 exploitative한 전략, 즉 가장 큰 "이윤"을 취할 수 있는 전략은 똑같은 GTO 전략이다.
이쯤되면 균형을 추구하는 전략, 그리고 exploit을 추구하는 전략 사이의 차이를 이해해야 한다. 균형을 추구하는 전략은 방어적이고, 상대에 대한 정보가 없는 상태에서 가장 완벽한 전략이며, 리스크가 적다. exploit을 추구하는 전략은 공격적이고, 상대에 대한 명확한 정보가 있다는 가정 하에서 가장 완벽한 전략이며, 불균형 하지만 이윤을 극대화한 전략이고, 그에 따른 리스크, 즉 역exploit을 당할 위험이 존재한다.
그래서 이제 우리는 가장 중요한 질문이자, 포고의 반영구적 떡밥에 대해 답하겠다. GTO는 GTO를 모르는 상대방한테도 먹히는가? 일단 이 질문에 답하기 전에, 세상의 어느 인간도 완벽한 GTO 플레이를 할 수 없다는 것을 숙지해야 한다. 그렇기 때문에 GTO가 메리트가 존재하기 위해서는, 불균형한 플레이어들을 상대로도 이윤을 창출해야만 한다.
이때 우리는 내쉬 균형의 정의를 상기시켜야 한다. 세 문단 정도의 내용을 요약하자면, 완벽한 GTO 플레이의 카운터는 GTO 뿐이며, 그걸 하지 않는다는 것은 EV 손실로 이어질 뿐이다. 그래서 헤즈업 상황이라는 가정 하에서, 불균형한 전략은 언제나 균형을 추구하는 전략, 즉 GTO에 패배할 수밖에 없다.
이걸 증명하기 위해서 GTO 위자드는 영상에 자료까지 띄워주고, 극단적인 예시까지 들어준다. 그걸 사진을 첨부하지 않고 요약하자면, 헤즈업 상황에서 SB가 포켓 에이스만 레이즈를 하는 미친 니트를 상대한다고 생각해보자(대충 뭐 박아박아 하는 한옵충들의 반대겠지). 하지만 SB는 그걸 모르고, BB가 자신과 마찬가지로 GTO 기준의 3벳 레인지를 가질 것이라고 생각하고 있다. 그리고 향후 스트릿 에서도 BB가 GTO 레인지대로 플레이 할 것이라고 가정하고 플레이한다. 이러면 상당수의 사람들이 "그러다가 밸류를 충분히 따내지 못하지 않냐, 결국에 GTO가 이런 플레이어를 상대로도 통하기나 하는거냐, 역시 상대방의 레이즈를 보면 폴드를 하거나 어떻게 하는 exploit을 해야만 한다"라고 생각하겠지만, 관점의 변화가 필요하다. 설령 이런 니트가 GTO 전략을 상대로 포켓 에이스만 10BB만큼 레이즈를 한다고 하더라도, 그리고 그걸 GTO 플레이어가 모른다고 하더라도, 니트는 추가적인 EV를 못 가져간다. 사실 조금만 생각해도 알 수가 있는 부분인데, GTO 플레이는 오직 GTO 만으로 exploit 당할 수가 있기 때문에, 다른 전략을 취한다고 해서 EV는 더 못 따낸다. 심지어 이 니트가 AKs, KK 등을 3벳 레이즈를 안하고 콜을 하기 때문에 EV 손실이 발생하는 것까지 고려하면, 결과는 자명하다. 설령 상대방이 그런 니트이고 그것에 대한 적극적인 exploit을 안한다라 하더라도, EV는 더 못 따내기 때문에, 장기적으로는 니트가 이윤을 창출 못하는 것을 더불어, 궁극적으로는 EV 손실로 인한 금전적 손해까지 입게 된다. 그리고 상식적으로 생각해봐도, 이렇게 플레이하는 사람들이 만일 진짜로 GTO를 깨트릴 수 있는 것이였다면, 우리는 GTO가 필요 없을 뿐만 아니라, 프로들도 이런 식의 플레이를 하겠지만, 당연히 두 상황이 우리의 현실이 아니다. 물론 이정도 수준의 니트는 삼척동자도 캐치할 수 있기 때문에, 이 니트를 상대할 때 3벳 레이즈가 나오는 순간 폴드를 하면, 니트가 3벳 레이즈를 통해 볼 수 있는 EV를 더더욱 줄여버릴 수 있다. 하지만 이런 모든 걸 고려한다 해도, 적어도 우리는 GTO 플레이를 하면서 돈을 "덜" 따낼 걱정까지는 안해도 된다. 수학적으로 우리는 최소한의 EV는 보장된 상태기 때문이며, 그것이 상대방의 EV 손실까지 감안하면 무시할 수 없는 수준으로 EV가 보장됐기 때문이다.
그렇기 때문에, 전 문단의 마지막 부분에서 말했듯이, exploit을 추구한다면 EV의 상승을 꾀할 수도 있다. 하지만 상술한 바와 같이, 그건 리스크를 진 전략이고, 상대방에 대한 양질의 정보를 요구한다. 그리고 그들이 실수로든, 의도적으로든 exploit을 카운터 exploit 한다는 가정 하에서, GTO 플레이를 통해 볼 수 있었던 최소한의 보장된 EV에서 손해를 보게 된다. 그리고 카운터 exploit은 언제나 exploit을 통해서 볼 수 있었던 EV 상승보다 더 큰 EV 손해를 야기시킨다.
그리고 한마디만 첨언하자면, 자신이 exploit을 잘한다고 하는 플레이어들은 대체적으로 불완전한 인간의 감각에 따른 감성적인 플레이를 그렇게 부르는데, 진정한 exploit은 GTO보다 10배 더 복잡한 전략이다. 상당한 수준의 통계학, 양질의 데이터, GTO 위자드 웹사이트에서 공식적으로 제공해주는 node locking의 활용 등을 고려하면, 사실상 하나의 심해를 보는 수준으로 그 깊이는 이루 말할 수 없으며, 절대 다수의 exploitative 플레이어들은 수박 겉핥기 만도 못한 수준의 이해도로 이런 전략을 접근하는 것이다.
균형을 추구하는 전략은 최소한의 EV가 언제나 보장됐다.
이런 최소한의 EV에 대해 첨언하자면, 결국에 GTO 플레이는 장기적으로 봤을 때 이정도의 금액은 따준다는 의미다. 상대방은 이 최소한의 EV까지는 건드리지 못하며, 무엇보다 실수를 한다는 가정 하에, 그 최소한의 EV는 상승할 일만 남았다.
물론 여기에서 명확히 해야할 부분은, 앞서 말한 모든 부분은 3웨이, 4웨이 상황에서는 통하지 않기 때문이다. 왜냐하면 두 명이 동시에 전략을 바꾼다면, 그 두 명의 전략까지 동시에 케어하기는 불가능에 가깝기 때문이다.
그래서 결국에 GTO는 어떻게 이윤을 창출하는가?
일단 설명하기에 앞서, 포커에서 할 수 있는 실수의 종류는 두 가지다. 하나는 mixing mistake, 즉 올바른 전략적 행동들을 취하고 있음에도 그 행동들 간의 빈도수 비율이 틀린 걸 뜻한다. 가령, GTO 플레이에 따르면 50%의 경우에는 폴드해야 하고, 50%의 경우에는 콜을 해야 하는데, 플레이어가 언제나 폴드를 한다면, 그건 mixing mistake다. 두번째는 pure mistake, 즉 GTO 전략에서는 절대로 취하지 않는 행동을 하는걸 의미한다. 가령, GTO 대로라면 100% 빈도로 콜해야 하는 핸드가 있다면, 그걸 폴드하는 것은 언제나 실수이며 EV 손실로 이어진다.
예시를 하나 들어보자. 플랍은 QJ5, SB BB의 헤즈업 상황, 그리고 BB가 98o를 가지고 있으며, SB가 2BB 만큼을 벳 했다. BB는 지금 것샷 가능성을 가지고 있다. GTO 전략대로라면 97%의 경우에는 2BB를 콜해야 하고, 그건 0.34 EV, 즉 100핸드당 34BB만큼 벌어내는 것이다. 만일 이 패를 폴드한다면, 우리는 34BB/100 만큼의 손실을 입는 것이다. 여기서 GTO 전략이 이윤을 창출해낸다. 이런 포지션과 핸드를 상대방들이 폴드하는 pure mistake를 범한다면, 우리는 그런 실수를 저지르지 않기 때문에 EV 간극이 벌어지기 시작한다. 물론 (영상을 보면 알겠지만) 3퍼센트 정도의 경우에는 12BB 만큼 SB가 레이즈를 할 수가 있다. 하지만 언제나 레이즈를 한다면 그건 mixing mistake로 이어지고, 지나치게 자주 블러프를 하는 것이다. 그리고 이렇게 되면 exploit 당할 위험이 크게 늘어나기 시작한다.
요약하자면, GTO는 mixing mistake를 상대로 EV를 더 창출해 낼 수는 없다. 그건 오직 상대방을 exploit 해야만 EV를 더 창출할 수 있다. 하지만 pure mistake를 상대로는 GTO가 언제나 EV를 추가로 창출한다. 그리고 이건 장기적 이윤으로 이어진다.
여기까지 다 왔다면 대충 그뭔씹 상태일텐데 남초가 좋아하는 요약을 주자면
1. 일단 한옵의 절망적인 3웨이 4웨이 팟들, 그리고 상대방이 "명확히" 실수를 저지르는건 아니지만, 그걸 너무 자주 하는 형식의 mixing mistake를 저지르고 있다면(콜링 스테이션, 니트, 피쉬) GTO가 이득을 못 본다.
2. 하지만 이런 상황에서 GTO는 손해는 보지 않는다.
3. 그리고 상대방이 pure mistake, 즉 그냥 대놓고 실수를 저지른다? 님이 GTO를 충분히 숙지하고 있다면 그 사람을 상대로 EV를 따낼 수가 있고, 그렇게 따낸 EV는 장기적인 이윤이 되버린다.
4. 그리고 님들이 생각하는 exploit은 실제 exploit에 비해서 실로 아무것도 아니며, 그냥 가장 탄탄한 전략을 기초로 다지고 흔들리지 않고 플레이 하는 것이 가장 쉽고, 가장 확실하다. 우리는 여우가 아닌, 고슴도치가 돼야 한다.
스크랩
댓글 수
0
댓글 작성은 로그인이 필요합니다.
클릭 시 로그인페이지로 이동합니다.