「게임이론: 전략과 정보의 경제학」 4장 - 내쉬균형의 성질과 비판적 대안

TIL

「게임이론: 전략과 정보의 경제학」 4장 - 내쉬균형의 성질과 비판적 대안

Eric Ju 2025. 9. 1. 10:45

강단계소거나 내쉬균형으로 분석한 이론적 예측은 현실과 괴리가 있을 수 있다. 단 하나의 해가 존재하지만 실제로는 예측과 다른 경우가 있을 수 있고, 해가 여러 개 존재하여 이론상의 예측력이 낮음에도 실제 경기자들의 전략 선택은 일관성이 있을 수도 있다.

1. 내쉬균형과 강단계소거의 관계

경기자의 수가 n으로 유한하며 각자 선택할 수 있는 행동의 수도 유한한 전략형게임 G를 상정하자. 유한 전략형게임 G의 전략조합 (s₁*, s₂*, …, sn*)을 내쉬균형이라 하자. 어떠한 si* (i = 1, 2, …, n)도 강단계소거 과정에서 제거되지 않고 끝까지 살아남는다. 즉, 어떠한 내쉬균형 전략이건 강단계소거 과정에서 중도에 제거되지 않고 마지막까지 살아남는다는 것이다. 이때, 유한 전략형게임 G의 전략조합 (s₁*, s₂*, …, sn*)이 내쉬균형이라면, si* (i = 1, 2, …, n)는 경기자i의 합리화전략이다. 또한, 유한 전략형게임 G에 우월전략해 (s₁*, s₂*, …, sn*)가 존재한다면, 게임 G에는 유일한 내쉬균형이 존재하며, 그것은 우월전략해와 반드시 일치한다. 즉, 유한 전략형게임의 내쉬균형은 강단계소거 과정에서 끝까지 살아남으며, 이는 곧 합리화전략이다. 그것이 단 하나의 전략조합이라면 우월전략해인 동시에 내쉬균형이다.

2. 최소극대와 최대극소

	left	right
Top	4, 2	3, -20
Middle	6, 0	-10, 1
Bottom	-500, 8	5, 9

Top, Middle, Bottom을 경기자 1의 전략, left와 right를 경기자 2의 전략이라고 하자. 이때 유일한 내쉬균형은 (B, r)이다. 그러나, 만약 경기자1이 Bottom을 선택한 상황에서 경기자2가 right 대신 left를 선택한다면, 경기자1은 500을 잃게 된다. 그러므로 경기자1에게 안전한 전략은 Bottom보다는 Top일 수 있다. 이러한 의미에서, 경기자i에게 최소극대 보수란 그가 선택할 수 있는 전략이 각각 최악의 결과를 가져온다고 가정하고 그 중에 그나마 큰 값으로 정의된다. 내쉬균형이 전략적 안정성(stability)을 개념화한 반면 최소극대는 안전성(security)을 개념화한 것이다. 이때 최소극대전략을 구하는 방법은 다음과 같다. 경기자1의 입장에서 Top, Middle, Bottom을 선택할 경우 얻게 될 최악의 보수는 각각 3, -10, -500이고, 이 중 3이 극대값이므로 경기자1의 최소극대전략은 T인 것이다.

이와 대비되는 개념이 최대극소이다. 경기자i의 최대극소 보수는 상대 경기자들이 선택할 각각의 전략에 대하여 최선의 응수를 한다고 가정하고 그중 경기자i에게 가장 불리한 시나리오를 상대방이 채택할 경우 얻는 보수이다. 위 그림에서 경기자2가 left를 선택할 경우 경기자1의 최대보수는 6이고, right을 선택할 경우 경기자1의 최대보수는 5이다. 이때 극소 값은 5이므로, 경기자1의 최대극소보수는 5이다.

최대극소보수는 최소극대보수보다 항상 크며, 최소극대보수와 최대극소보수가 일치할 경우 이를 게임의 값이라 부른다. 또한 게임의 값을 달성하게 하는 전략조합을 최적전략이라 한다.

3. 내쉬균형과 최소극대·최대극소의 관계

내쉬균형 보수는 최소극대보수보다 크거나 같다. 내쉬균형 보수와 최대극소 보수의 대소관계는 일반적으로 확정할 수 없으나, 순수전략 내쉬균형이 존재할 때는 전자가 후자보다 크거나 같다. 경기자가 두 명인 2인 정합게임에서 최대극소와 최소극대가 일치하는 최적전략조합이 존재할 경우, 게임값을 달성하게 하는 최적 전략조합은 반드시 내쉬균형과 일치한다. 한편, 최소극대나 최대극소는 순수전략만으로 한정할 경우 분석력이 낮기에 혼합전략까지 포괄하는 것이 원칙이며, 보수 구조만을 고려하는 기술적 개념이므로 경기자들의 합리성이나 최선응수는 고려하지 않는다. 또한 상대를 최대극소화함으로써 자신이 낮은 보수를 얻을 수 있기 때문에, 최소극대 및 최대극소 개념은 제로섬게임을 분석하는 데 좋다.

5. 초점과 위험우위

균형의 다중성이란 주어진 게임에 여러 개의 균형이 존재하는 현상을 일컫는다. 이는 다양한 현상을 설명할 수 있다는 장점을 지닌 반면, 예측력의 결여라는 단점이 있다. 이 한계를 극복하는 방법으로는 초점, 보수우위와 위험우위, 진화 등이 있다.

	H	L
H	5, 5	0, 0
L	0, 0	1, 1

위와 같은 공조게임의 경우, (H, H)와 (L, L) 두 개의 내쉬균형이 존재한다. 여기서 초점은 (H, H)인데, 이는 우리의 직관과 맞닿아 있는 비정형 개념이다. 이는 사회적으로 느슨하게 합의된 선택을 의미하며, 따라서 다중균형 문제를 완전히 해결하는 방법이 아니라는 비판이 따른다.

	사슴	토끼
사슴	v, v	0, 1
토끼	1, 0	1, 1

위와 같은 경우, 내쉬균형은 (사슴, 사슴)과 (토끼, 토끼)이다. 이때 v > 1이기에, 전자가 현실화될 것이라고 판단할 수 있다. 즉, 사슴균형이 토끼균형보다 두 경기자에게 더 높은 보수를 주기 때문에 둘 모두 사슴을 택할 것이라는 예측이다. 이는 보수우위 개념에 기반한 것이다. 그러나, v=1.0001이라도 그것이 성립될까? 0.0001을 더 얻고자 무조건 1을 얻을 수 있는 토끼가 아닌 사슴을 쫓을 것인가? 만약 상대가 협조해주지 않는다면 보수는 0이 될 것이다. 이러한 점에서 v값이 1에 가까울수록 사슴은 토끼에 비해 위험성이 커진다. 이 경우 토끼균형이 위험우위에 있다고 말할 수 있다. 반대로 v값이 충분히 크면 사슴균형이 토끼균형에 비해 보수우위는 물론 위험우위에 있게 된다. 그 기준이 되는 v값은 얼마일까? 반(反)위험도로 이를 설명할 수 있다. 사슴균형에서 얻게 될 보수 v는 토끼전략을 선택함으로써 얻을 1을 포기한 값이므로 이때의 반위험도는 (v - 1)이다. 토끼균형이 갖는 반위험도는 상대와 상관없이 1이다. 결국 v - 1 > 1이 성립할 때 사슴균형은 토끼 균형에 비해 위험우위에 있다. 즉, v가 2를 초과하면 사슴균형이 위험우위에 있게 된다. v < 2인 경우 보수우위는 사슴균형에 있지만 위험우위는 토끼균형에 있게 되어 두 기준 간에 갈등이 유발된다.

6. 진화게임(evolutionary game)

경제인의 신적 합리성을 가정하는 신고전학파 경제이론과 달리, 진화경제학은 경제인의 제한적 합리성과 사회유기체론을 전제로 한다. 경제인은 인식 범위와 계산 능력의 한계 및 주변환경의 복잡성으로 인하여 많은 경우 근시안적으로 행동하며, 동일한 상황을 여러 번 거치면서 전략을 조정하는 학습과정을 거친다. 또한, 사회는 유기적으로 결합되어 있기에 개개인은 서로 영향을 주고받으며, 이를 통해 집단 전체의 구조가 형성된다. 동물세계에서도 희소한 자원으로 인한 경제문제가 있기에, 이 경쟁을 게임으로 모형화할 수 있다. 동물세계의 생존경쟁게임에서는 자연선택을 통해 장기균형 상태에서는 적자생존의 원리가 나타난다. 진화경제학자들은 이를 활용하여 공동체 전체의 진화과정 관찰을 통한 경제현상의 설명을 시도한다. 그들에 따르면, 경제사회의 진화 방향은 우발적이며, 바람직한 방향으로 나아간다는 보장도 없다는 것이다.

	사슴	토끼
사슴	v, v (v = 4)	0, 1
토끼	1, 0	1, 1

사슴사냥게임에서의 균형 선택 문제에 진화게임의 분석방법을 적용할 수 있다. 이때 v = 4로 가정한다. 무한히 많은 개체로 구성되어 있는 집단에서 매번 두 명씩 임의로 짝을 지어 사슴사냥게임을 실시한다. 특정 전략의 우수성은 그 전략을 선택한 개채들의 평균 기대보수가 집단 전체의 평균 기대보수보다 크냐 작으냐에 달려 있다. 사슴전략을 선택하는 비율을 p, 토끼전략을 선택하는 비율을 (1 - p)라고 가정하자. 사슴전략을 선택한 개체는 p의 확률로 사슴전략을 선택한 개체를 만날 것이고, 따라서 그들의 기대보수는 4p이다. 이때 집단 전체의 평균 기대보수는 4p ² + p (1 - p) + (1 - P)² 이다. 이때, 사슴전략을 선택한 개체들의 인구증가율은 곧 그들의 평균 보수에서 전체 집단의 평균 보수를 뺀 값에 비례하므로, 이를 아래 식 4.9와 같이 나타낼 수 있고, 다시 정리하면 식 4.10이 된다. 이를 확정적 복제동학 혹은 테일러-용커방정식이라 부른다.

(4.9) 1/p × dp/dt = β [4p - {4p² + p(1 - p) + (1 - p)²}]
(이때, β는 진화 속도를 나타내는 양(+)의 상수, t는 시간 변수)

(4.10) dp/dt = βp (1 - p) (4p - 1)

식 4.10에서 평형 상태는 세 개가 존재하는데, p = 0, p = 1, p = 0.25가 그것이다. 만약 최초에 사슴전략을 택한 인구가 25%보다 적었다면 사슴전략이 점점 쇠퇴해 그 비율이 0으로 수렴할 것이고, 반대의 경우에는 모두가 사슴전략을 택하게 될 것이며, 초기값이 정확히 0.25인 경우에만 그 균형상태가 유지될 것이다. 그러나 0.25라는 균형상태는 매우 불안정하기에, 결국 초기값이 우연히 0.25를 상회하느냐 혹은 하회하느냐에 따라 사회의 장기적 진화는 전혀 달라지게 되는 것이다. 이때, v = 4로 놓고 풀이한 결과 p = 1의 끌림영역 [0.25, 1]이 p = 0의 끌림영역 [0, 0.25]보다 넓으므로 p = 1이 장기적 안정상태이다. 사슴사냥게임에서는 v값이 2일 때를 기준으로 안정적 상태가 0인지 1인지 정해지는데, 이는 위험우위의 기준과 정확히 일치한다.

7. 혼합전략 내쉬균형의 직관성

혼합전략균형은 '상대방이 선택할 수 있는 순수전략들 간에 무차별하도록 만들어주는' 예측불허 메커니즘을 내가 구성하는 방식으로 구한다. 때문에, 사슴사냥게임과 같은 공조게임을 다룰 때에는 직관적이지 않고 치킨게임에서는 직관적이다.

8. 상관균형

혼합전략 내쉬균형에서는 경기자들이 각자 독립적 확률분포에 따라 행동한다고 가정하지만, 경기자들이 전략을 선택하는 확률분포 간에 상관관계를 가져도 좋다고 가정하는 상관균형의 개념도 존재한다. 이때, 전자는 상관계수가 0이라는 것과 같으므로 내쉬균형은 필연적으로 상관균형의 부분집합이다.