1. 사회적 실현가능성 및 개인적 합리성
8장을 통해 무한반복 죄수의 딜레마 게임에서는 협조체제의 유지가 균형으로 자리매김할 수 있음이 설명되었다. 각 경기자들이 최악의 상황하에서 얻을 수 있는 보수보다 높으며 사회적으로 실현가능한 어떠한 보수더라도 경기자들이 충분히 미래지향적이라면 동태적 균형으로서 달성 가능하다. 이것이 상술한 사례를 일반화한 전래정리이다.
예를 들어, 죄수의 딜레마 게임에서 네 개의 순수전략 조합에 해당하는 보수벡터를 좌표평면에 배치할 때, 모든 가능한 확률 조합은 네 개의 점으로 둘러쌓인 사각형 안에 존재한다. 따라서, 사회적 실현가능 보수집합은 이 네 점을 둘러싸는 가장 작은 볼록 다각형의 내부와 경계가 된다.또한, 각 경기자는 배신행위에 대한 보복을 당할 때에도 최대한 자신을 방어하려고 할 것이다. 이를테면 경기자2는 경기자1이 자백하는 상황에서 스스로를 방어하기 위해 자백을 선택할 것이다. 이때 그의 전략은 최대극소전략이며, 무한반복게임에서 경기자는 자신의 최대극소보수보다 더 낮은 평균할인보수를 가져다 주는 상황을 결코 허용하지 않는다. 이를 개인합리성이라 부른다. 결국, 사회적 실현가능성과 개인합리성을 모두 만족하는 보수벡터의 집합이 전래정리에 따른 동태적 균형으로서 달성 가능한 집합을 이룬다.
2. 전래정리: 내쉬균형
만약 각 경기자의 할인인자 δ가 충분히 크다면, 한쪽의 보수가 다른 한쪽보다 작은 경우에도 그 보수벡터는 무한반복게임의 균형으로서 달성 가능하다. 무한반복게임의 내쉬균형 개념하에서 성립하는 전래정리는 다음과 같다. 사회적으로 실현가능하고 개인합리성을 만족하는 임의의 복수벡터 v = (v₁, v₂) ∈ V* 를 고려할 때, 경기자들의 할인인자가 충분히 크다면 경기자1의 평균할인보수가 v₁과 같도록 만들어주는 무한반복게임의 내쉬균형이 존재한다. 만약 어느 경기자가 배신을 감행할 경우 다른 모든 경기자들이 다음 단계부터 충분한 기간 동안 해당 경기자의 보수를 최대극소화하는 전략을 선택할 것이다. 이런 식의 정상국면-보복국면으로 이루어진 방아쇠전략을 상대가 사용한다고 가정할 때, 어느 누구도 예정된 경로를 이탈하려는 유인을 갖지 못할 것이다. 즉, 정상국면-보복국면으로 이루어진 방아쇠전략이 무한반복게임의 내쉬균형이 되는 것이다.
3. 전래정리: 부분게임완전균형
그러나 이러한 내쉬균형이 부분게임완전균형이 아닐 수 있다. 경기자1이 예정된 경로를 이탈했고, 그에 따라 경기자2가 보복을 감행하지만 이 경우 경기자2의 보복 전략이 자신의 최대극소보수에 훨씬 못미치는 구조의 게임이 있을 수 있다. 이런 상황에서 경기자2는 차라리 보복을 포기하는 것이 나을 수도 있다. 그러나 주어진 보수벡터를 무한반복게임의 부분게임완전균형으로서 달성가능하게끔 해주는 방아쇠전략이 아예 없는 것은 아니다. 그러한 방아쇠전략의 형태는 정상국면-보복국면-보상국면으로 짜여진다.
'TIL' 카테고리의 다른 글
| 「게임이론: 전략과 정보의 경제학」 11장 - 정태적 미비정보 게임 (0) | 2025.09.10 |
|---|---|
| 「게임이론: 전략과 정보의 경제학」 10장 - 반복게임의 응용 (3) | 2025.09.07 |
| 「게임이론: 전략과 정보의 경제학」 8장 - 반복게임 (1) | 2025.09.05 |
| 「게임이론: 전략과 정보의 경제학」 7장 - 협상과 중재 (0) | 2025.09.04 |
| 「게임이론: 전략과 정보의 경제학」 6장 - 전개형게임의 응용 (0) | 2025.09.03 |