이전 포스트:
2024.12.17 - [Study] - Bayesian Decision Model (베이지안 의사결정 모델) 쉽게 알아보기 - Part 1. 베이지안 의사결정 이론이란?
목차
**저도 아직 배우는 중이라 정확하지 않는 부분이 있을 수도 있으니 출처 참고 부탁드립니다!**
지난 포스팅에서는 베이지안 의사결정 이론에 대해서 간단하게 이야기했다.베이지안 의사결정 이론은 결정을 내리는 과정에 있는 불확실한 요소에 대해 확률적으로 접근하는 이론이다. 따라서 이를 바탕으로 한 베이지안 의사결정 모델은 불확실성 하에서의 의사결정 과정을 모델링하는 모델이다. 지금부터 편의상 이 포스트에서는 베이지안 의사결정 모델을 베이지안 모델로 줄여 부르도록 하겠다.
흔히 베이지안 이론과 관련된 개념들을 다룰 때 사용하는 특정 용어들이 있는데, 나는 개인적으로 이 용어들이 처음 배울 때 이해를 더 어렵게 만드는 것 같다. 그래서 최대한 그런 용어들을 풀어서 이야기해 보려고 노력하겠다.
베이지안 모델은 간단하게 말하면 어떤 사람이 정보를 획득하고 그것으로 본인의 사전 지식을 업데이트시킨 후, 그 업데이트된 지식(= 사후지식)을 바탕으로 이익을 최대화 또는 손해를 최소화하는 행동을 취하는 의사결정 과정을 모델링한 것이다.
1. 베이지안 모델의 가정
여기서 베이지안 모델은 두 가지 가정을 기반으로 한다.
가정 1. 사람이 새로운 정보를 얻으면, 기존의 사전지식(사전확률)을 베이즈 정리에 따라 업데이트하여 사후확률을 형성한다.
(베이즈 정리에 대해서는 따로 정리를 하는 포스트를 만들어보겠다.)
이 가정이 의미하는 것은, 사람은 새로운 관찰 정보가 주어졌을 때, 기존의 사전지식을 완전히 무시하지 않고, 관찰된 정보와 결합해 더 나은 판단을 위한 지식(= 사후지식)을 형성한다는 가정이다. 우리가 기존에 알고 있던 사실에서 관련된 새로운 경험을 하면 기존에 알고 있다고 생각했던 그 사실을 새로운 경험을 바탕으로 약간 수정할 것이라는 이야기이다. 이 것은 내 입장에서는 매우 합리적인 가정이라고 생각한다. 왜냐하면 인간은 생존을 위해 끊임없이 정보를 습득하는 동물이니까. 정보습득을 통해 기존의 지식을 발전시킨 뒤에 행하는 행동이 더 생존에 도움이 된다고 판단한 것이 아닐까 하고 생각한다. (이 사족은 내 사견이다.)
가정 2. 사람은 특정 행동의 결과로 얻게 되는 이익과 손해를 고려하며, 항상 이익을 극대화하거나 손해를 최소화시키는 쪽으로 결정을 내린다.
이 가정이 의미하는 것은 사람이 의식적이든 무의식적이든 단순히 확률에만 의존해 결정을 내리는 것이 아니라, 특정 행동이 가져올 실질적 이익과 잠재적 손해를 고려한다는 이야기이다. 이는 베이지안 확률 업데이트 후, 최적의 행동을 선택하는 데 중요한 역할을 한다.
베이즈 정리에 따른 사전지식을 업데이트해 보다 정확한 사후 지식을 얻었다고 하자. 그럼 이 지식을 바탕으로 인간은 이익을 극대화하고 손해를 최소화하는 행동을 할 것이라는 이야기이다. 이런 행동을 두고 '합리적'이라고 표현한다. 나는 이 부분에 완전히 동의하는지는 모르겠지만, 일리 있는 가설이라고는 생각한다. 인간은 대체로 이익과 손해에 따라 움직이는 것 같다. 그리고 그 이익과 손해를 어떻게 설정하느냐에 따라서, 몇몇 비합리적인 선택도 모델링 할 수 있다고 보기 때문에 좋은 뼈대 모델이라고 생각한다.
2. 베이지안 모델링 과정 4단계
1단계) 생성모델(Generative Model)의 정의
조금 부정확하지만 간단하게 이야기하자면, 사전지식을 의미한다. 좀 더 정확하게 말하자면, 결정자가 세상에 대해서 어떻게 생각하고 있는지를 나타낸다. 결정자가 세상의 어떠한 상태
따라서, 생성모델을 세우는 방법은 간단하다.
이 두 식을 통해 관찰 데이터
2단계) 추론(Inference) 진행
추론 과정은 위에서 말한 대로 베이즈 정리에 따라 사전지식을 업데이트하는 과정을 말한다. 추론 과정을 통해 우리는 내가 관찰한 것을 바탕으로 세상의 상태
베이즈 정리를 사용해 기존 지식을 업데이트해보자:
3단계) 행동 또는 응답 결정
이 과정은 위의 두 번째 가정에 관련된 부분이다. 수정된 지식
같은 행동
자, 그럼 이제 내가
1.
- 내가
를 관찰했을 때,xx 의 확률을 확률 분포s1,s2,s3s1,s2,s3 로 나타낸다.P(s|x)P(s|x) - 이 확률 분포는 새로운 관찰
를 반영해 사전 확률xx 를 갱신한 결과다.P(s)P(s)
2. 각 상태
- 각 상태
일 때 내가 행동ss 를 취하면 얼마의 비용이 나오는지를 계산해서 더하면, 내가 행동aa 를 취할 때 발생할 비용을 계산할 ㅅ수 있다. 내가 관찰한 것은aa 이지만, 실제 현실에서는 어떤xx 인지를 100% 확신할 수 없으므로, 모든 상태ss 에서의ss 로 인한 비용을 더해준다.aa - Ex. 내가
를 관찰했을 때xx 의 행동을 취하면 나오는 비용 = (a1a1 일때s1s1 를 취할때의 비용 +a1a1 일 때s2s2 의 행동을 취할 때의 비용 +a1a1 일 때s3s3 의 행동을 취할 때의 비용)a1a1 - 이 때, 행동
에 대한 기대 비용은 각 상태별 비용을 해당 상태의 확률로 가중 평균을 내는 방식으로 아래 처럼 계산한다.a1a1
각 행동
- 기대 비용이란, 관찰한
로부터 상태xx 에 대한 확률을 반영하여 특정 행동ss 로 인해 발생하는 평균 비용을 말한다.aa - 기대 비용은 행동
의 결과로 발생하는 비용의 확률적 평균을 나타낸다. 이를 수학적으로는 나타내면 아래의 식과 같이 된다.aa
3. 모든 행동 옵션에 대한 기대 비용을 계산하고, 가장 작은 기대 비용을 가지는 행동을 선택한다.
예를 들어,
이를 수식으로 보면 다음과 같다.
만약 세계의 상태
4단계) 행동 또는 응답 데이터 생성
이렇게 위의 과정에서 우리는 결정자가 어떤 정보
3. 간단한 예시: 황금사과
1단계: 생성모델 (Generative Model)
의사결정자인 농부는 대부분의 사과는 빨간색(일반적)이지만, 드물게 황금 사과가 과수원에 나타난다는 것을 알고 있다. 이 때, 생성모델은 다음과 같다:
- 세상의 상태
: 사과는 진짜 황금 사과 (ss )이거나, 가짜 (s=1s=1 )일 수 있다.s=0s=0 - 관찰
: 어느 날 농부는 황금처럼 보이는 사과를 관찰한다.xx - 사전 분포
: 경험에 따르면:p(s)p(s) p(s=1)=0.1(황금 사과는 드물다), p(s=0)=0.9(일반적인 빨간 사과가 대부분이다). - 우도(likelihood)
: 황금 사과를 관찰할 확률은 사과가 진짜일 때 더 높고 (p(x|s) ), 가짜일 때 더 낮다 (p(x|s=1)=0.8 ).p(x|s=0)=0.3
2단계: 추론 (Posterior Calculation)
농부는 관찰
값을 대입하면:
따라서, 황금 사과가 진짜일 확률은 약 22.9%이다.
3단계: 행동 결정 (Taking an Action)
농부는 기대 효용을 기반으로 사과를 딸지 여부를 결정합니다:
- 비용 함수
:C(s,a) : 진짜 황금 사과를 판매하여 이익을 얻는다.C(s=1,pick)=−5 : 가짜 황금 사과를 따면 금전적 손실이 발생한다.C(s=0,pick)=10 : 사과를 따지 않으면 비용도, 이익도 없다.C(don’t pick)=0
사과를 딸 때 기대 비용은 다음과 같다:
사과를 따지 않을 경우 기대 비용은:
따라서
3단계: 응답 분포 (Response Distribution)
농부의 응답 (딸지 여부)은 확률적으로 모델링된다. 모델은 유사한 황금 사과를 관찰한 경우, 농부가 약 22.9%의 확률로 사과를 딸 것이라고 예측한다.
농부가 다양한 조건에서 반복적으로 황금 사과를 관찰하면, 응답 분포
여기까지 베이지안 의사결정 모델을 만드는 방법에 대해서 알아보았다. 최대한 쉽게 설명해보려고 햇지만, 개념이 개념인 만큼 오히려 설명이 길어져 더 보기 힘든 것은 아닌지 모르겠다. 만약 이상한 부분이나 질문이 있다면 언제든 댓글을 남겨주시면 좋을 것 같다.
다음 포스트에는 좀 더 본격적인 예시와 이를 베이지안 모델을 이용해 모델링하는 시간을 가져보려고 한다.
출처
Ma, Wei Ji, et al. “Bayesian Decision-Making in the Brain.” Neuron, vol. 92, no. 4, 2019, pp. 731–742, https://doi.org/10.1016/j.neuron.2019.09.034.
'Study' 카테고리의 다른 글
Bayesian Decision Model (베이지안 의사결정 모델) 쉽게 알아보기 - Part 1. 베이지안 의사결정 이론이란? (46) | 2024.12.17 |
---|---|
[Study] ADHD는 장애로 취급되어서는 안 된다? (7) | 2024.11.18 |
쥐의 뇌 커넥텀 (Mouse Brain Connectome)과 신경과학 연구의 미래 (9) | 2024.10.04 |
“그룹화(groupitizing)” 전략을 이용한 숫자 세기 (3) | 2024.10.03 |
계산 사회과학: 집단 행동을 이해하는 새로운 렌즈 (Marr의 3단계 분석 방법) (11) | 2024.10.03 |