미뤄놨던거라 아주 간단하게 하고 끝내려고한다 ㅠㅠ
요즘 너무 밀리고 밀려 퀄리티가 슬픔..
일단 원론적인 개념은 베이즈추론에서 출발한다.
베이즈 추론은 통계적 추론의 한 방법으로 사전확률과 추가적인 정보를 통해 사후확률을 추론하는 방법을 의미한다.
베이즈 정리 수식은 다음과 같다
헷갈릴만한 두 개념을 정리해보면
P(B|A)는 우도 확률 :원인 A가 발생하였다고 했을 때 B가 발생할 조건부 확률
사후확률 P(A|B) :가 발생시 조건하에서 A가 발생할 확률
회귀에서도 Loss를 최소화하기 위해 매개변수의 분포를 찾는 과정으로 베이즈 추론이 활용되곤 하지만
주로 분류기로 활용되곤 한다.
분류에서 사용되는 나이브 베이즈는 특성들 사이의 독립을 가정하는 베이즈 정리를 적용한 확률 분류기를 의미한다.
나이브라는 뜻이 순진한이라는 뜻인데 베이즈 이론을 바탕으로 나이브한 전제를 가지고 한다는 의미이다.
즉 모든 특성이 독립적이라고 가정하는 것!
예를들어 내가 한국사람이라는 것에 대해
키가 어떻고 성씨가 어떻고 얼굴 생김새가 어떻고 하는 이런 특성들이 서로 연관성이 없고
특정 사람이 한국사람인 확률에 독립적으로 기여한다는 걸 의미한다.
자세한 계산 과정을 예시로 설명하는 포스팅이 많으니 생략하고 간단하게만 보자면
어떤 사람의 키와 성씨, 얼굴 생김새 등을 특성으로 보았을 때
이 사람이 한국인일 확률과 한국인이 아닐 확률을 베이즈 정리 식으로 구한 뒤
두 확률을 비교해 더 높은쪽으로 분류하는 것이다.
특성의 분포에 따라 가우시안, 다항분포, 베르누이 같은 이벤트 모델이 존재한다.
그럼 끝!
진짜 간단 정리다 ㅋㅋ 바쁘다 바빠 ㅠ
'데이터 사이언스 공부 > 개념 정리' 카테고리의 다른 글
딥러닝 분석 알고리즘 간단 개념 정리 (DNN, CNN, RNN) (0) | 2022.11.16 |
---|---|
랜덤포레스트 (Random Forest) 간단 개념 정리 (0) | 2022.11.02 |
연관분석 간단 개념 정리 (0) | 2022.10.31 |
Support Vector Machine 간단 개념 정리 (0) | 2022.10.26 |
댓글