가우시안

topics 100-데이터분석 & AI 104 수학,통계
types 이론 레퍼런스
tags #gaussian #statistics #normal-distribution

가우시안

What is 가우시안

가우시안(Gaussian)은 정규분포(Normal Distribution)를 의미한다. 데이터가 평균을 중심으로 좌우 대칭인 종 모양(Bell curve)을 이루는 확률 분포이다.

왜 중요할까

많은 자연 현상과 측정값들이 가우시안 분포를 따른다. 때문에 통계학과 머신러닝에서 가장 기본이 되는 분포이다.

  • 중심극한정리(Central Limit Theorem)에 의해 충분히 많은 샘플의 평균은 가우시안 분포를 따른다
  • 많은 머신러닝 알고리즘의 기본 가정이 가우시안 분포이다

주요 특징

  • 평균(μ): 분포의 중심
  • 표준편차(σ): 분포의 퍼진 정도
  • 확률밀도함수(PDF): 각 값이 나타날 확률

응용 분야

  • 가우시안 나이브 베이즈(Gaussian Naive Bayes)
  • 가우시안 프로세스(Gaussian Process) 회귀
  • 정규성 검정(Normality Test)

참고 자료

가우시안의 공분산 행렬에 대한 자세한 논의:

https://www.reddit.com/r/MachineLearning/comments/4xnqkw/basic_question_why_is_the_covariance_matrix_of/?tl=ko

관련 문서