Ridge 회귀 하이퍼파라미터 정리

topics 100-데이터분석 & AI 101 머신러닝
types 이론 레퍼런스
tags #ridge #regression #hyperparameter

Ridge 회귀 하이퍼파라미터 정리

1. alpha (정규화 강도, 규제 계수)

  • 설명: L2 정규화 강도를 조절하는 하이퍼파라미터.

  • 역할: 값을 높일수록 계수를 더 많이 패널티하여 모델이 단순해짐(과적합 방지). 값이 너무 크면 과소적합 위험.

  • 기본값: 1.0

2. fit_intercept

  • 설명: 절편(Intercept)을 학습할지 정하는 옵션.

  • 값: True(기본값, 절편 포함), False(절편 미포함)

3. normalize

  • 설명: 입력 데이터 피처를 정규화(평균0, 분산1)할지 여부(구버전).

  • 주의: 최근 버전에서는 사용 중단됨. StandardScaler 사용 권장.

4. solver

  • 설명: 최적화에 사용할 알고리즘 종류 선택.

  • 값 예시: ‘auto’, ‘svd’, ‘cholesky’, ‘lsqr’, ‘sparse_cg’, ‘sag’, ‘saga’, ‘lbfgs’

  • 특징: 데이터 크기, 희소성 등에 따라 최적 solver가 다를 수 있음.

5. max_iter

  • 설명: 반복 최적화 알고리즘의 최대 반복 횟수.

  • 기본값: None(알고리즘마다 다름), 필요하면 명시적으로 설정.


관련 문서