데이터 시각화
| topics | |
| types | 실습 도구 |
| tags |
seaborn이 Matplotlib위에 만들어진 라이브러리
이케사용가능
import seaborn as sns
import matplotlib.pyplot as plt
sns.boxplot(x='species', y='sepal_length', data=df)
plt.title('Sepal Length by Species') # plt로 제목 추가
plt.xlabel('Species') # plt로 x축 라벨 추가
plt.ylabel('Sepal Length') # plt로 y축 라벨 추가
plt.show()
주요 함수들
https://diane-space.tistory.com/128
시본시각화
| 함수 | 주요 용도 | 대표 시각화 |
|---|---|---|
| kdeplot | 연속형 데이터 분포 | 밀도곡선 |
| pairplot | 다변량 변수간 관계, 분포 | 산점도/히스토그램 |
| countplot | 범주형 데이터 빈도 | 막대그래프 |
| heatmap | 2D 데이터의 값 크기/패턴 | 색상 행렬 |
| boxplot | 수치형 데이터 분포/이상치 | 상자수염그림 |
import matplotlib.pyplot as plt
# <span id="원형차트로-벨류의-비율을-보여주고픔"></span>원형차트로 벨류의 비율을 보여주고픔
plt.figure(figsize = (8, 5))
df['voc_trt_perd_itg_cd'].value_counts().plot(kind = 'pie', autopct = '%.2f%%')
plt.show()
# <span id="특정-컬럼의-값의-데이터를-10개의-구간으로-나눠-히스토그램으로"></span>특정 컬럼의 값의 데이터를 10개의 구간으로 나눠 히스토그램으로
plt.hist(wine['alcohol'], bins=10)
# <span id="산점도"></span>산점도
# <span id="아래-둘다-같음"></span>아래 둘다 같음
wine.plot.scatter(x='rat_ca', y='quality')
plt.scatter(wine['rat_ca'], wine['quality'])
# <span id="선그래프"></span>선그래프
plt.plot(range(1, 51), accs) # 순서대로 x, y 값
# <span id="여러-옵션들"></span>여러 옵션들
plt.title('Accuracy')
plt.xlabel('epochs')
plt.ylabel('accuracy')
plt.legend()
plt.grid(True)
# <span id="막대그래프-"></span>막대그래프
df.plot.bar()
# <span id="박스플롯-"></span>박스플롯
df.plot.box()
# <span id="시본-버전"></span>시본 버전
import seaborn as sns
# <span id="산점도"></span>산점도
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill", y="tip", data=tips)
# <span id="막대그래프"></span>막대그래프
sns.barplot(x="day", y="total_bill", data=tips)
# <span id="히스토그램"></span>히스토그램
sns.histplot(x="total_bill", data=tips, bins=20, kde=True)
# <span id="페어플롯-여러-변수-간-관계-시각화"></span>페어플롯 (여러 변수 간 관계 시각화)
iris = sns.load_dataset("iris")
sns.pairplot(data=iris, hue="species")
---