사진과 음악을 좋아하는 개발자 지망생의 블로그

[Web Scraping 기초] Seaborn 기초 본문

개발/웹 스크래핑

[Web Scraping 기초] Seaborn 기초

devculture309 2023. 4. 21. 12:45
반응형

Seaborn 

  - 스크래핑으로 데이터 추출만 하면 데이터가 너무 분산되어 보기가 힘들다

  - 정보를 요약해서 한 눈에 보여줄 수 있는 '시각화'를 하면 완성도 잇는 결과가 나올 것이다

  - Seaborn은 matplotlib을 기반으로 하는 파이썬의 데이터 시각화 라이브러리이다

 

1) Seaborn 설치

  - Seaborn을 사용하기 위해 먼저 Seaborn 라이브러리를 설치해야한다

  - pip install을 통해 간단하게 실행할 수 있다 (cmd창에 아래 코드 입력, Jupyter Notebook에선 맨 앞에 % 붙임)

pip install seaborn

  ※ 만약 설치가 안된다면 다음 코드를 실행해보자

python -m pip install seaborn

 

2) Seaborn 시작하기

  - seaborn을 사용하기 위해선 seaborn을 import 해야한다

import seaborn as sns

  - Jupyter notebook으로 seaborn을 사용하게 되면, show() 메소드 없이 자동으로 그래프를 그려준다

  - 이는 Jupyter notebook 만의 특징으로, Jupyter notebook 외 환경에서 진행하게 된다면 matplotlib.pyplot를 import 

   해주고, 소스 마지막에 반드시 show() 메소드를 적어줘야 한다

 - 만약, matplotlib 설치가 필요하다면 다음 코드를 입력하여 라이브러리를 설치한다

pip install matplotlib

# 안되면, python -m pip install matplotlib

  - 대표적인 그래프

    1. 꺾은선 그래프 (Line Plot)

import seaborn as sns
#import matplotlib.pyplot as plt

sns.lineplot(x = [1, 3, 2, 4], y = [4, 3, 2, 1])
#plt.show()

      - 매개변수를 명확히 명시하는 것이 좋다

    2. 막대 그래프 (Bar Plot)

import seaborn as sns
#import matplotlib.pyplot as plt

sns.barplot(x=['james','anna','charles','jenny'],y=[0.7,0.2,0.1,0.05])
#plt.show()

  3. 이 외 그래프

    - seaborn은 matplotlib 기반 데이터 시각화 라이브러리이기 때문에 다양한 그래프를 지워한다

    - 꺽은선, 막대 이 외에도 파이, 히스토그램, 박스, 선 점도 등 다양한 그래프를 지원한다

  4. Plot의 속성

    - seaborn은 파이썬의 시각화 라이브러리 matplotlib을 기반으로 만들어졌다

    - matplotlib.pyplot의 속성을 변경해서 그래프에 다양한 요소를 변경/추가할 수 있다

    - 제목 변경

import seaborn as sns
import matplotlib.pyplot as plt

sns.barplot(x=[1,2,3,4],y=[0.7,0.2,0.1,0.05])
plt.title("Bar Plot")

plt.show()

    - 그래프 축 설명 추가

import seaborn as sns
import matplotlib.pyplot as plt

sns.barplot(x=[1,2,3,4],y=[0.7,0.2,0.1,0.05])
plt.xlabel("X Label")
plt.ylabel("Y Label")

plt.show()

    - 그래프 축 범위 지정

import seaborn as sns
import matplotlib.pyplot as plt

sns.lineplot(x=[1, 3, 2, 4], y=[4, 3, 2, 1])
plt.ylim(0, 10) 	#plt._lim(시작점, 종료점)

plt.show()

    - 그래프 축 크기 지정

#일단 figure를 그린 후 라인을 그림
plt.figure(figsize =(20, 10))   # plt.figure(figsize = (x, y)) 를 앞에다 그려야한다						
sns.lineplot(x=[1, 3, 2, 4], y=[4, 3, 2, 1])

plt.show()
반응형