일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 데이터엔지니어
- Amazon
- CS
- 개념정리
- 파이썬
- 운영체제
- 자료구조
- 알고리즘
- 프로그래머스
- WEB
- airflow
- 데이터엔지니어링
- 클라우드
- Service
- 데이터베이스
- 웹자동화
- 부트캠프
- 에어플로우
- 관계형데이터베이스
- 데브코스
- 개발
- 웹스크래핑
- AWS
- 데이터웨어하우스
- 기술면접
- DataWarehouse
- 취준
- Django
- SQL
- 웹크롤링
- Today
- Total
사진과 음악을 좋아하는 개발자 지망생의 블로그
[Web Scraping 기초] Seaborn 기초 본문
Seaborn
- 스크래핑으로 데이터 추출만 하면 데이터가 너무 분산되어 보기가 힘들다
- 정보를 요약해서 한 눈에 보여줄 수 있는 '시각화'를 하면 완성도 잇는 결과가 나올 것이다
- Seaborn은 matplotlib을 기반으로 하는 파이썬의 데이터 시각화 라이브러리이다
1) Seaborn 설치
- Seaborn을 사용하기 위해 먼저 Seaborn 라이브러리를 설치해야한다
- pip install을 통해 간단하게 실행할 수 있다 (cmd창에 아래 코드 입력, Jupyter Notebook에선 맨 앞에 % 붙임)
pip install seaborn
※ 만약 설치가 안된다면 다음 코드를 실행해보자
python -m pip install seaborn
2) Seaborn 시작하기
- seaborn을 사용하기 위해선 seaborn을 import 해야한다
import seaborn as sns
- Jupyter notebook으로 seaborn을 사용하게 되면, show() 메소드 없이 자동으로 그래프를 그려준다
- 이는 Jupyter notebook 만의 특징으로, Jupyter notebook 외 환경에서 진행하게 된다면 matplotlib.pyplot를 import
해주고, 소스 마지막에 반드시 show() 메소드를 적어줘야 한다
- 만약, matplotlib 설치가 필요하다면 다음 코드를 입력하여 라이브러리를 설치한다
pip install matplotlib
# 안되면, python -m pip install matplotlib
- 대표적인 그래프
1. 꺾은선 그래프 (Line Plot)
import seaborn as sns
#import matplotlib.pyplot as plt
sns.lineplot(x = [1, 3, 2, 4], y = [4, 3, 2, 1])
#plt.show()
- 매개변수를 명확히 명시하는 것이 좋다
2. 막대 그래프 (Bar Plot)
import seaborn as sns
#import matplotlib.pyplot as plt
sns.barplot(x=['james','anna','charles','jenny'],y=[0.7,0.2,0.1,0.05])
#plt.show()
3. 이 외 그래프
- seaborn은 matplotlib 기반 데이터 시각화 라이브러리이기 때문에 다양한 그래프를 지워한다
- 꺽은선, 막대 이 외에도 파이, 히스토그램, 박스, 선 점도 등 다양한 그래프를 지원한다
4. Plot의 속성
- seaborn은 파이썬의 시각화 라이브러리 matplotlib을 기반으로 만들어졌다
- matplotlib.pyplot의 속성을 변경해서 그래프에 다양한 요소를 변경/추가할 수 있다
- 제목 변경
import seaborn as sns
import matplotlib.pyplot as plt
sns.barplot(x=[1,2,3,4],y=[0.7,0.2,0.1,0.05])
plt.title("Bar Plot")
plt.show()
- 그래프 축 설명 추가
import seaborn as sns
import matplotlib.pyplot as plt
sns.barplot(x=[1,2,3,4],y=[0.7,0.2,0.1,0.05])
plt.xlabel("X Label")
plt.ylabel("Y Label")
plt.show()
- 그래프 축 범위 지정
import seaborn as sns
import matplotlib.pyplot as plt
sns.lineplot(x=[1, 3, 2, 4], y=[4, 3, 2, 1])
plt.ylim(0, 10) #plt._lim(시작점, 종료점)
plt.show()
- 그래프 축 크기 지정
#일단 figure를 그린 후 라인을 그림
plt.figure(figsize =(20, 10)) # plt.figure(figsize = (x, y)) 를 앞에다 그려야한다
sns.lineplot(x=[1, 3, 2, 4], y=[4, 3, 2, 1])
plt.show()
'개발 > 웹 스크래핑' 카테고리의 다른 글
[Web Scraping 기초] 워드클라우드(Wordcloud) 만들기 (0) | 2023.04.21 |
---|---|
[Web Scraping 기초] Seaborn - 스크래핑 결과 시각화하기 (0) | 2023.04.21 |
[Web Scraping 기초] Selenium으로 웹브라우저 자동화하기 (0) | 2023.04.20 |
[Web Scraping 기초] BeautifulSoup을 이용한 웹 스크래핑 (0) | 2023.04.19 |
[Web Scraping 기초] BeautifulSoup (0) | 2023.04.19 |