부스트캠프 AI Tech 4기

[Data viz] 1. 시각화의 요소 상태 & Matplotlib

StoneSeller 2022. 10. 7. 10:30

데이터 시각화

시각화를 진행할 데이터가 데이터셋 관점(global)인지, 개별 데이터의 관점(local)인지 파악해야한다.

 

 

데이터셋의 종류

  • 정형 데이터
  • 시계열 데이터
  • 지리 데이터
  • 관계형 데이터
  • 계층적 데이터
  • 비정형 데이터

 

데이터의 종류

  • 수치형(numerical)
    • 연속형(continuous) : 길이, 무게, 온도
    • 이산형(discrete) : 주사위 눈금
  • 범주형(categorical)
    • 명목형 (nominal) : 혈액형, 종교
    • 순서형 (ordinal) : 학년, 별점, 등급

 

시각화 이해하기

마크(mark) : 점, 선, 면

채널(channel) : 각 마크를 변경할 수 있는 요소들 (Position, Color, Shape, Size...)

 

 


Matplotlib

matplotlib에서 그리는 시각화는 figure라는 큰 틀에 ax라는 서브플롯을 추가해서 만든다.

 

 

figure의 figsize로 서브플롯 ax의 사이즈를 조정한다.

 

 

서브플롯을 여러개 그리고자 한다면 위치를 지정해주어야 한다.

 

 

서브플롯 객체에 그리기

 

 

한 서브플롯에서 여러개의 그래프를 그리기

 

 

범례를 추가하기

 

Title 추가하기

 

 

각각의 subplot에 title을 추가하는것 이외로 전체의 figtitle을 추가할 수도 있다.

 

 

원하는 위치에 text를 넣기

 

 


부스트캠프 AI Tech 교육 자료를 참고하였습니다.

728x90