데이터 시각화
시각화를 진행할 데이터가 데이터셋 관점(global)인지, 개별 데이터의 관점(local)인지 파악해야한다.
데이터셋의 종류
- 정형 데이터
- 시계열 데이터
- 지리 데이터
- 관계형 데이터
- 계층적 데이터
- 비정형 데이터
데이터의 종류
- 수치형(numerical)
- 연속형(continuous) : 길이, 무게, 온도
- 이산형(discrete) : 주사위 눈금
- 범주형(categorical)
- 명목형 (nominal) : 혈액형, 종교
- 순서형 (ordinal) : 학년, 별점, 등급
시각화 이해하기
마크(mark) : 점, 선, 면
채널(channel) : 각 마크를 변경할 수 있는 요소들 (Position, Color, Shape, Size...)
Matplotlib
matplotlib에서 그리는 시각화는 figure라는 큰 틀에 ax라는 서브플롯을 추가해서 만든다.
figure의 figsize로 서브플롯 ax의 사이즈를 조정한다.
서브플롯을 여러개 그리고자 한다면 위치를 지정해주어야 한다.
서브플롯 객체에 그리기
한 서브플롯에서 여러개의 그래프를 그리기
범례를 추가하기
Title 추가하기
각각의 subplot에 title을 추가하는것 이외로 전체의 fig에 title을 추가할 수도 있다.
원하는 위치에 text를 넣기
부스트캠프 AI Tech 교육 자료를 참고하였습니다.