섹션0. 시작하기
[데이터 시각화란 무엇인가?]
- 생성된 데이터를 어떻게 가치 있게 만들 것인가..
- 많은 차트.. 자주 씀..
- 왜 차트를 사용할까 ?
> Comparison and Ranking <
데이터를 비교하고 순위 매기기 위해
> Part to whole <
전체 중에 얼마나 해당되는가 ?
> Trend <
트랜드가 어떻게 되는가 ? (주가, 환율 등..)
> Correlation <
상관관계 (월마트~ 기저귀~ 맥주,, 예측하기 힘든,,)
> Distribution <
분산 (얼마나 퍼져있는가 ? 이것을 중심으로 어떤 값을 기준으로 할 것인가 ?) 등
섹션1. 데이터 시각화 - 핵심차트 10
> Comparison and Ranking <
[1] Column, Bar 차트
Column : 비교를 나타냄.. (ex. 시계열 분석)
Bar : Column을 수평으로 둔 것 (ex. 기업별 매출, 순위)
[2] Dual Axis, 파레토 차트
히스토그램이 파생된 형태로 볼 수도 있음.
두 개의 차트를 뭉쳐 놓은 것. (두 개의 축 有)
파레토 차트의 목적 : 가장 중요한 요소가 무엇인지 찾아내는 것 (highlight)
> 선택과 집중을 할 때, 가장 많이 쓰임,, ! (가장 큰 원인이 무엇인가 ?)
> Part to whole <
[3] Pie 차트
통계 숫자를 범주화하여 나타냄.
무엇이 ~ 얼마나 차지하는가 ~ (정확한 포지션을 알 수 있는 것)
> Trend <
[4] Line 차트
트랜트를 나타내는 대표적인 차트
시계열 분석에도 사용할 수 있음. ( + 주식, 환율 )
> Correlation <
[5] Scatter 차트
연관성(상관관계)을 나타내는 대표적인 차트.
얼마나 많이 분포되어 있는가 ?
측정하는 두 대상 사이 관계를 나타낼 때..
연관성 분석 - 버스, 지하철 어디서 어디로 이동 인구 많구나,,
나이에 따른 몸무게의 상관관계 등..
[6] Bubble 차트
Scatter 차트의 변형 버전. 버블의 사이즈를 나타낼 수 있음.
어떤 특정한 카테고리.. 얼마나 많은지 보여줌.
BCG Matrix
[7] Heat Map
R이나 Python에서 자주 쓰는 차트.
엑셀에서도 쉽게 적용 가능
여러 데이터를 직관적으로 파악하기 좋음.
아이템 간의 관계를 보여주고, 비율 정보를 색으로 보여줌.
많은 정보를 보여주기 때문에 기본적, 깔끔하게 구현.
> Distribution <
[8] Histogram
bin이라는 단위로 나눔. 기준 : 잘 ~ 나눠야 함..
[9] Box Plot
5가지의 정보를 나타냄.
최솟값, 제1사분위수, 중앙값(제2사분위수), 제3사분위수, 최댓값.
Scatter차트와 섞어서 사용하기도 함.
[10] Geo
직관적인 지도 차트.
분포되어있는 데이터를 지도에 나타냄.
과연 어느 지역에 @@(매출, 사용량 등)가 가장 많은가?
섹션2. 활용하기
[파이썬 데이터 시각화 분석 실전 프로젝트 - 보스턴 마라톤 대회]
[1] Column
- 어느 지역에서 가장 많이 시작하는가 ?
- (성별)얼마나 많이 참여하는가 ?
이런 식의 추세를 확인할 수 있음.
[2] Dual Axis
연령별로 , 상품들을 배치 , 광고 : 효과적으로
[3] Pie
전체 중 얼마나 차지하는가 ~ matplotlib
마케팅 - 남성 광고 & 여성 광고 얼마나 할건지
[4] Line
시간을 x축으로 추이를 볼 때 가장 많이 쓰임.
마라톤 성적의 상위 100명 - 구간 별로 어떤 페이스 ?
[5] Scatter
(연령별, 성별별) 마라톤 성적의 상관관계
[6] Bubble
- 사람들이 많이 지치는 시간 ?- 어느 지점에 얼만큼 모이는가 ?종합하여 적절하게 구급차를 배치
[7] Heat Map
스포츠 용품 마케팅 ; 어떤 성별, 연령 - 빈도수
[8] Histogram
마케팅 - 그렇다면 얼마만큼 분포가 ?
실제 수치를 분포로 볼 수 있도록 ,,
[9] Box Plot
남/여 페이스 값
[10] Geo
어느 지점에 사람들이 얼만큼 ?
지도와 Heat Map 이용해서 얼마나 많은 사람들이 있는지?
'2021-2 빅데이터 스터디' 카테고리의 다른 글
[6] 전세계 축구 선수 몸값 분석 (섹션1, 2) (0) | 2021.11.12 |
---|---|
[5] 프로세스 마이닝을 활용한 고객여정분석 (0) | 2021.11.05 |
[3] Pandas 팬더스 데이터분석 기초 실습 (0) | 2021.09.20 |
[2] 30분 요약 강좌 시즌2 : Python 활용편 (섹션4 ~ 섹션6) 完 (1) | 2021.09.17 |
[1] 30분 요약 강좌 시즌2: Python 활용편 (~ 섹션 3) (0) | 2021.09.10 |