본문 바로가기

2021-2 빅데이터 스터디

[4] 데이터 시각화와 차트분석 기법

섹션0. 시작하기

[데이터 시각화란 무엇인가?]

- 생성된 데이터를 어떻게 가치 있게 만들 것인가..

- 많은 차트.. 자주 씀..

- 왜 차트를 사용할까 ?

> Comparison and Ranking <

   데이터를 비교하고 순위 매기기 위해

> Part to whole <

   전체 중에 얼마나 해당되는가 ?

> Trend <

   트랜드가 어떻게 되는가 ? (주가, 환율 등..)

> Correlation <

   상관관계 (월마트~ 기저귀~ 맥주,, 예측하기 힘든,,)

> Distribution <

   분산 (얼마나 퍼져있는가 ? 이것을 중심으로 어떤 값을 기준으로 할 것인가 ?) 등


섹션1. 데이터 시각화 - 핵심차트 10

 

> Comparison and Ranking <

[1] Column, Bar 차트

Column : 비교를 나타냄.. (ex. 시계열 분석)

Bar : Column을 수평으로 둔 것 (ex. 기업별 매출, 순위)

[2] Dual Axis, 파레토 차트

히스토그램이 파생된 형태로 볼 수도 있음.

두 개의 차트를 뭉쳐 놓은 것. (두 개의 축 有)

파레토 차트의 목적 : 가장 중요한 요소가 무엇인지 찾아내는 것 (highlight)

> 선택과 집중을 할 때, 가장 많이 쓰임,, ! (가장 큰 원인이 무엇인가 ?)

 

> Part to whole <

[3] Pie 차트

통계 숫자를 범주화하여 나타냄.

무엇이 ~ 얼마나 차지하는가 ~ (정확한 포지션을 알 수 있는 것)

 

> Trend <

[4] Line 차트

트랜트를 나타내는 대표적인 차트 

시계열 분석에도 사용할 수 있음. ( + 주식, 환율 )

 

> Correlation <

[5] Scatter 차트

연관성(상관관계)을 나타내는 대표적인 차트. 

얼마나 많이 분포되어 있는가 ? 

측정하는 두 대상 사이 관계를 나타낼 때..

연관성 분석 - 버스, 지하철 어디서 어디로 이동 인구 많구나,,

나이에 따른 몸무게의 상관관계 등..

[6] Bubble 차트

Scatter 차트의 변형 버전. 버블의 사이즈를 나타낼 수 있음.

어떤 특정한 카테고리.. 얼마나 많은지 보여줌.

BCG Matrix 

[7] Heat Map

R이나 Python에서 자주 쓰는 차트.

엑셀에서도 쉽게 적용 가능

여러 데이터를 직관적으로 파악하기 좋음.

아이템 간의 관계를 보여주고, 비율 정보를 색으로 보여줌.

많은 정보를 보여주기 때문에 기본적, 깔끔하게 구현.

 

> Distribution <

[8] Histogram

bin이라는 단위로 나눔. 기준 : 잘 ~ 나눠야 함..

[9] Box Plot

5가지의 정보를 나타냄.

최솟값, 제1사분위수, 중앙값(제2사분위수), 제3사분위수, 최댓값.

Scatter차트와 섞어서 사용하기도 함.

[10] Geo

직관적인 지도 차트.

분포되어있는 데이터를 지도에 나타냄.

과연 어느 지역에 @@(매출, 사용량 등)가 가장 많은가?


섹션2. 활용하기

[파이썬 데이터 시각화 분석 실전 프로젝트 - 보스턴 마라톤 대회]

[1] Column

- 어느 지역에서 가장 많이 시작하는가 ?

- (성별)얼마나 많이 참여하는가 ?

이런 식의 추세를 확인할 수 있음.

[2] Dual Axis

연령별로 , 상품들을 배치 , 광고 : 효과적으로

[3] Pie

전체 중 얼마나 차지하는가 ~ matplotlib

마케팅 - 남성 광고 & 여성 광고 얼마나 할건지

[4] Line

시간을 x축으로 추이를 볼 때 가장 많이 쓰임.

마라톤 성적의 상위 100명 - 구간 별로 어떤 페이스 ?

[5] Scatter

(연령별, 성별별) 마라톤 성적의 상관관계

[6] Bubble

- 사람들이 많이 지치는 시간 ?- 어느 지점에 얼만큼 모이는가 ?종합하여 적절하게 구급차를 배치

[7] Heat Map

스포츠 용품 마케팅 ; 어떤 성별, 연령 - 빈도수

[8] Histogram

마케팅 - 그렇다면 얼마만큼 분포가 ?

실제 수치를 분포로 볼 수 있도록 ,,

[9] Box Plot

남/여 페이스 값

[10] Geo

어느 지점에 사람들이 얼만큼 ?

지도와 Heat Map 이용해서 얼마나 많은 사람들이 있는지?


 

[무료] 데이터 시각화와 차트분석 기법 - 인프런 | 강의

이 강좌를 통해 데이터 시각화에 대한 개념을 이해하고 차트의 핵심용도 5가지와 핵심 차트 10가지를 배워서 데이터 분석 프로젝트에 적절하게 활용할 수 있습니다., 데이터 시각화와  차트분석

www.inflearn.com

 

creApple 크리애플

크리애플은 새로운 기술과 이를 응용하는 창의적인 애플리케이션 교육에 힘쓰는 지식 큐레이션 포털입니다. creApple is a knowledge curation portal dedicated to training new technologies and creative applications that a

www.creapple.com