Notice
Recent Posts
Recent Comments
Link
«   2025/03   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
Tags more
Archives
Today
Total
관리 메뉴

데이터 분석

태블로 신병훈련소 17기 - 1일차 (차원, 측정값, 집계) 본문

tableau/태블로 신병훈련소 17기

태블로 신병훈련소 17기 - 1일차 (차원, 측정값, 집계)

시니조 2023. 2. 22. 16:51

https://www.facebook.com/groups/KoreaTUG/?mibextid=HsNCOg 

 

한국 태블로(Tableau) 사용자 모임 | Facebook

데이터 분석 및 시각화, 그리고 태블로(Tableau)에 관심있는 분들을 위한 공간입니다.

www.facebook.com

평소 데이터 시각화에 관심을 갖게 되었다. 그러던 중 태블로에서 교육 프로그램을 운영한다는 것을 알게 되었고, 바로 신청하게 됐다.

위 페이스북 게시물에 올라온 공지를 보고 신청했다.

 

신병훈련소는 태블로에서 운영하는 교육프로그램이고, Slack에 공지로 강의와 과제를 올려주면 듣고 풀어보면서 태블로에 대해 알아가는 무료로 진행되는 프로그램이였다. 

 

2주차 강의가 모두 끝난 지금 그 동안 학습한 내용들에 대해 복기하면서 정리해보려고 한다.

 

 

태블로 신병훈련소 1주차

 

1일차는 전반적으로 어떤 프로그램인지 맛보는 느낌이였다. 그러면서 기본적인 원리들을 학습했다.

 

먼저 차원과 측정값에 대해 배운다. 지금 생각해보면 가장 중요한 개념인 것 같다.

 

차원 : 정성적 데이터, 불연속형이며 파란색으로 표시된다.

 

측정값 : 정량적 데이터, 연속형이며 초록색으로 표시된다.

 

차원은 행/열에 추가했을 떄 축(거리, 위치)를 생성하고 마크에 추가하면 마크 개수가 증가한다.

반면 측정값은 행/열에 추가하면 머릿글(격자)가 생성되고, 마크에 추가해도 개수에는 변화가 없다.

 

중요한 점은 두 형태의 데이터가 서로 변환이 가능하다.

불연속 데이터는 연속으로 예를들면 카운트를 통해 바꿀 수 있고, 연속형은 불연속으로 범주화등을 통해 변환이 가능하다.

 

집계 : 합계, 평균, 중앙값, 카운트, 최소, 최대, 등 으로 측정값을 화면에 가져다 놓으면 값을 집계해 보여지게 된다.

 

 

1. 막대 차트

수쳐형 데이터 간의 차이를 비교하기 유용하다.

 

이번 차트에서는 집계를 평균으로 바꾸는게 중요하다. 카테코리 하나에 여러 데이터를 합계로 정리하면 데이터가 많은 카테고리가 총합이 높게 나타나기 떄문에, 카테고리 별 차이를 확인하기 위해선 평균으로 하는게 적합하다.

 

 

2. 트리맵

트리맵은 전체 대비 비율을 확인 할 떄 유용하다. 계층구조로 확인 가능하며, 전반적인 데이터 구조를 볼 수 있다.

 

트리맵은 행/열을 쓰지 않는다. 마크를 사각형으로 바꾸는게 중요

 

집계는 굳이 평균일 필요가 없다. 메뉴명(하위 카테고리)는 1개의 데이터만 갖고있기 떄문

 

 

3. 스캐터 플롯 (산점도)

 

2개의 연속형 데이터를 상관관계 분석하는데 이용된다.

 

분석 탭에 가면 평균라인이나 추세선등을 추가로 표현 할 수도 있다.

 

 

4. 맵

태블로에서 가장 신기했던 기능이다. 맵을 통한 분석이 편리했다.

 

 

 

 

5. 만든 차트들을 대시보드를 이용

 

범례를 부동으로 체크하면 대시보드 안으로 끌어 넣을 수 있다!

 

 

6. 추가도전과제

 

 

칼로리와 카페인을 행/열에 넣고 상관관계를 만들어 봤다.

 

행/열에 위도 경도를 넣으면 자동으로 맵이 그려진다! 그 위에 매장주소로 세부정보에 넣어주면 마크 개수가 분리된다.

 

 

 

마무리

 

전반적으로 측정값 차원을 이용해 각각 행 열 마크에 넣으면 어떻게 차트가 변하는지를 중점으로 학습했다.