Notice
Recent Posts
Recent Comments
Link
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Tags more
Archives
Today
Total
관리 메뉴

데이터 분석

태블로 신병훈련소 17기 - 6일차 (테이블 계산식, 세부수준 계산식(LOD) 본문

tableau/태블로 신병훈련소 17기

태블로 신병훈련소 17기 - 6일차 (테이블 계산식, 세부수준 계산식(LOD)

시니조 2023. 2. 24. 17:21

태블로 신병훈련소 6일차

  • 테이블 계산식
  • 세부수준 계산식(LOD)
  • + 코호트분석

 

 

0. 테이블 계산식

Raw Data > Aggregation (집계한 값) > Table Calaulation (테이블 계산) 순서로 진행된다.

 

예를들어 

dollar price라는 측정값을 합계, 평균, 최소, 최대 등으로 나타나는게 집계다.

 

이를 한번 더 누계, 차이, 비율 차이, 구성비율, 순위 등으로 재계산 한 것을 테이블 계산이라 한다. 테이블 계산을 하면 세모표시가 생성된다. 

 

이 때 테이블 계산은 

재계산이 되는 범위(테이블, 패널, 셀) 과 방향(옆으로, 아래로)를 통해 기준을 바꿀 수 있다.

 

 

 

+ 0. 세부수준 계산식(LOD)

이떄,

raw data는 집계되고

행에 날짜 데이터를 넣으면 날짜를 기준으로 집계값이 결정된다. 

 

집계의 기준은 "시각화의 세부 수준"에 따라 변경된다. 이 떄, 측정값의 집계 기준을 시각화의 세부수준 또는 뷰라고한다.

 

붉은 색에 추가되는 차원이 세부 수준을 결정한다고 생각하면 된다.

 

기준을 어떤 차원으로 할 지 결정하는 것을 세부수준 계산식(LOD)라고 한다.

 

세부수준 계산식은 다음과 같이 입력하며,

 

FIXED : 현재 View에 관계없이 지정된 특정 차원을 사용하여 계산 

INCLUDE : 현재 View에서 특정차원을 추가하여 계산 

EXCLUDE: 현재 View에 관계없이 특정 차원을 제외하여 계산 

 

가 있다.

 

대표적으로 사용되는 방법은 다음과 같다.

상위 15가지 LOD 표현식 (tableau.com)

 

상위 15가지 LOD 표현식

Tableau의 사명은 사람들이 데이터를 보고 이해하는 일을 돕는 데 있습니다. Tableau 기능은 사용자가 데이터를 의미 있는 정보로 변환할 수 있도록 신중하게 설계되었습니다. Tableau에서 중점적으로

www.tableau.com

 

 

 

 

1. 테이블 계산식 - 차이

주식 데이터를 가지고 전일 대비 종가 상승하락을 나타내는 차트를 만드려고한다.

 

1. 날짜를 연속형 일로 표현한다.

2. 날짜를 필터로 2019년 데이터만 가져온다.

3. 측정값 중 "종가"를 행 선반에 두고

4. Ctrl을 이용해 복사한 후 이중 축으로 합쳐준다.

5. 하나는 마크를 라인형태, 하나는 원으로 표현한다. 축은 축 편집에서 0을 제외시킨다.

 

6. 테이블 계산식을 이용하여 차이를 구한다. 기준은 이전 데이터가 돼야한다.

7. 테이블 계산식을 이용한 종가는 데이터 창으로 드래그하면 새로운 측정값으로 생성할 수 있다.  색상을 표현하기 위해 상승, 동일, 하락 3가지로 계산식을 만든다. 그 후 색상 설정, 전반적으로 정리한다.

 

8. 메뉴 > 워크시트> 작업(동작)에서 URL로 이동을 추가한다.

 

 

 

2. 테이블 계산식 - 구성비율

1. 경도, 위도 더블클릭

2. 국가, 시도를 상세정보로 마크 표시

3. 매출을 색상으로

4. 매출을 레이블로 > 테이블 계산을 구성 비율

 

하지만 이 경우

전 지역일 경우는 전체 시도가 범위였다면, 필터를 하는 경우 해당 지역에 포함된 시도로 계산 범위가 바뀜!

 

TOTAL범위가 바뀌기 떄문.

 

 

 

 

 

3. 세부수준 계산식(LOD) : 전국 기준 매출 구성비율 구하기

이 문제를 해결하기 위해 세부수준 계산식이 필요

 

FIXED 함수를 이용해 국가 기준으로 차원을 고정해준다.

 

이 "전국 기준 매출"을 이용해서 비율을 구하면 비율값이 안바뀐다.

 

 

 

 

 

4. 세부 수준 계산식 : 과거 고객 매출 기여도 및 신규 유입 고객 현황 분석

 

1. 연도를 열, 매출을 행으로

고객별 최초 구매 연도를 색상으로 표현하기 위해 

 

고객을 차원으로 고정해서 최초 주문일자를 구하면 된다. 

 

 

 

 

5. 코호트 분석

최초 구매 후 두번째 구매까지 기간을 알고싶다.

 

두번째 구매일을 구하기 위해선

첫번째 구매일을 null로 만든 후에 다시 첫번째 구매일을 구하면 될 것이다.

 

이제 최초 구매일과 최초 재구매일의 차이를 분기로 표현해보자

 

DATEDIFF함수를 이용해 분기를 기준으로 날짜 차이를 구한다.

 

1. 고객별 최초 구매일을 행으로 불연속형 년, 분기로 표시

2. 고객당 재구매 경과기간을 열에

3. 고객번호를 마우스 오른쪽을 누른채 색상에 드래그 > 고유 카운트로 집계

 

 

 

 

마무리

풀면서 막히는 부분이 가장 많았다. 틈틈히 보자.