Data/BI

[Tableau] 태블로 신병 훈련소 1주 차 회고 - 기본원리

뚱요 2022. 12. 25. 23:54
반응형

[Tableau] 태블로 신병 훈련소 1주 차 회고 - 기본원리

1일 차: 태블로 개요, 차원과 측정값의 차이
2일 차: 행과 열, 마크의 개념, 계산된 필드 만들기
3일 차: 매개 변수 사용, 대시보드 동작 적용하기
4일 차: 하이라이트 테이블, 다양한 시각화 맵(덤벨 차트)
5일 차: 지리 정보 시각화, 배경 이미지를 이용한 Custom Map 사용하기

1주 차는 기본적인 태블로의작동 원리를 이해하는 것에 초점이 맞추어져 있다. 블로를 배우지 않더라도 간단하게 따라 하기 쉬운 과제들이었다. 과제 진행하면서 유저 친화적이고 직관적이고 많은 기능을 제공하고 있어서 왜 많은 기업에서 태블로를 사용하고 있는지 알 수 있었다.

기본을 익히기 위해 태블로 신병 훈련소에서 제공한 커리큘럼의 교육 영상은 간단하게 따라 하도록 만든 5분 내외의 짧은 영상들의 모음과 태블로 코리아에서 제공하는 영상으로 30분 정도 구성된다. 과제를 따라 하기 위해 추천한 영상들이기 때문에 추가적으로 공식문서를 보는것을 추천한다. 다른 곳에서 제공하는 태블로 영상들도 보면 공식문서를 기반으로 콘텐츠를 만든 영상들이다.

아무래도 불특정 다수를 대상으로 한 기초교육이다 보니 기능 사용에 초점에 맞추어져 있어 관계형 데이터 베이스에 대한 이해나 다뤄본 적 없다면 따로 개념 설명이 충분하지 않아 이해가 조금 더 오래 걸릴 것으로 보였다.

Takeaway

태블로는 엑셀의 피봇 테이블과 사용이 유사하고 매우 직관적이다. Tableau Prep(태블로 프렙)도 정말 간단하게 데이터 전처리를 할 수 있도록 직관적 UI를 갖는다. 다양한 형태의 Join부터 appending, 컬럼 정리까지 간단하게 GUI 로 제공한다.

.

1. 차원과 측정값은 연속형과 불연속형?

공식 문서 및 교육 영상에서 접하면 태블로에서 사용하는 용어로 통용한다. 동의어로 착각하기 쉬우나 다른 용도로 만들어진 것이고 각 2가지로 총 4가지 필드 조합이 가능하다. 그렇다면 태블로에서 정의하는 차원, 측정값, 연속형, 불연속형의 차이는 무엇일까?

차원 vs 측정값

 이것은  자료 종류를 나누는 개념과도 연결된다. 질적 자료, 양적 자료로 필요에 따라서 변환이 가능하고 이는 데이터도 동일하게 적용된다.

연속형, 불연속형이라도 차원, 측정값으로 변경 가능하다.

역할 측정값(Measure Values) 차원(Dimensions)
데이터 유형 정량적 수치값 정성적 값
정의 일반적인 숫자 형식으로 액션(drag&drop or 더블클릭)으로  집계하여 표현
차원 기준으로 집계
불연속형 데이터 기준으로 측정값을 어떻게 나눠서 보는지 뷰의 세부수준 결정
SQL Query 집계 함수
 합계, 평균, 중앙값, 카운트, 카운트 (고유), 최소값, 최대값, 백분위수, 표준편차, 분산 등 을 의

Group by

연속형 vs 불연속형

필드명(알약) 연속형(Continuous field) 불연속형(Discrete field)
구분색 녹색
파란색
Group by 측정값  
행/열 축 생성 균일한 폭의 머리글/ 격자 구분 생성
마크카드 마크의 개수 무변
색상 범례 : 연속형 - gradient
세부정보 변경 없음
마크 속성과 개수 변경 ,
세부수준 변경, 집계 기준 변경되면서 
범위 무한대의 범위 유한한 범위

마크카드의 도구설명은 영향을 미치지 않음

 

2. 역할변경

데이터 유형 및 조건만 맞다면 연속형과 불연속형에서 변경이 가능하고 차원에서 측정값으로도 변경 가능하다. 데이터를 어떤 역할로 사용하여 시각화로 표현하냐에 따라 의미가 달라짐을 의미한다. 동일한 시계열이라도 날짜 데이터를 연속형으로 지정하느냐 불연속형으로 지정하느냐에 따라 시계열은  다른 형태로 보여준다.

불연속형과 연속형

 

3. 매개 변수(Parameter)

함수의 파라미터(매개변수)로 생각하면 이해하기 쉽다. 사용자로부터 입력을 받아서 시각화에 전달하는 인수와 같다.

계산식 만들어서 색상 변경은 물론이고 각 축 기준도 선택할 수 있다. 매개변수를 동적으로 활용하기 위해서는 계산된 필드 만들기로 조건문(if), Case문으로 만들어줘야 한다.

4. 측정값 이름

 다중 측정값이 동시에 표시할 수 있도록 자동 생성되며 다른 필드와 동일함

 

측정값 (Measure Values)

측정값 이름(Measure Names)

정의 연속형 값 불연속형 값
뷰에 있는 경우 측정값 카드 생성
 

 

5. 지리 데이터

태블로에서는 지리 데이터를 계층화 및 그룹화할 수 있으며 다양한 방식으로 위도, 경도부터 데이터 내 위치 값을 통해서  표현할 수 있다.

5.1 지리정보 관련 필드 

측정값에 있는 경도(생성됨)와 위도(생성됨) 

- 시도, 시군구의 지리적 역할을 부여하면 타블로에서 자동으로 생성해 주는 시도, 시군구의 위경도 값으로 정확한 위치가 아니 시도, 시군구의 중심점

5.2 지리정보 관련 함수

  • MAKEPOINT
    : 위도 및 경도 열의 데이터를 공간 개체로 변환.
  • MAKELINE
    : 두 지점 간의 연결하여 시각화

  • BUFFER
    : 계산에 정의된 거리 및 단위 값으로 결정되는 반지름을 사용하여 원형 모형을 반환.(버퍼 계산은 점 공간 개체에서만 작동한다)

6. 데이터의 성격에 따라 라이브, 추출 중 선택

태블로도 쿼리를 보내서 디비에서 가져와서 추출, 시각화하기 때문에 시각화할 때도 데이터의 성격과 이에 따른 성능을 고려해야 한다.

  • 라이브:  기본설정으로 데이터 베이스에서 실시간으로 반영되어 새로고침 불필요하지만 트래픽이 많이 발생한다면 문제 발생
  • 추출: 라이브의 문제점을 해소할 수 있는 방법으로 특정 시점에 데이터를 추출해서 시각화
    • 태블로 서버를 이용한다면  설정> 일정 에서 요일, 주기, 시간을 설정해서 새로고침을 자동으로 할 수 있다.
    • 사용자 지정 쿼리로 추출 시 라이브가 아닌 추출로 쿼리 요청시간을 단축시킬 수 있다.

7. 데이터 공유 여부에 따라 확장자 선택

  • 통합 문서 (*twb) : 데이터 없이 시각화 및 대시보드만 공유하여 보기용
  • 패키지 통합 문서(*twbx) : 데이터를 포함하여 시각화 및 대시보드가 저장되어 수정 가능

행, 열, 마크, 필터, 하이라이트, 매개변수, 함수와 지리정보 데이터를 이용한 시각화 기능에 초점을 맞춘다

 

관련글

[Tableau] 태블로 신병 훈련소(소개,일정,설치, 태블로 퍼블릭 공유)

[Tableau] 태블로 신병 훈련소 2주 차 회고 - 더 나은 시각화

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

출처

help Tableau : Tableau  개념

help Tableau : 차원 및 측정값, 파란색 및 녹색

공간 함수

데이터 추출

관련글

[리뷰] 누구나 바로 시작하는 태블로, 나도? 나도!(+실습 후기)

[Tableau] 태블로 신병 훈련소 2주 차 회고 - 더 나은 시각화

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

[Tableau] Tableau Desktop Specialist 태블로 데스크탑 스페셜리스트 자격증 합격 후기(소개,시험 팁)

[Tableau]태블로 UDT(소개,일정,신청,커리큘럼,난이도,무료 교육)

[Tableau] Tableau Desktop Specialist 태블로 데스크탑 스페셜리스트 자격증 합격 후기(소개,시험 팁)

 

반응형