Data/BI

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

뚱요 2023. 1. 11. 12:00
반응형

 0.Tableau Prep 설치

1. Tableau Prep 다운로드

자신의 OS에 맞는 파일 다운로드(Windows/Mac)한다.

Tableau Prep 파일 다운로드 화면

2.Tableau Prep Builder 설치

제품 사용권 계약 동의 > 동의함(A)하고 기다리면 설치 완료

Tableau Prep Builder 설치

3. Tableau Prep 실행

해당 아이콘을 누르면 로딩하는 이미지 창이 나온다.

Tableau Prep 실행화면

 

4. Tableau Prep 초기 세팅 

  • 서버/ 제품키/라이선스가 없다면 평가판 시작(14일 무료) 클릭
    • 평가판 사용하기 위한 개인 정보 입력
  • 서버 - 서버 URL
  • 제품키 - 제품키 입력

 

Tableau Prep 초기 세팅 

 


1. 간단한 실습

실습에서 사용한 데이터는 태블로 코리아에서 제공한 데이터셋으로 태블로 코리아 프렙관련 유튜브 강의 영상의 예시로도 사용된 데이터이다.

1.1 데이터 가져오기

첫 화면 좌측 상단의 데이터 연결

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

1.2 연결할 데이터 형식 선택

Excel 데이터를 가져온다면 파일에 연결> Microsoft Excel

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

1.3 데이터 연결

선택한 엑셀시트가 좌측에 나오고 우측 하얀 화면에 각 테이블이 이름과 색상로 구분되어 나옴

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

1.4 데이터 전처리

데이터 전처리는 유니언, 조인, 정리단계로 크게 나뉜다.

유니언과 조인은 합치는 것이고 정리단계는  데이터를 원하는 형식으로 처리하는 것을 의미한다.

1) Union

여러 개의 테이블을 컬럼 기준으로 수직으로 합치는 것을 의미 (python Pandas에서는 Append)

방법 1. union 할 테이블을 하단으로 drag& drop

이 방법의 한계점은 최대 10개 가능

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

방법2. 와일드카드를 사용한 유니온

위의 하나하나 드래그&드롭하지 않고 업로드한 파일의 파일명을 기준으로 자동으로 결합해주기 때문에 파일명을 통일시켜야 한다. 예시로 영업실적 2015~2018년 테이블을 각각 만들고 해당 파일을 합치기 위해서 파일명, 시트명의 규칙으로 합친다.

영업실적* (영업실적으로 시작하는 모든 파일)을 가져온다.

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리
[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

2) 조인

조인은 관계형 데이터 베이스에서 사용하는 그 조인과 동일한 개념으로 inner join, outer join 모두 제공한다.

2.1) Inner Join 이너조인

각 데이터의 공통된 값만 조인하여 반환

방법 . 조인할 테이블 옆으로 drag& drop

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

영업실적 데이터와 지역별 관리자 데이터를 지역을 기준으로 동일한 지역만 추출하니 1,832건이 영역실적 데이터에서 사라지고 9,168건이 남은 것을 알 수 있다.  영업실적 테이블에서 붉은 글자로 표시된 서울경기의 데이터가 누락됨을 알 수 있다.

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

2.2) outer join

 특정 테이블을 중심으로 결합하거나 두 테이블 모두 포함하여 결합한다.

하단의 이미지는 어떤 테이블을 중점으로 아우터 조인하냐에 따라서 데이터 값이 변하는 것을 볼 수 있다. 주문한 모든 건은 반품이 되지 않으므로 주문 테이블 중심으로 left outer join 해야 한다. 이너 조인을 하거나 반품 중심으로 right outer join 하면 반품한 데이터 784개만 볼 수 있어서 반품 내역이 없는 주문 10,214개는 모두 제외된다.

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

2.3) 불필요한 칼럼 제거

조인을 하게 되면 이름이 동일한 경우 컬럼명 뒤에 숫자가 붙는다. 

예. 주문번호, 주문번호-1

불필요한 중복데이터이므로... 오른쪽 마우스 버튼> 제거로 제거한다.

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

 

3) 정리단계

위의 누락된 데이터가 확인되었고 누락된 사유를 보니 생성된 정리의 필드가 이전에는 수도권으로 지역을 구분하였는데 2018년에 서울 경기로 표기하고 있다.

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

3.1)  + 클릭하여 정리단계 클릭

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

3.2) 값 변경하거나 값 그룹화하여 묶어주기

해당 값 더블 클릭하여 값을 변경하여 하나 통일해주거나 그룹화하고 싶은 항목 선택하여 우측 마우스 버튼 클릭하면 '값 그룹화'하여 동일한 값으로 처리

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

 

완료 후 조인 1을 다시 확인하면 inner join에도 누락 없이 11,000건 조인됨

 

1.5 데이터 출력

1) 최종 결과를 출력하고 싶다면 마지막 단계에서 출력 클릭

 

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

2) 포맷 선택

  • 파일: 자신의 PC에 hyper , excel(xlsx), csv 파일로 저장
  • 게시된 데이터 원본: 서버에 데이터 원본으로 게시
  • 데이터 베이스 테이블 

[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리
[Tableau] Tableau Prep 시작- 설치, 세팅, 데이터 연결, 정리

Tip. 잘못  출력해서 에러가 발생했다면 새로 고침으로 전체 다시 실행 가능

저장, 데이터 업데이트 , 새로고침 ,모든 흐름 실행, 매개 변수 만들기

 

관련글

[리뷰] 누구나 바로 시작하는 태블로, 나도? 나도!(+실습 후기)

[Tableau] 태블로 신병 훈련소(소개,일정,설치, 태블로 퍼블릭 공유)

[Tableau] 태블로 신병 훈련소 1주 차 회고 - 기본원리

[Tableau] 태블로 신병 훈련소 2주 차 회고 - 더 나은 시각화

[Tableau]태블로 UDT(소개,일정,신청,커리큘럼,난이도,무료 교육)

[Tableau] Tableau Desktop Specialist 태블로 데스크탑 스페셜리스트 자격증 합격 후기(소개,시험 팁)

반응형