핸즈온 데이터 시각화(Hands-On Data Visualization)
효과적인 데이터 시각화 전략부터 20가지 시각화 도구 사용법까지
많은 교육기관에서 데이터 시각화 입문 교제로 사용하고 있는 서적으로 다른 책에서 접할 때마다 핸즈온 데이터 시각화를 추천하고 있어서 어떠한 이유 때문인지 궁금해서 리뷰해보았습니다. 실제로도 교육기관에서 시각화 입문서로도 사용하고 있고 다른 분석이나 시각화 책에서도 여러 번 소개되었습니다.
🦃 구성
목차
CHAPTER 0 서문
데이터 시각화의 중요성과 왜곡 가능성
[PART I 기본 기술]
CHAPTER 1 스토리를 위한 도구 선택하기
스토리 스케치부터 적합한 도구 선택
CHAPTER 2 스프레드시트 스킬 강화하기
스프레드 시트 활용법: 구글 시트 활용부터 데이터 수집, 저장(CSV, ODS), 조작, 전처리, 응용(VLOOKUP, Pivot, geocoding)
#구글시트
CHAPTER 3 데이터를 찾고 질문하기
공공데이터와 개인 데이터 처리, 저장,
CHAPTER 4 지저분한 데이터 정리하기
전처리 (찾기, 바꾸기, 행열 바꾸기, 열로 나누기/합치기, pdf 데이터 추출
#타불라/태블로, 오픈리파인, 구글 시트 스마트 클린업
CHAPTER 5 의미 있는 비교하기
5.1 비교를 정확히 기술하기
5.2 데이터 정규화하기
5.3 편향된 비교 주의하기
[PART II 시각화 구축]
CHAPTER 6 차트 만들기
차트 디자인 원칙과 종류(막대, 히스토그램, 원형, 선, 영역, 데이터 래퍼, 범위, 분산형, 버블)
#구글, 태블로 퍼블릭
CHAPTER 7 데이터를 지도로 시각화하기
지도 디자인 원칙: 색상, 간격, 정규화
종류 : 포인트, 심벌 포인트, 코로플레스
#코로플레스 데이터 래퍼,소크라타 오픈 데이터
CHAPTER 8 테이블을 활용한 시각화 테이블 디자인 원칙
#데이터래퍼
CHAPTER 9 웹에 임베딩하기
9.1 정적 이미지와 대화형 iframe
9.2 임베드 코드 또는 iframe 태그 가져오기
9.3 코드 또는 iframe을 웹사이트에 붙여 넣기
[PART III 코드 템플릿과 고급 도구]
CHAPTER 10 깃허브로 코드 수정하고 호스트 하기
#깃허브 , 아톰
CHAPTER 11 Chart.js와 하이차트 템플릿
막대 / 열 차트, 오류 바, 선 , 버블, 분산형 차트
#Chart. js
CHAPTER 12 리플릿 맵 템플릿
구글 트, csv로 만드는 리플릿 맵
CHAPTER 13 지도 데이터 변환하기
13.2 GeoJSON 경계 파일 찾기
# GeoJson.io, 맵 셰이퍼
[PART IV 진실하고 의미 있는 스토리 전달하기]
CHAPTER 14 거짓을 발견하고 편향 줄이기
차트, 지도의 특성과 편향을 간파하고 최소화하기
CHAPTER 15 데이터 스토리 말하고 보여주기
스토리보드에 내러티브 작성부터 스토리 만들어내기
APPENDIX 자주 발생하는 문제 해결법
🦃 특징
1. 시각화 입문 도서
시각화 입문 도서로 직접 따라 해 볼 수 있도록 친절하게 안내하고 있다. 서문에서도 컴퓨터를 몰라도 인터넷이 가능한 컴퓨터만 있으면 된다고 한다. 실제로도 간단한 시각화를 다양한 툴로 하는 방법을 다룬다.
표 1-1에서 각 장에서 다루는 추천 도구를 데이터 처리 및 시각화 유형에 따라 나누고 있다.
2. 다양한 무료 툴로 시각화
대부분의 도서는 1개의 툴로 하는 방법을 다루는데 코딩 경험이 없는 입문자 수준에서 시각화에 가장 적절한 툴들을 소개하다 보니 구글 스프레드시트/ MS Excel, 데이터래퍼, 태블로 퍼블릭, 오픈소스 코드 템플릿 (Chart.js, Highcharts, Leaflet)을 소개한다.
각 툴의 장단점이나 어떤 형식의 데이터로 import 하는지에 대해 나옵니다. 또, 툴 선택하는 조건에 대해서도 다루고 있어서 이미 사용하고 있는 툴에서 요구조건에 맞는 툴로 변경을 해야 하는 상황인 경우 가장 유용한 경우라고 생각합니다.
3.Hands-on 예제로 따라 하기
시각화 예제 따라 하고 원하면 깃허브나 링크로 공유할 수 있도록 안내하고 있습니다. 이런 부분은 시각화 처음 배워보고 포트폴리오 용으로 대화형 시각화 남기고 싶은 경우 배운 기록 남기기용으로도 좋다고 생각합니다.
깃허브를 제공하고 있고 계속해서 업데이트되고 있으니 중간에 소프트웨어 툴이 변경되어 작동하지 않는 경우를 대비해서 계속 참고하기 좋다.
https://github.com/HandsOnDataViz/book
4. 다양한 지도
간단하게 표현하는 지도 시각화에 관심이 있는 분들이라면 특히 유용합니다. 내용을 보면 데이터 지도로 시각화하기가 차트 만들기 파트와 페이지로 보면 거의 비등합니다. 이미지 삽입이 더 많이 들어가서도 있습니다.
각 파트 초반에 무엇을 할지에 어디를 참고해야 할지 표 형식으로 친절하게 안내하고 있어서 갖고 있으면서 필요할 때 찾아보기 요긴합니다. 그리고 따라 하는 부분은 하단처럼 자세하게 컬러 사진으로 순차적으로 설명합니다.
🦃 느낀 점
원제는 <Hands-On Data Visualization : Interactive Storytelling from Spreadsheets to Code>으로 원제의 부제목이 더 잘 맞는다고 느껴진다. 하지만 국내(청중)에 맞춰 효과적인 메시지 전달하기 위해 살짝 바꾼 거 같습니다.
이 책에서는 전반에 걸쳐서 데이터 시각화로 하는 '진실한' 스토리 텔링을 강조하고 있습니다. 심지어 10pg에 걸친 서문에서 어떻게 동일한 데이터로 약간의 조작으로 호도할 수 있는지 하나하나 추가하며 이 책으로부터 무엇을 배워야 하는지 메시지를 전달합니다. 그리고 4부에서도 다시 한번 진실하고 의미 있는 스토리 전달하기를 통해서 진실한 내러티브를 만드는 것으로 마침표를 찍습니다. 인식함으로써 제공하고 있는 시각화 자료나 메시지를 나이브하게 그대로 받는 게 아닌 비판적 사고로 보는 방법을 배우게 됩니다.
시각화 책인데 다른 책에서 보통 소개하지 않는 중요한 주제를 입문 도서에서 다룰 거라고 예상치도 못했습니다. 통계를 보면 여러 가지 편향 문제나 데이터 시각화하는 방법으로 의도적이든 의도적이지 않든 왜곡되는 경우가 종종 있습니다. 같은 산업에서의 회사에서 제공하는 PR(Public Relations) 기사에서만 봐도 실적을 최대한 좋게 보이기 위해서 유리한 지표, 시각화 방법을 선택하는 경우를 보았습니다. 이 외에도 정부에서 발표하는 통계에서도 거품을 끼고 공개하기도 하기 때문에 의도를 파악할 수 있는 눈을 기르는 것은 중요합니다.
진실성 있는 시각화라 하더라도 더 나은 시각화를 찾기 위해서 노력해야 합니다. 디자인 규칙의 권장사항이 있고 기술적 방식으로 정하는 방법이 있어도 데이터에 맞지 않는 경우가 있습니다. 그렇기 때문에 저자는 실제로 해보고 비교해보며 정직성과 유용성 사이의 트레이드오프를 고려하고 메시지를 가장 잘 전달하는 것으로 선택해야 함을 여러 번 강조하고 다양한 사례를 보여줍니다.
데이터 시각화의 목표는 정보를 '진실하고 통찰력 있는 스토리를 포착하는 이미지로 인코딩'하는 것입니다.
p453, 핸즈온 데이터 시각화
글로벌 시대의 시각화는 세계의 변화에 맞춰서 그룹 간 편향 (인종, 성별, 계급 , 성적 취향과 같은 사회적 카테고리에 의해 특혜 받거나 차별하는 여러 가지 방식을 의미 )에 대해서 어떻게 시각화해야 하는지 다룹니다.
... 데이터 수집 이슈가 '권력과 특권이라는 더 큰 이슈와 직접적으로 연결되어 있음'을 강조했습니다.
p96, 핸즈온 데이터 시각화
입문서이지만 데이터를 효과적으로 전달하고 싶은 누구에게나 추천합니다.
'Data > 독서' 카테고리의 다른 글
[리뷰]파이썬 기반 금융 인공지능-금융 시계열 데이터 기반 알고리즘 트레이딩 전략 (0) | 2023.03.26 |
---|---|
[리뷰]데이터 분석 입문자 책 추천- 혼자 공부하는 데이터 분석 with 파이썬 (0) | 2023.02.23 |
[리뷰] 데이터로 전문가처럼 말하기-효율적 의사 전달을 위한 데이터 시각화와 비즈니스 스토리텔링의 기술 (1) | 2022.10.05 |
[리뷰] 누구나 바로 시작하는 태블로, 나도? 나도!(+실습 후기) (2) | 2022.09.26 |
[리뷰] SQL로 시작하는 데이터 분석 (+실습 후기) (0) | 2022.09.13 |