다 크 데 이 터 ( D a r k D a t a : Why What You Don’t Know Matters )
일반적으로 우리가 갖고 있는 데이터, 가져올 수 있는 데이터를 어떻게 수집, 저장, 처리, 분석하는 지를 다루는 책들이 많습니다. 이 책은 특이하게도 우리가 알고 있는 갖고 있는 데이터가 아닌 우리가 모르는 온갖 유형의 누락된 데이터에 대해 이야기 하고 있습니다.
책 저자는 데이비드 핸드(David Hand)라는 저명한 통계학자로 통계학계에서 가장 권이 있는 상인 가이 메달을 받았고 그동안의 연구업적을 인정받아서 대영제국 훈장을 받았습니다. <신은 주사위 놀이를 하지 않는다>를 포함하여 7권의 책, 300편 넘는 논문의 저자입니다. 책을 읽어보면 대중들에게 통계학이나 데이터에 관해서 어떻게 다가가야 할지 고민을 많이 한 흔적이 보입니다.
책의 목차는 크게 2 부로 나누어져 있습니다. 1부에서는 다크 데이터란 무엇인지, 왜 발생했는지,
사례와 함께 각 다크 데이터의 유형과 설명을 서술합니다. 2부에서는 다크 데이터의 모호성이라는 성질에도 불구하고 어떻게 발견하고 반대로 어떻게 역이용하는지, 다크 데이터를 어떻게 15가지로 분류하는지를 다룹니다. 각 장에서 다크 데이터의 금융, 의료, 사기, 실험 등 다양한 사례를 다루고 있어 시야를 넓혀줍니다. 다양한 사례를 들어서 설명을 필요한 경우 간단한 시각화나 도표를 이용해서 뒷받침하여 이해가 더 잘 되었습니다.
책을 읽으면서 항상 주어진 데이터, 즉 우리가 알고 있는 데이터에 대해서만 고민을 해왔지 정작 주어지지 않은, 심지어 존재하는지 자체도 모르는 데이터 자체에 대한 생각을 해본 적이 없었습니다. 저자의 경험과 그에 따른 고찰, 적절한 사례들로 꽉 찬 책으로 생각지도 못한 것에 대한 인사이트를 줍니다.
그중 가장 공감 가는 부분을 직접 인용하자면...
아마도 여러분은 술 취한 사람이 가로등 아래서 열쇠를 찾는 오래된 농담을 잘 알 것이다. 그 사람이 거기에 열쇠를 떨어드려서가 아니라 무엇을 보기에 빛이 충분한 곳이 거기뿐이기 때문이다. 이것이야말로 다크 데이터의 위험성을 명확하게 요약해준다. 만약 자신이 갖고 있는 데이터만 바라본다면 과학자, 분석가, 그리고 데이터로부터 의미를 뽑아내려고 하는 모든 사람은 술 취한 사람과 비슷하다. 데이터가 어떻게 생기는지, 데이터네 무엇이 빠져 있는지를 이해하지 못하면 정답이 있는 곳이 아니라 자신들이 볼 수 있는 곳만 보는 심각한 위험에 빠진다.
데이비드 핸드, 다크 데이터 ,더 퀘스트 (2021), p 383
마치면서...
초연결 시대에서 데이터 관련 업종이 아니더라도 영향을 미치기 때문에 데이터에 관심이 있는 사람이라면 누구라도 추천드리고 통계나 데이터 관련 교양서적으로 통계 용어가 자주 나오는데 그럼에도 비교적 쉽게 읽히는 책으로 추천드립니다.
맨 끝에 주석들이 빼곡히 적혀있는데 관심 있는 부분은 찾아서 더 읽어보아도 재미있을 거 같습니다.
이 글은 (주)도서출판 길벗(더퀘스트)에서 도서를 제공받아 작성한 서평입니다.
'Data > 독서' 카테고리의 다른 글
[리뷰] 데이터로 전문가처럼 말하기-효율적 의사 전달을 위한 데이터 시각화와 비즈니스 스토리텔링의 기술 (1) | 2022.10.05 |
---|---|
[리뷰] 누구나 바로 시작하는 태블로, 나도? 나도!(+실습 후기) (2) | 2022.09.26 |
[리뷰] SQL로 시작하는 데이터 분석 (+실습 후기) (0) | 2022.09.13 |
[리뷰] 고객 경험을 극대화하는 DCX혁신의 비밀 데이터로 경험을 디자인하라 (0) | 2022.05.15 |
[리뷰]시험장에 몰래 가져갈 이경오의 SQL+SQLD 비밀노트 (2) | 2021.10.25 |