Data/독서

[리뷰]데이터 분석 입문자 책 추천- 혼자 공부하는 데이터 분석 with 파이썬

뚱요 2023. 2. 23. 12:00
반응형

혼자 공부하는 데이터 분석 with 파이썬

출판사: 한빛미디어
저자:박해선
분량: 496페이지
출간: 2023년 1월 2일
정가: 26,000원




최근 데이터 관련 직종 이직이나 관련 프로젝트, 공부하는 것이 더욱더 인기가 많아졌음을 블로그 유입자 인기 키워드로 느끼고 있습니다. 시중에 많은 책, 강의가 나와 있는데 입문을 고민하는 분들에게는 선택지가 너무 많아 정보의 호수 속에서 시작하는 것에서부터 혼란이 오게 됩니다. 예로 시작하려고 하면 언어부터 R, Python, SQL 등이 있고 분석 내에서도 분석 방식에 따라서 다양하게 나뉘게 됩니다.
마침 오늘 리뷰할 책은 최근에 한빛미디어에서 2023 나는 리뷰어다로 선정되어 접하게 된 자습하기에 좋은 데이터 분석 입문서로 리뷰하면서 자습하기에 최적화된 책으로 생각되어 최근에 주변 지인분들 중에서 파이썬으로 데이터 분석을 시작하고 싶어 하여 추천드렸습니다. 가장 큰 이유가 혼자서도 공부하기 좋은 입문자 수준의 자습서이면서도 지은이가 해당 분야에 저명한 분이기 때문입니다.

 

책 구성

 

 

혼자 공부하는 데이터 분석 with 파이썬은 2023년 초에 한빛미디어에서 혼자 공부하는 시리즈 중에서 파이썬으로 하는 데이터 분석 입문도서입니다. 유명한 혼공단 시리즈로 혼자서도 공부할 수 있도록 기획된 시리즈입니다.
책은 레벨이 2가지로 나누어져 있고 초반에 정의 및 수집, 정제, 시각화, 기술통계는 1~4장, 추론통계나 머신러닝 부분은 5~7장은 고급으로 나누어져 있다. 학습단계가 7단계로 나누어지고 추가적으로 공부해야 할 사항들은 부록에 수록되어 있습니다. 실무에서 직접 마주칠 만한 문제를 해결하는 스토리텔링 방식으로 전개되고 있어 실용적이기까지 합니다.


중간중간에 데이터셋 찾는 방법과 같은 꿀팁이나 관계형 데이터베이스에 관련하여 유용한 정보를 제공하고 있습니다.
부록으로 나오는 데이터베이스 파트에서 SQLite이용하여 연결부터 DML, DDL, DCL 모두 다루고 배운 함수와 메서드를 정리해서 사용방법을 제공하고 있어 공부 내용 외에 추가적으로 찾아 공부하기 좋도록 구성되어 있습니다.
마지막에 나오는 혼공 용어노트는 책과 분리해서 갖고 다니면서 공부하기 좋게 그림과 함께 키워드 정리가 되어 있는데 각 단원에 중요한 컨셉을 이해하고 기억하기 좋게 준비되어 있어 의지만 있는 누구든 혼자서도 시작할 수 있습니다.
내용이 많다 보니 핵심 기본으로 추려져 있고 깊이를 원하는 경우 저자의 깃허브에 나와있는 로드맵 이미지를 참고해서 넘어갈 수 있도록 가이드라인을 제공하고 있어 관심 분야는 찾아 공부하기 좋게 되어 있습니다


특징

1. 친절한 입문서

전반적인 내용은 데이터 분석의 전 과정을 다뤄볼 수 있도록 설계되어 입문자용으로 적합하다고 느꼈습니다. 다양한 입문서가 많지만 혼자 자습할 정도로 리소스를 제공하는 곳은 많지 않은데 혼공시리즈는 입문자가 계속 좌절하지 않고 문제를 해결하면 나아갈 수 있도록 동영상부터 커뮤니티까지 다양한 방식으로 제공하고 있습니다. 책의 커리큘럼에 맞춘 유튜브를 제공하고 오픈채팅을 통해서 저자에게 질문하거나 열정이 있고 관심 분야가 비슷한 사람과 같이 시작해보고 싶다면 '혼공 학습단' 통해서 같이 나아갈 수 있도록 공간을 제공하고 있습니다. 이외에도 실습 예제와 용어노트도 홈페이지에서 제공하고 있습니다.


친절한 또 다른 이유는 입문자의 고난을 최소화하여 학습에 집중할 수 있도록 방향성 제시하고 있습니다.  입문자들에게는 설치부터가 엄청난 문턱으로 느껴지는 경우가 있어 파이썬으로 코드도 못 쳐보고 좌절하는 경우가 있는데 다양한 환경으로 발생하는 문제없이 인터넷만 된다면 사용할 수 있는 코랩(Colab)으로 실습을 진행하고 있습니다.
다른 책에서나 컨벤션에 대해서 설명이 생략되어 잘못 이해하는 경우도 종종 존재하는데 콕 찝어서 설명해 주어 저자의 진가를 느꼈습니다.

 

2. 저명한 저자

저자 박해선 님은 ML GDE(Machine Learning Google Developer Expert)로 활동하고 계시면서 출판 쪽으로는 유명한 머신러닝, 딥러닝 도서를 우리말로 옮겼고 관련 도서도 직접 집필까지 하셨습니다. 관련 분야 및 파이썬에 대한 전문성을 인정받으신 분이 집필하셨기 때문에 입문자가 필요한 수준으로 적절하게 조정하여 소개하고 있습니다.


유튜브, Github, 카카오 오픈채팅을 통해 저자와 직접 소통할 수 있는 기회가 있으니 적극적으로 이용하면 좋을 듯합니다. 이전에 저자님을 만날 수 있는 기회가 생겨 친필 사인책도 받았었습니다.

박해선 님이 한글로 옮기거나 집필한 책 리스트
『핸즈온 머신러닝(2판)』(한빛미디어, 2020), 『미술관에 GAN 딥러닝 실전 프로젝트』(한빛미디어, 2019), 『파이썬을 활용한 머신러닝 쿡북』(한빛미디어, 2019), 『머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로』(길벗, 2019), 『파이썬 라이브러리를 활용한 머신러닝』(한빛미디어, 2019), 『케라스 창시자에게 배우는 딥러닝』(길벗, 2018), 『핸즈온 머신러닝』(한빛미디어, 2018), 『텐서플로 첫걸음』(한빛미디어, 2016) 옮긴이,혼자 공부하는 데이터 분석 with 파이썬(한빛미디어, 2023)』,『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019) 지음


후기

보통 데이터 분석은 각 회사마다 도메인마다 정말 정의나 JD부터 천차만별인 만큼 공부할 내용도 많습니다. 입문하게 되면 놓치게 되는 부분도 있는데 혼자 공부하는 데이터 분석 책은 밸런스를 갖춰서 개념과 실전 예시를 다루고 있어 기초 다지기에 좋다고 느꼈습니다. 
실무에서 알고 가면 좋은 기본 지식들이 꾹꾹 담겨있어 데이터를 다루는 모든 직무를 시작하는 분들에게 적극 추천드립니다. 특히, API나 웹크롤링으로 반정제 데이터를 수집 및 전처리가 필요한데 신입 중에서 하지 못하시고 아예 개념을 모르는 분들이 더러 있었습니다. 책에서는 실제도 데이터 찾는 법부터 없는 경우 API나 스크래핑을 통해서 웹 데이터를 수집하고 XML, JSON형식의 데이터를 다루는 방법을 제시하고 있어 데이터 분석 신입분들도 꼭 읽어보셨으면 좋겠다고 생각이 들었습니다.
또, 책 내에서는 코랩 오류나 인코딩 형식과 같은 중요한 팁을 다룹니다. 실제로 현업에서 일하게 되면 개발자는 인코딩 형식을 신경 쓰지 않고 데이터를 넘겨서 주는 경우가 있는데 이런 경우 한글로 되어 있는 데이터는 깨지는 현상이 발생해서 다시 재요청해야 하는 경우가 생기게 되어 꼭 데이터 분석 포지션이 아니더라도 파이썬으로 데이터를 다루는 모든 분들이 알았으면 하는 내용이 요목조목 정리되어 있습니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

반응형