리뷰

[리뷰] 쉽게 시작하는 캐글 데이터 분석

손혜정 2021. 10. 31. 02:35

  


 

캐글은 한번도 해보지 않았지만 관련된 업무를 하고 있습니다.
전부터 주변 동료분들 중 캐글을 사용하는 사람들을 꽤나 볼 수 있었지만 시간을 들여 시작해보기가 쉽지 않았습니다.
아마 이 책을 둘러보고 있는 분들도 캐글을 시작하는 분들이 아닐까 싶네요.
캐글에 관련된 서적은 처음이라는 점에서 다른 캐글 책들과 객관적인 비교는 불가능하지만 처음 캐글을 시작하는 사람으로써 후기를 공유해보겠습니다.

 책의 첫 시작은 캐글에 대한 목표, 캐글 대회의 설명 이후에 이 문제들을 같이 풀어나가면서 어떤 순서로 문제를 접근해야하는지, 문제를 해결하기 위한 대표적인 기술들(분석 기술 뿐만 아니라 코드면에서도 자주 쓰는 문법들)을 배울 수 있습니다. 그래서 만약, 데이터 분석 및 모델을 만들어 보는게 익숙하지 않으신 분이더라도 -아니면 데이터 분석을 위한 기술이 부족한 분이더라도- 이 책을 통해서 쉽게 시작할 수 있을 것 같습니다. 필요한 코드도 같이 나와있어서 책을 차례로 따라가면 되거든요. (책의 흐름은 문제 제기, 데이터 및 해결 방법 설명과 실제로 구현을 어떻게 하는지 순차적으로 진행) 추가로 의문이 생기는 부분에 대해서는 충분히 검색으로 커버 가능하다고 생각합니다. 하지만 설명이 충분히 되어있어서 개인적으로 왜 이런 방법을 썼는지 더 궁금한 경우에만 찾아보면 될 것 같습니다.

 캐글의 Competition에 캐글 시작의 바이블이라고도 불리는 연습문제가 존재하는데, 그 중  '타이타닉 생존자 예측 문제', '주택 가격 예측' 문제로 시작을 하는 것도 무척 좋은 방법이라고 생각합니다. 몰론, 다른 Competition들은 더 어렵고, 복잡한 문제들이 있지만 대표 문제부터 스스로 캐글 문제를 해결하는 방법을 터득시켜주기 위해 많은 노력을 한 책 같습니다. 
 책의 초중반부로 기초를 다지고, 이후 더 깊게 해보고 싶은 분이라면 책의 뒷부분에 포함된 캐글 마스터, 그랜드 마스터들과의 인터뷰가 많은 도움이 될 것 같습니다. 잘하는 사람들이 어떻게 문제를 해결해나갔는지 참고를 하는것은 중요한 부분이기 때문에, 이 외에도 초반에 잠깐 소개했듯이 캐글 커뮤니티도 좋은 방법 같습니다.

  정리하자면, 처음으로 캐글을 시작하는 분에게 좋은 책이라고 생각이 듭니다. 책을 차근차근 따라가다 보면 어느새 캐글에 친숙해지고, 더 높은 기술을 쌓을 준비가 되어있으실 겁니다. 인터뷰 내용은 현실적이기도 했고 팁도 포함되어 있어서 재미도 있었습니다. :)
 꼭 캐글이 아니더라도 데이터 접근방법 및 분석방법-시각화 포함-으로부터 많은 기본 기술들을 얻어가는 느낌이라, 데이터를 보면서 문제를 해결해야 하는 업무를 하신다면 읽어보시는 것을 권하고 싶네요.

*길벗 출판사로부터 지원받아 읽어본 후 작성한 리뷰입니다.