본문 바로가기

데이터분석

[한빛미디어-한빛리뷰어] 데이터가 뛰어노는 AI 놀이터, 캐글

반응형

본 도서는 한빛미디어 도서 서평단 <나는 리뷰어다 2021>로 선정되어 받은 도서입니다.

상위 링킹 진입을 위한 필살기

 

이 책의 저자들은 캐글 마스터, 전문가들로 구성 되었다. 이 책은 현재 판매되고 있는 몇 권 안 되는 캐글 관련 책 중에서 캐글에 첫발을 내딛는데 가이드 역할을 하고, 상위권 진입을 위한 필살기라고 할 수 있다.

경진 대회 중에서도 특히 정형 데이터를 다루는 대회 준비를 위한 책이다. 예측 대상이나 모델의 평가지표와 같은 문제 설정이 명확하게 주어진 가운데 성능이 높은 모델을 만들려면 어떻게 해야 하고 무엇을 주의해야 할지에 초점을 맞추고 있다.

경진 대회에서 일반적으로 주의해야 할 내용을 총망라하여 설명하고 있고, 과거 상위 입상자들이 사용한 기술도 다수 소개하여 모델 성능을 개선하는 데 필요한 힌트를 얻을 수 있도록 구성하였다. 모든 최적화 문제를 해결할 수 있는 알고리즘은 존재하지 않는다. 그렇기 때문에 이 책에서 소개하는 테크닉이 모든 경진 대회에서나 통용되지는 않을 수 있다.

이 책에서는 머신러닝 활용의 비즈니스적 측면이나 분석 기법의 알고리즘이나 이론적 측면은 상세하게 설명하지 않는다.

이 책은 경진 대회에 참가하려는 독자를 위한 가이드북이라고 할 수 있다. 특히 특징을 생성하는 방법, 검증, 매개변수 튜닝 등 다른 도서에서는 잘 다루지 않는 노하우나 포인트도 설명한다.

이 책을 보기 위한 독자는 다음과 같은 기본적인 지식이 필요하다고 한다.

- 파이썬과 라이브러리(numpy, pandas, scikit-learn)의 사용법

- 머신러닝의 기본 개념

- 미분이나 행렬 연산의 기본 개념

나는 캐글이 뭔지 아는 정도의 선 지식으로 이 책을 봤다. 캐글에 첫발을 내딛는데 아주 좋은 가이드가 되었다. 앞으로 기회가 되면 경진 대회에도 참가하고 싶다.

나 같이 캐글에 대해서 알아보고자 하는 독자나 이미 캐글을 경험하신 독자들에게 모두 최고의 책이라고 생각한다.

https://www.hanbit.co.kr/store/books/look.php?p_code=B4998513859

 

데이터가 뛰어노는 AI 놀이터, 캐글

캐글 마스터들의 노하우를 한 권에 집대성한 책. 흔히 사용하거나 검색으로 쉽게 찾을 수 있는 방법론 외에 다양한 대안들을 여러 예제와 함께 배울 수 있다.

www.hanbit.co.kr

 

반응형