|
|||||
|
|||||
[일산점] 서가 단면도
|
‘실무’에 초점을 맞춘 데이터 사이언스 ‘입문서’다. 다양한 배경을 가진 독자들이 가장 짧은 시간에 기본적인 데이터 사이언스 분석을 시작할 수 있도록 하였다. '가장 짧은 시간'에 배워야 하므로 필수적이지 않은 내용은 과감히 생략하고, 설명은 최대한 간략히 하였다.
‘다양한 배경’을 가진 독자들을 위해 통계나 컴퓨터 전공 지식이 없더라도 읽을 수 있도록 하였으나, 통계의 핵심인 기초통계와 선형모형(회귀분석과 분산분석 포함)은 반드시 제대로 배울 것을 권장한다. ‘기본적인’ 데이터 분석은 텍스트 자료, 그래프 모형, 시계열 분석, 공간자료 분석 등 개별적인 자료 형태보다는 다양한 분석에 공통적으로 적용되는 방법들을 다룬다. 1장 데이터 과학이란? _ 1 : 권재명 박사의 《따라 하며 배우는 데이터 과학》은 해들리 위컴(Hadley Wickham)의 ‘tidyverse’ 철학에 기반을 둔 데이터 가공에 관한 충실한 소개와 더불어 라쏘와 랜덤 포레스트와 같은 최신 머신러닝 기법, 그리고 기존의 R 서적에서 다루지 않은 유용한 R 관련 지식을 많이 소개하고 있다. 특히, ‘데이터 분석 환경 구성하기’, ‘코딩 스타일’과 ‘R 마크다운’에 관한 내용은 R을 처음 배우는 입문자와 현장 실무자들이 반드시 알아야 할 내용으로, 학계와 실리콘밸리를 오가면서 쌓은 저자의 경험이 고스란히 담긴 부분이며, 마지막 ‘실리콘밸리에서 데이터 과학자 되기’에 관한 내용은 향후 차세대 데이터 과학자를 꿈꾸는 이들에게 훌륭한 지침이 되리라 생각한다. 이 책이 앞으로 데이터 과학자를 꿈꾸는 모든 이들의 필독서가 될 것을 믿어 의심치 않는다.
|