하둡을 어떻게 활용할 수 있는지 학습하고, 자세한 하둡 동작방식을 자연스럽게 습득할 수 있는 책이다. 하둡을 직접 설치하는 방법부터 시작해, 다양한 데이터 처리 방법 및 실습, 심지어 저자의 비밀 노하우까지 알려주며 활용 사례 위주로 읽기 쉽게 작성됐다. 하둡 에코시스템을 직접 몸으로 부딪혀 가며 익힐 수 있는 쉽고 유용한 입문서이자 자습서이다.
게리 터킹튼 (지은이)의 말
이 책은 하둡에 빠르게 익숙해지는 데 도움을 주며, 이를 바탕으로 빅데이터 문제 해결을 가능하게 해줄 것이다. 오늘날은 하둡과 같은 데이터 처리 업무를 하기에 매우 흥미진진한 시기가 아닐까 한다. 한때는 대기업이나 국가 기관에서만 가능했던 다차원 분석과 대규모 데이터의 접목이 오픈소스 소프트웨어를 통해 가능해졌기 때문이다.
하지만 종잡을 수 없는 기술의 복잡성과 트렌드의 빠른 변화로, 어디서부터 시작해야 할지 망설이는 사람이 많으리라 생각한다. 이 책은 현재 어려움을 겪고 있는 입문자에게 하둡의 시작부터, 작동 원리, 실제 운영 상황에서의 활용 방법까지 친절하게 설명하도록 작성됐다.
전체적인 하둡의 핵심 사항에 대한 리뷰와 더불어, 하둡을 활용하거나 접목된 부가 기술에는 무엇이 있는지 살펴본다. 즉 단순한 하둡에 대한 이해뿐만 아니라, 여러분이 구상하고자 하는 기술에 어떻게 활용하게 될지 실질적인 팁을 주고자 한다.
빅데이터 하둡에 있어 필요한 부가 기술은 아마존 웹 서비스와 같은 클라우드 컴퓨팅이다. 클라우드 컴퓨팅과 같은 서비스를 통해 하둡 워크로드를 보관하면서 대규모 데이터 처리뿐만 아니라 물리적 장비를 추가로 구입할 필요가 없음을 시연할 계획이다.