알라딘 중고매장

  • 최저가 : -원 I 최고가 : -원
  • 재고 : 0부
  • - 쇼핑목록에 추가하신 후 목록을 출력하시면 매장에서 간편하게 상품을 찾을 수 있습니다.
 
[전주점] 서가 단면도
(0)

acorn+PACKT 시리즈. 최근 빅데이터 분석 분야가 각광을 받으면서 R에 대한 관심이 높아지고 있다. R은 분석 기능이 뛰어나지만 확장성이 부족하다는 단점이 있다. 이런 측면에서, 대표적인 빅데이터 처리 플랫폼인 하둡과 R을 연동하려는 시도는 아주 자연스러운 일이다. 이 책은 데이터 분석가나 플랫폼 엔지니어가 빅데이터 처리를 위해 R의 분석 능력과 하둡의 저장 및 처리 능력을 함께 활용할 수 있도록 이상적인 솔루션을 제시한다.

R과 하둡의 설치, 하둡 맵리듀스 애플리케이션 생성, RHIPE, RHadoop, 하둡 스트리밍을 이용한 R과 하둡의 연동, R과 하둡 기반으로 동작하는 맵리듀스 애플리케이션 개발과 실행, RHIPE와 RHadoop을 이용해 R 환경에서 HDFS 데이터 처리, R 환경에서 하둡 스트리밍 맵리듀스 실행, 다양한 데이터 소스로부터 R에 데이터 가져오기와 내보내기, 다양한 분석을 위한 데이터 수집 등을 다루고 있다.

최근작 :<R과 하둡을 이용한 빅데이터 분석>
소개 :
최근작 :
소개 :현재 쿠팡에서 데이터 분석 업무를 담당하고 있다. 지리정보시스템, 이미지 프로세싱, 기계학습 등 다양한 분야에 관심이 많다.

비그니쉬 프라자파티 (지은이)의 말
대규모 기업 조직에서 생성되는 데이터의 양은 기하급수적으로 늘어나고 있으며, 이러한 방대한 양의 정보를 하둡 같은 저비용 플랫폼에 저장하는 것이 가능한 시대가 되었다.
최근 이 조직들은 이렇게 모은 데이터로 무엇을 할 것인지, 데이터로부터 어떻게 중요한 통찰을 얻을 것인지에 대한 문제에 직면해 있으며, 그 해결책으로 R이 주목받고 있다. R은 데이터로부터 고급 통계 모델링을 수행하고, 유도된 모델을 화려한 그래프나 시각화로 표현하며, 그 외에 데이터 과학에 연관된 다양한 기능들을 더욱 쉽게 수행하게 도와주는 매우 놀라운 도구다.
그렇지만 R의 중요한 단점 중 하나는 확장성이 부족하다는 점이다. R 코어 엔진은 매우 제한된 양의 데이터만 처리할 수 있으며, 이러한 점을 보완하기 위해 빅데이터를 처리하는 데 많이 사용하는 하둡을 R과 연동하는 것은 자연스러운 일이다.
이 책은 R과 하둡, 그리고 하둡 플랫폼을 사용해서 어떻게 R의 데이터 분석 작업을 확장성 있게 만들 수 있는지에 대한 복잡한 내용들을 다룬다.
또한, 데이터 과학자, 통계학자, 데이터 아키텍트, 엔지니어같이 문제를 해결하기 위해 R과 하둡으로 대량의 데이터를 처리, 분석하려는 다양한 독자들의 요구를 충족시켜줄 것이다.
R을 하둡과 연동해 사용함으로써 분석할 데이터셋의 크기에 따라 확장이 가능한 탄력적인 데이터 분석 플랫폼이 제공된다. 이를 통해 경험 많은 프로그래머는 맵리듀스 모듈을 R로 작성할 수 있고, 하둡의 병렬 처리 맵리듀스 메커니즘을 사용하면 데이터셋에서 패턴을 알아내기 위해 해당 모듈을 실행할 수 있다.

송주영 (옮긴이)의 말
번역 작업을 마무리하고 이 글을 작성하기 위해 문서 편집기를 열고 있으니, 업무상 프로젝트를 위해 처음으로 R과 하둡의 연동 작업을 수행할 당시의 기억이 새록새록 떠오릅니다. 그 당시에는 이 책은 물론이고 변변한 R 책도 시중에 없었으며, 하둡도 빅데이터 처리 기술로써 사람들의 입에 막 오르내리기 시작하던 시절이었습니다. 그렇게 정보가 열악한 상황 속에서 웹사이트를 찾아가며 프로젝트를 수행하던 때를 돌이켜보니 그 시절에 이 책이 있었더라면 얼마나 좋았을까 하는 생각이 듭니다.
당시에는 분석 기능은 뛰어나지만 확장성에 한계가 있는 R과 빅데이터의 저장 및 처리 능력에 독보적인 위치를 차지하고 있던 하둡을 연동하는 기술이 빅데이터 분석 분야의 은탄환(silver bullet)이 되지 않을까 생각했던 적이 있습니다. 하지만 세상 모든 일이 그렇듯이 모든 문제를 한 번에 해결해주는 솔루션은 존재하기 힘듭니다. 실제 현업에서는 빅데이터에 대한 분석 및 학습을 위해 이 책에서 소개하는 내용뿐만 아니라 머하웃이나 스파크 MLlib(Spark MLlib) 같은 오픈소스 기술이나 벤더에서 제공하는 상용 제품들을 잘 조합해서 용도와 특성에 맞게 활용하는 지혜가 필요합니다. 이 책이 이런 지혜를 발휘하는 데 조금이나마 도움이 되었으면 좋겠습니다.

에이콘출판   
최근작 :<Tkinter를 사용한 파이썬 GUI 프로그래밍 2/e>,<RESTful Web API 패턴과 모범 사례>,<해석 가능한 AI>등 총 1,226종
대표분야 :프로그래밍 언어 7위 (브랜드 지수 148,214점), 그래픽/멀티미디어 15위 (브랜드 지수 20,728점)