알라딘

헤더배너
상품평점 help

분류

이름:비그니쉬 프라자파티 (Vignesh Prajapati)

최근작
2016년 2월 <R과 하둡을 이용한 빅데이터 분석>

비그니쉬 프라자파티(Vignesh Prajapati)

인도 출신의 빅데이터 매니아며 엔제이(Enjay)의 소프트웨어 전문가 및 Pingax(www.pingax.com)의 컨설턴트로 활동 중이다. 숙련된 기계학습 데이터 엔지니어로서 기계학습뿐만 아니라 R, 하둡 Hadoop, 머하웃(Mahout), 피그(Pig), 하이브(Hive) 및 하둡 관련 컴포넌트 등의 빅데이터 기술을 통해 데이터셋으로부터 가치 있는 인사이트를 분석하는 일련의 데이터 분석 사이클 전반에 능통하다.
2012년에 구자르트(Gujarat) 기술 대학에서 학사 학위를 받았으며 Tatvic에서 데이터 엔지니어로 일하기 시작했다. 구글 애널리틱스 데이터를 위한 다양한 데이터 분석 알고리즘을 개발해 경제적 가치를 제공했고, 실질적인 기계학습 적용을 위해 구글 애널리틱스와 구글 프리딕션 API를 연동하는 여러 가지 분석 앱을 개발했다. 또한 구글 프로젝트에 오픈소스로 RGoogleAnalytics 패키지를 개발함으로써 R 커퓨니티에 기여했으며, '데이터 주도 기술(Data-driven technologies)'에 대한 문서도 작성했다.
단일 도메인에 국한되지 않은 다양한 인터랙티브 앱을 개발하고 있으며, 구글 애널리틱스 API, 실시간 API, 구글 프리딕션 API, 구글 차트 API, 구글 번역 API 등의 다양한 구글 API와 자바, PHP 플랫폼을 이용해 개발하고 있다. 오픈소스 기술을 개발하는 데에도 관심이 많다.
또한 『아파치 Mahout 프로그래밍』(에이콘, 2014)을 리뷰했다. 이 책은 초급자뿐만 아니라 고급 사용자에게도 머하웃에 대한 참신하고 범위 지향적인 접근법을 제공한다. 또한, 사용자가 빅데이터 애플리케이션을 만들면서 기계학습 애플리케이션과 정책, 기계학습 알고리즘의 다양한 가능성을 알 수 있도록 특별하게 구성되어 있다.

  

대표작
모두보기
저자의 말

<R과 하둡을 이용한 빅데이터 분석> - 2016년 2월  더보기

대규모 기업 조직에서 생성되는 데이터의 양은 기하급수적으로 늘어나고 있으며, 이러한 방대한 양의 정보를 하둡 같은 저비용 플랫폼에 저장하는 것이 가능한 시대가 되었다. 최근 이 조직들은 이렇게 모은 데이터로 무엇을 할 것인지, 데이터로부터 어떻게 중요한 통찰을 얻을 것인지에 대한 문제에 직면해 있으며, 그 해결책으로 R이 주목받고 있다. R은 데이터로부터 고급 통계 모델링을 수행하고, 유도된 모델을 화려한 그래프나 시각화로 표현하며, 그 외에 데이터 과학에 연관된 다양한 기능들을 더욱 쉽게 수행하게 도와주는 매우 놀라운 도구다. 그렇지만 R의 중요한 단점 중 하나는 확장성이 부족하다는 점이다. R 코어 엔진은 매우 제한된 양의 데이터만 처리할 수 있으며, 이러한 점을 보완하기 위해 빅데이터를 처리하는 데 많이 사용하는 하둡을 R과 연동하는 것은 자연스러운 일이다. 이 책은 R과 하둡, 그리고 하둡 플랫폼을 사용해서 어떻게 R의 데이터 분석 작업을 확장성 있게 만들 수 있는지에 대한 복잡한 내용들을 다룬다. 또한, 데이터 과학자, 통계학자, 데이터 아키텍트, 엔지니어같이 문제를 해결하기 위해 R과 하둡으로 대량의 데이터를 처리, 분석하려는 다양한 독자들의 요구를 충족시켜줄 것이다. R을 하둡과 연동해 사용함으로써 분석할 데이터셋의 크기에 따라 확장이 가능한 탄력적인 데이터 분석 플랫폼이 제공된다. 이를 통해 경험 많은 프로그래머는 맵리듀스 모듈을 R로 작성할 수 있고, 하둡의 병렬 처리 맵리듀스 메커니즘을 사용하면 데이터셋에서 패턴을 알아내기 위해 해당 모듈을 실행할 수 있다.

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자