알라딘

헤더배너
상품평점 help

분류

이름:고석범

최근작
2023년 7월 <인공지능 기반 의료>

데이터 과학 입문자를 위한 R

R 언어가 사용되는 분야는 매우 넓기 때문에 R에 관한 책들도 많이 출판되고 있다. 어떤 학문이나 도메인에 R을 붙이면 거기에 해당하는 책을 찾을 수 있을 정도다. 예를 들면 R for machine learning, R for biology, R for Finance, R for Marketing 관련 책을 어렵지 않게 찾을 수 있다. 이 책은 R for Data Science 분야에 해당한다. 이 책의 장점은 R의 포괄적인 면을 다룬다는 점이다. 저자는 통계학을 전공하고 데이터 회사를 운영하는 데이터 과학자며, 컬럼비아 대학교에서 데이터 과학 개론을 강의하기도 한다. 저자의 서문에 따르면 이 책은 그 강의의 내용을 뼈대로 삼았다고 한다. 즉 R에 초점을 맞춘 데이터 과학 개론서로 책이 기획됐다는 의미다. 그 점은 이 책의 목차를 보더라도 드러난다. 저자는 'R for Everyone'이라는 제목을 붙였지만 번역을 마치고 보니 '데이터 과학 입문자를 위한 R' 정도가 가장 적합한 제목이라고 생각한다. 어떤 의도가 있겠지만 책의 내용만 보면 그렇다는 이야기다. 좀 더 구체적으로 보면 컴퓨터 언어로서 R 언어의 이모저모를 설명했으며, 외부에 있는 데이터를 R로 갖고 오는 방법, 갖고 와서 본격적인 분석에 들어가기 전 준비 과정에서 데이터를 정제하는 타이디버스(Tidyverse) 같은 최신의 방법, 데이터 탐색을 위한 데이터 시각화 방법, 데이터에 대한 여러 가지 모형을 만들고 평가하는 방법, 분석된 결과를 다른 사람과 공유하기 위해 R 마크다운/니터 같은 방법으로 문서화하는 방법, 샤이니(shiny) 앱을 좀 더 다이나믹하게 만드는 방법, 그리고 마지막으로 R 패키지로 자신이 만든 것을 다른 사람과 공유하는 방법까지 데이터 과학의 거의 모든 부분을 망라하고 있다. 이것은 데이터 과학자들이 일상적으로 하는 일이다. 따라서 이 책은 데이터 과학자가 되고자 하는 독자에게 좋은 안내서가 될 것이다. 개인적인 생각일지 모르지만, 데이터 과학을 하려는 사람에게 R은 피해갈 수 없는 영역이라고 생각한다. 왜냐하면 데이터 과학의 근간은 통계학이며, R은 통계학자들의 핵심 언어기 때문이다. 통계학 지식이 깊지 않아서 통계학에 대한 부분이 가장 번역이 어려웠다. 저자가 통계학 전공자여서인지 모르지만, 이 책은 선형, 비선형 모형까지 광범위하고 다양하게 설명하고 있다. 비전공자로서 비선형 모형 같은 내용은 낯선 것이었다. 최신 머신 러닝 알고리즘과 관련된 알고리즘에 대한 직감(intuition)을 파악하는 것이 중요해서 저자도 추천하는 책이지만 『An Introduction to Statistical Learning』(Springer, 2017)을 같이 읽으면서 많은 내용을 참고했다. 물론 더 깊이 이해하는 데는 더 많은 시간이 필요할 것이다. 나와 비슷한 처지에 있는 분이라면 이 책도 같이 읽으면서 공부할 것을 추천한다. 장점이 있으면 단점도 있다. 개론서로서 포괄적인 접근법을 선택했기 때문에 한 주제에 대한 깊이 있는 설명 부족하다. 이 책에서 한 장으로 설명되는 내용들이 하나의 책으로 엮어질 수 있는 것들이 많다. 내가 저술하거나 번역한 책들만 예로 들어도 그렇다. 니터(knitr) 패키지와 R 마크다운 패키지를 사용해 코드와 텍스트를 합쳐 문서화하는 방법은 『통계 분석 너머 R의 무궁무진한 활용』(에이콘, 2017), 샤이니(shiny) 패키지로 웹 애플리케이션을 만드는 방법은 『R Shiny 프로그래밍 가이드』 (한나래아카데미, 2017), RStudio 사용법에 대한 번역서 『초보자를 위한 RStudio 마스터』(에이콘, 2017) 등과 관련이 있다. 통계학으로 들어가면 하나하나의 주제가 거대한 산이고, 그것들을 소개하는 다양한 책들이 있다. 체계를 갖춘 모든 것이 그러하듯 처음부터 한 주제에 몰입할 수는 없다. 이 책은 앞에서도 언급했지만 R의 드넓은 지평을 보여준다. 독자들은 이 책을 통해 R의 신세계를 경험할 것이고, 이 책을 계기로 더 멀리, 더 깊이 들어갈 수 있으리라 생각한다.

미티어 인 액션

미티어(Meteor)에 대한 관심은 R의 Shiny 패키지와 관련돼 있다. 이전에 Shiny에 관련된 작은 책을 번역한 적이 있는데, 어느 글에서 Shiny 개발자가 Shiny의 반응성(reactive) 프로그래밍 방식은 미티어의 방식을 따랐다는 글을 읽고 미티어가 무엇인지 무척 궁금했다. 웹사이트에서 관련 자료들을 통해 간단한 애플리케이션을 따라 만들어보면서, 미티어의 세계에 빠져들었다. 사실 이 책을 번역할 때까지만 해도 HTML, CSS, 자바스크립트 실력이 초보적인 수준이었기 때문에 무사히 번역을 할 수 있을지에 에 대한 걱정이 많았다. 새로운 개념은 새로 공부하면서 하나씩 채워나갔다. 그래서인지 시간은 처음 생각했던 것보다 오래 걸렸다. 이전에 루비 온 레이즈(Ruby on Rails)로도 웹사이트를 구성해보았던 경험과 비교하면 미티어는 여러 모로 새로웠다. 우선 미티어는 그 목적이 문서를 보여주는 정적인 웹사이트를 만드는 것에 있는 것이 아니라 데이터의 이동이 많은 다이내믹 웹 애플리케이션을 만드는 데 있다. 그리고 데이터베이스 쿼리 등에서 프런트-엔드에 이르는 모든 과정이 자바스크립트 하나로 해결된다는 점이 특징이다. 여러 분야에서 데이터의 중요성이 강조되고, 데이터를 제공해주는 서비스가 늘어나고 있는 상황에서 웹 애플리케이션 개발 도구인 미티어는 앞으로 중요해질 수밖에 없을 것이라는 생각이 든다. 최근 'MIT Technology Review'라는 잡지사는 '슬랙(Slack) (https://slack.com)'이라는 도구를 2016년 혁신적인 10 대 기술 중 하나로 선정하였는데, 미티어는 이를 만드는 데 최적의 도구라고 생각한다. 내가 코딩을 즐긴다고 하면 좀 이상하게 바라보는 사람들이 많다. 코딩은 생각을 실물로 바꾸는 놀라운 힘을 가지고 있다. 그동안 하고 싶었던 일들을 실현시킬 수 있는 것이 코딩이라고 생각했다. 이러한 배움의 연장으로 이 책을 번역했다. 전문가들이 보기에 혹시 부족한 부분이 있다면 너그럽게 용서해주기 바란다.

인공지능 기반 의료

이제 인공지능을 빼고 미래를 말하는 것이 사실상 불가능해졌다. 2016년 이세돌과 알파고의 대결에서부터 최근의 챗GPT, GPT-4까지 인공지능은 점점 더 우리의 삶에 가까이 다가왔다. 스마트폰 앱이나 소프트웨어 등 인공지능이 들어간 예를 쉽게 찾을 수 있게 됐다. 그렇게 바뀌는 동안 우리를 포함한 전세계는 코로나19 팬데믹을 겪었다. 포스트 코로나가 어떤 방향으로 어떻게 진행될지 정확히 예측하기란 쉽지 않다. 다만 보건의료체계의 여러 문제가 노출된 만큼 변화는 불가피할 것으로 보인다. 소아과는 코로나 팬데믹으로 직격탄을 맞았고, 내과, 외과, 소아과, 산부인과를 비롯한 소위 '메이저 과목'들 또는 '바이탈을 잡는다'는 과들에 대한 기피 현상까지 생겼다. 뭔가 잘못되고 왜곡됐다는 느낌을 지울 수 없다. 이 책의 번역은 한 사람의 의사로서, 그리고 ICT 책을 번역하거나 저술해 온 아마추어 작가로서 인공지능 시대의 의료(지능 기반 의료)라는 접점을 고민해 보고자 시작했다. 내가 속한 신경과는 넓고, 의학은 더 넓다. 컴퓨터와 인공지능 분야도 마찬가지로 넓어, 짦은 공부로 무엇을 좀 안다고 하기 민망할 정도다. 위안이라면, 지금까지는 무엇을(What) 안다는 것이 중요했었는데 GPT-4 등이 등장함으로써 앞으론 무엇이 아니라 어떻게(How) 아는지가 중요해질 것 같다는 사실이다. 그렇다면 뭔가를 모색하고 노력하는 그 자체가 중요한 게 아닐까 하는 위안 말이다. 이 책은 나와 비슷한 고민을 하는 의사를 비롯한 보건 의료인, 그리고 보건 의료 ICT를 활용해서 가치 있는 것을 창출하려는 과학, 기술자 모두에게 도움이 될 것이다. 이 분야는 양쪽의 협업 없이는 현실적으로 아무것도 할 수 없다는 데 전적으로 동의한다. 협업하기 위해선 이해가 필수이고, 이 책은 그 이해에 다가서는 데 도움이 될 수 있을 것이다. 책의 여러 군데서 그와 관련한 전문가들의 고민을 접할 수 있다. 대부분 미국의 이야기이지만 우리가 참고할 만한 것도 많다.

지능 기반 의료를 위한 헬스케어 애널리틱스

머신러닝 알고리즘과 머신러닝의 미래를 잘 설명한 명저 『마스터 알고리즘』(비즈니스북스, 2016년)에서 저자는 다음과 같이 말한다. “내가 하는 일에서 머신러닝이 할 수 있는 것은 무엇이고, 할 수 없는 것은 무엇이며, 내가 일을 더 잘하기 위해 어떻게 머신러닝을 이용할 수 있을지를 이해해야 한다.” 이 말을 한 컴퓨터 과학자는 이 ‘일’의 분야를 특정하지 않았다. 이 책은 그 일들 중 의료 분야를 다룬다. 이번 팬데믹을 통해 이제는 일반인들도 의료라는 자원이 한정된 것임을 알게 됐다. 서비스를 제공할 수 있는 자원도, 그에 대해 지불할 수 있는 자원도 한정돼 있다. 이렇게 한정된 자원으로 우리 사회의 건강이라는 목표를 달성해야 한다. 비록 이런 문제는 경제학에서 핵심으로 다루는 삶의 어디서나 나타나는 아주 일반적인 것이다. 의료는 단순한 시장의 원리 또는 단순한 구호나 약속으로 그 목적이 달성되기 어려운 분야다. 이 책의 저자는 헬스케어의 3대 목표인 (1)건강 결과에 대한 개선, (2)비용 절감, (3)의료의 질 보장을 달성하는 데 머신러닝이 기여할 수 있는 것을 파이썬 코드를 이용한 간단한 사례를 통해 보여준다. 어떤 장의 내용은 미국 의료제도에 다소 치우친 감이 있지만, 전반적으로 헬스케어 머신러닝이 무엇인지를 맛볼 수 있는 기회를 제공한다. 의료 분야 종사자들에게는 머신러닝을 통해 일의 수준을 향상시킬 수 있는 방법을 알려주고, 컴퓨터나 다른 분야 종사자들에게는 의료 현장에서 생기는 문제들이 어떤 것이며 의사들은 어떤 방식으로 사고하는지 엿볼 수 있는 기회를 제공할 것이다. 또한 의사들에게는 자신도 모르게 베이즈 추론 방법을 이미 습관처럼 사용하고 있었다는 사실을 깨닫게 해준다. 저자도 이야기하지만 헬스케어 애널리틱스가 헬스케어, 수학, 컴퓨터 과학이 융합된 분야인 터라, 이 작은 책에 그 내용을 모두 담아내기란 불가능하다. 특정한 기술적 관점에서 보면 이 책의 내용은 주제들을 피상적으로 다루는 것 같은 느낌을 줄 수도 있지만 SQL, 파이썬, 판다스(pandas), 넘파이(NumPy), 사이킷런(scikit-learn) 등을 다루면서 깊이 들어갈 때는 어떤 것을 공부해야 하고 왜 그런 것들이 필요한지 충분히 파악할 수 있을 것이다. 그리고 7장을 보면 머신러닝(데이터 과학)이 어떤 식의 작업을 하는지 알게 되는데, ‘데이터 전처리에 80%, 모델링에 20%를 쓴다.’는 말을 실감할 수 있을 것이다. 의료 인공지능에 대한 관심이 매우 높아진 상태에서 그 관심을 구체적으로 실현하는 방법을 제시하는 데 이 책이 유용할 것이다. 머신러닝, 인공지능 알고리즘이 의료에 참여하는 모든 이에게 유익할 수 있길 기원한다.

초보자를 위한 RStudio 마스터

코딩을 하는 사람들에게 텍스트 에디터는 필수 도구일 수밖에 없다. R을 즐겨 사용하는 나는 거의 매일 RStudio를 사용하며, 주로 글을 쓸 때 사용한다. 이전에 저술했던 책들의 주제는 모두 R 언어를 사용해 재현 가능한 문서를 만드는 방법에 관한 것이었다. 책에 소개했던 방법을 그대로 적용해 번역을 하거나 저술 작업을 한다. 이런 작업에서 RStudio는 최적의 환경을 제공한다. 이 책은 RStudio의 다양한 기능을 소개한다. 재현 가능한 방법으로 문서를 만드는 방법, 샤이니 웹 애플리케이션을 제작하는 방법, R 패키지 개발 방법 등을 핵심적으로 설명한다. RStudio는 데스크톱 버전도 있지만, 서버 버전을 제공한다. 서버 버전을 자신의 클라우드에 설치해 웹 브라우저를 통해서 RStudio를 사용하는 방법까지 소개한다. 이 책은 RStudio에 대한 책이지 R 언어 자체에 대한 책은 아니다. 그래서 R 자체에 대한 내용은 약간 수박 겉핥기식으로 다뤄진다. 감안하고 책을 보기 바란다. R 코드 디버깅이나 코드 프로파일링 같은 고급 주제는 다루지 않았다. 그런 주제는 RStudio에 어느 정도 익숙해진 다음 웹 등을 검색해보면 사용법을 찾을 수 있다. 윈도우 사용자의 경우 한글로 계정을 만들었을 때 RStudio가 제대로 작동하지 않는 경우가 있다. 이 경우에는 구글링이나 주위 사람들에게 물어서 한글 계정을 영문으로 바꾸거나, 아예 영문으로 된 계정을 새로 추가해 설치할 것을 권한다. RStudio를 윈도우에서 R 코드를 사용할 때는 괜찮지만 나처럼 R 마크다운 문서에 한글 텍스트를 많이 사용하는 경우 한글 입력이 제대로 안 될 때가 있다. 이런 경우에는 메모장을 열어서 한글 텍스트를 입력하고 나서 다시 RStudio로 돌아오면 제대로 되는 경우가 많았다. 이런 몇 가지 단점을 제외하면 RStudio는 정말 훌륭하다고 평하지 않을 수 없다. 이전까지 몇 가지 시험적인 R 통합개발환경이 있었지만, RStudio만큼 수준 높고 흠이 없는 통합개발환경을 보지 못했다. 이런 도구를 개발하고 많은 사람이 사용할 수 있는 오픈소스 버전까지 내주는 RStudio 회사에 경의를 표한다. 자세히 알지는 못하나 미국의 많은 IT 회사가 사업의 핵심을 생태계 조성에 두는 듯하다. 오픈소스를 통해서 많은 사람을 생태계로 끌어들이고, 그것을 기반으로 사업을 한다. 사업을 하는 나로서도 그런 점을 배우고 싶다. 이제 RStudio는 R 사용자에게는 어쩌면 필수적인 텍스트 에디터이자 개발환경으로 여겨지고 있다. 이 책이 그런 사용자들의 효율을 높이는 데 좋은 지침이 되기를 바란다.

헬스케어 분석을 위한 머신러닝

딥러닝, 머신러닝 등의 인공지능 기술이 삶의 문제를 해결하는 범용기술(General Purpose Technology)로 떠오르면서 4차 산업혁명에서 가장 핵심적인 역할을 할 것으로 예측되고 있다. 따라서 인공지능 기술에 주목할 수밖에 없다. 이 책은 헬스케어 데이터를 사용한 머신러닝 사례를 소개한다. 헬스케어는 의료부터 건강 관리까지 아우르는 '건강한 삶'이라는 보편적인 목적이 있는 모든 사람에게 영향을 미치는 중요한 분야다. 의학은 꾸준히 발전하고 있다. 그러나 인간의 삶을 둘러싼 환경이 바뀌고 수명이 늘어나는 만큼 의학과 보건, 헬스케어가 해결해야 하는 과제도 늘고 있다. 코로나 팬데믹을 기점으로 사회는 크게 변화하고 있으며, 지능 기반 의료는 중요한 자리를 차지하게 될 것이다. 이런 기술이 의료와 헬스케어의 여러 문제를 슬기롭게 해결할 수 있길 바란다.

헬스케어 인공지능과 머신러닝

이 책은 헬스케어 분야의 인공지능 적용에 관련된 여러 가지 측면을 소개하는 개론서다. 완전한 기술서로 보기도 어렵고 그렇다고 고차원의 논쟁만 다루지도 않는다. 그 중간에 있다고 생각하면 좋을 듯 하다. 인공지능은 이미 그리고 앞으로 더욱더 모든 사람들의 일상에 영향을 줄 것이다. 어떤 사람은 의학의 역사를 인공지능 이전(BA, Before AI)과 인공 지능 이후(AA, After AI)로 나눠질 것이라고 주장하기도 한다. 인공지능은 일상뿐만 아니라 회사와 기관에서 사람들이 일하는 방식에도 영향을 주고 있다. 의료와 같은 전문 영역도 마찬가지다. 알파고가 이세돌 9단에게 이기는 것을 목격하고, 파괴적 혁신 기술이 전통적인 일자리에 영향을 주기 시작하면서 일반 사람들도 이전보다는 인공지능에 대한 관심이 높아졌다. 또 혁신의 대상이 자신이 될 수도 있다는 불안감을 안고 살아간다. 개인적으로 컴퓨터를 공부하게 된 계기는 병원의 낮은 생산성 때문이었다. 수많은 전문가가 그렇게 열심히 일을 하고, 병원 당국은 많은 자금을 투자하고, 환자와 가족도 건강을 회복하기 위해서 기꺼이 많은 희생을 함에도 불구하고, 의료 서비스에 만족하는 참여자는 찾기가 어려웠다. 내가 보기에는 컴퓨터가 그 답을 줄 것으로 보였다. 그래서 의료와 ICT 중간 지점을 찾고자 노력해왔다. 이 책은 헬스케어 인공지능 기술과 응용 사이에 있는 이야기를 한다. 그래서 전문 의료인이 보기에는 컴퓨터 기술서처럼 보일 수 있고, 전문 컴퓨터 엔지니어가 보기에는 새로운 기술은 소개하지 않으면서 의료 인공지능을 적용하는 방법을 다루는 다소 뜬구름 잡는 이야기로 보일 수 있다. 내가 틈새의 중간 지점을 찾아가는 탐구자 입장이어서 그럴 수도 있겠지만, 진정 중요한 것은 중간 지대에 있다고 본다. 인공지능을 이해하는 의료인과 의료를 이해하는 인공지능 전문가가 하나의 언어로 이야기 할 수 있을 때 혁신은 일어날 것이다. 그런 이야깃거리를 준다는 데 이 책의 가치가 있다고 본다. 처음 번역 제안을 받았을 때 이 책에 대한 불만은 컴퓨터 코드가 없다는 것이었다. 구체적이지 않고 추상적인 이야기만 있을 것 같다는 걱정이 있었다. 그런데 내용을 훑어보니 코딩을 하는 사람들에게 단점일 수 있지만, 의료 인공지능에 입문하려는 사람들에게는 더 나을 수도 있겠다 싶었다. 이 책에서도 나오지만 데이비드 월퍼트가 이야기한 머신러닝에서의 "No free lunch(공짜 점심은 없다)" 원리는 여기서도 적용되는 것 같다. 모든 상황에 만족하는 머신러닝 모델이 없듯이 모든 독자를 만족시키는 기술서도 없어 보인다. 그렇지만 특정 문제에 적합한 더 나은 모델이 존재하는 것처럼, 특정 주제와 목적의 책은 분명 존재한다. 이 책을 의료 인공지능의 안내서로 본다면 분명 소임을 다하고 있다고 생각한다. 아쉬웠던 코딩이라는 구체성은 후속 번역을 통해 소개하고자 한다. 보잘것없는 번역이지만 의료 인공지능 분야에 조금이라도 도움이 됐으면 하는 바람이다. 편협한 생각일지 모르지만 미래의 의료는 인공지능 의학이 주를 이룰 것이다. 의학 연구는 물론이고 환자의 진단, 치료, 재활, 나아가 건강한 사람을 대상으로 한 예방 영역에 인공지능 의학이 깊숙이 파고들 것이다. 그래서 학계는 물론 개원의, 봉직의, 의료 행정가들도 인공지능 의학에 관심을 가져야 할 것으로 보인다.

Data Smart

엑셀로 시작하는 유쾌한 데이터 과학과 비즈니스 분석 입문 나는 원래 R의 열렬한 팬이다. 많은 R 사용자들이 그렇듯 오픈소스를 즐겨 사용하기 때문에 엑셀을 가지고 설명하는 책에 대한 번역은 선뜻 받아들이기 어려운 제안이었다. 그러나 아마존 서평들과 저자의 서문 등을 읽고서 저자의 의도를 이해하고 나니 마음이 많이 바뀌었다. 저자가 엑셀이라는 가장 흔한 도구를 꺼내 들고 데이터 과학을 설명하는 데는 여러 가지 이유가 있다. '빅데이터'라는 단어는 이젠 흔하게 듣는다. 주된 업무가 데이터 분석인 데이터 과학자들은 물론이고, 나 같은 일반 대중들까지도 막연하게나마 중요하고 실생활에 유용하다는 감을 가지게 되었다. 여러 미디어를 통해 들려오는 소식만 들어도, 뭔지는 잘 모르겠지만 중요하다고 세뇌될 정도이다. 이 책은 그런 '빅데이터' 기술을 뒷받침하는 '데이터 과학' 입문서다. 데이터 과학은 그 자체가 융복합 학문이다. 그 이론적 배경을 뒷받침하는 통계학, 이론을 구체적인 형태로 구현할 수 있게 해주는 컴퓨터 과학, 가설을 세우고 실험을 통해 검증하는 과학 본연의 방법론 등이 데이터 과학이라는 말 속에 녹아 있다. 융복합적인 특성은 참 매력적으로 보인다. 이렇듯 중요하고 새로운 오일로 비유되는 데이터 과학을 막상 이해하려고 달려들면 수학, 통계학, 프로그래밍에 능통하지 않는 한 결코 쉽지 않다. 수학 공식들이 나오기 시작하면 포기하고 싶고, 뭔가 직관적인 설명을 해주는 책이 더 없을까 찾아보게 된다. R 언어 같은 프로그래밍 언어, 하둡, NoSQL 등과 같은 내용까지 나오면 정말 눈앞이 깜깜하다. 데이터 과학을 다루는 책은 적지 않다. 그러나 대부분 책은 솔직히 나 같은 비전공자에겐 꽤 어려웠다. 이 책의 장점은 '쉽다'는 점이다. 무엇보다 이 책은 컴퓨터를 쓰는 사람이라면 어느 정도는 아는 엑셀을 가지고 설명한다. 이런 접근법은 R이나 파이썬 같은 프로그램 언어를 배울 필요 없이 데이터 과학을 시작할 수 있게 해 준다. 그러면서 저자는 데이터 과학을 이야기할 때 지나치게 데이터 과학 자체보다는 어떤 기술적 논의로 흐르는 경향을 비판한다. 널려 있는 엑셀로도 데이터 과학은 얼마든지 가능하다고 말하는 것이다. 무엇이 앞에 있고, 무엇이 뒤에 있는지 제대로 보고 가야 한다고 충고한다. 그리고 저자는 손에 잡히는 데이터를 가지고 데이터 과학을 설명한다. 일상에서 들어봤을 것 같은 이야기를 가지고 설명해서 독자들의 이해를 돕는다. 그러면서 데이터 과학에서 다루는 정말 다양한 기술들을 소개한다. 포괄적인 내용을 다루면서도 맥락을 잘 설명한다는 느낌을 받았다. 예를 들어, 내 경험에 의하면 몬테카를로 방법은 이해하기 쉬운 주제가 아니다. 인터넷에 수많은 자료들이 있지만, 시원하게 풀어주는 것은 없었다. 그렇지만 이 책의 경우 두 군데 정도에서 이 기법을 사용하는데, 그것을 보면서 훨씬 쉽게 다가갈 수 있었다. 시계열 분석과 예측 문제도 비슷했다. 사용되는 엑셀 언어는 약간은 고급 기술이지만, 충분히 이해될 정도다. 또 그냥 알아둬도 일상적인 업무에서 유용하게 쓸 수 있는 재미있는 기술들을 소개하고 있다. 새로운 프로그래밍 언어를 배울 때면 가장 먼저 그 언어로 "Hello, World!"를 인쇄해 보는 프로그래밍을 만들어 보게 된다. 이런 첫 번째 코드를 실행하고 나면 특이한 설렘이 생긴다. 그 느낌은 유럽 배낭 여행을 위해 첫 시작인 런던행 비행기에서의 기분과 비슷하다. 할까 말까 고민도 많았는데, 결국 비행기에 올랐고, 이제는 정말 해야 되는 상황으로 기대와 설렘, 걱정 등이 뒤섞여 있는 기분이다. 그 느낌으로 난 이 책을 "Hello, Data Science World!"라고 말하고 싶다. 그리고 내가 이 책의 느낌을 잘 살려 번역했기를 바란다.

R과 Shiny 패키지를 활용한 웹 애플리케이션 개발

R로 사람들이 무슨 일을 하는지 정말 궁금하다. 그간 R은 내게 무척 고마운 존재였다. 비용이 들지 않을뿐더러 인터넷에는 도움을 받을 수 있는 자료들이 넘쳐난다. R은 항상 뭔가를 생각하게 만들어 주었다. 컴퓨터와 코딩을 배우게 해 주었고, 일상의 업무를 바라보는 새로운 시각을 가지게 했다. 왜 고인이 된 스티브 잡스가 사람들에게 코딩을 배울 것을 권하며 코딩이 생각하는 방식을 바꾼다고 말했는지를 조금 이해하게 되었다. 시간이 흐르고 빅데이터 붐이 일어나면서 R이 점점 더 중요한 언어로 평가되어 인기도 올라가게 되니 매우 흐뭇하다. R 샤이니 패키지는 R 언어로 웹 애플리케이션을 만들 수 있는 프레임워크를 제공한다. 나 같은 아마추어도 쉽게 애플리케이션을 만들 수 있다. R은 데이터 분석에 뛰어난 언어이고 웹은 수많은 사람들과 소통하기 위한 인간이 만든 최고의 도구임에 틀림없다. 샤이니 패키지의 가치는 이 두 가지 툴의 시너지를 즐길 수 있도록 해 준다는 데 있다고 생각한다. '즐긴다'는 표현은, 머리 싸매고 웹과 관련된 여러 언어들을 처음부터 모두 알아야 할 필요가 없다는 사실을 강조하기 위해 사용했다. 그야말로 즐기면서 만들어 사용하면 된다. 물론 웹과 관련된 툴을 알고 있으면 더욱 더 짜릿하게 즐길 수 있다. 컴퓨터 언어도 시대에 따라 어떤 부침이 있는데, 샤이니 패키지에서 사용되는 반응성 프로그래밍(reactive programming) 방법은 최근 가장 떠오르는 프로그래밍 기법 중의 하나라고 한다. 따라서, 샤이니를 배운다는 것은 이런 최근 기법의 하나를 익히는 셈이 된다. 작지 않은 병원의 병원장이란 책임을 맡다 보니 공식, 비공식적인 일들이 항상 주위에서 일어나고 그때마다 최선을 다해서 일들을 처리해나가야 한다. 시간이 그리 넉넉하지는 않지만, 서머셋 모옴의 『달과 육펜스』를 떠올리면서 삶의 모든 시간을 육펜스에 쏟다보면 마음이 황폐해지는 것 같은 생각에 가끔은 글을 쓰는 달의 시간을 가지고 위해 노력했다. 마지막으로 졸역이겠지만 책이 되어 나오면 헌신적으로 환자 중심의 최고의 병원을 만들기 위해 노력하는, 존경하는 보바스기념병원과 보바스어린이병원 임직원들과 작은 기쁨이라도 나누고 싶다.

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자