
구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.
지은이 : 해들리 위컴
Posit, PBC의 수석 과학자이며, 2019년 COPSS 상 수상자이자 R 파운데이션 회원이다. 데이터 과학을 더 쉽고 빠르고 재미있게 만들기 위해 프로그래밍 도구와 개념적 도구를 만들고 있으며, 데이터 과학용 패키지(ggplot2, dplyr, tidyr을 포함하는 tidyverse)와 체계적인 소프트웨어 개발 도구(roxygen2, testthat, pkgdown 등)를 개발하였다. R을 이용한 데이터 과학 활동을 장려하기 위해 작가, 교육자, 연사로도 활동하고 있다. 자세한 소개는 그의 웹사이트(http://hadley.nz)에서 확인할 수 있다.
지은이 : 개럿 그롤문드
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다.데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다.교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.
지은이 : 미네 체틴카야-룬델
듀크대학교 통계과학과 실무 교수이자 Posit, PBC의 개발자 교육 담당자이다. 주요 연구 분야는 통계학과 데이터 과학 교육학이며, 특히 컴퓨팅, 재현 가능한 연구, 학생 중심 학습, 오픈 소스 교육에 역점을 두고 있다. OpenIntro 프로젝트의 일환으로 통계학 입문 교과서를 집필하였고, Data Science in a Box를 만들어 관리하고 있다. 또한 코세라의 인기 과정인 Statistics with R specialization을 개설해 운영하고 있다. 그녀는 2021년 Hogg 어워드의 입문 통계학 교육 부문 우수상, 2018년 하버드 피카드 상, 2016년 ASA 월러 교육상을 받았다. 자세한 소개는 그녀의 웹사이트(https://mine-cr.com)에서 확인할 수 있다.
옮긴이의 글
지은이의 글
1부 전체 흐름
1장 데이터 시각화하기
들어가며
첫 단계
ggplot2 호출하기
분포 시각화하기
변수의 관계 시각화하기
그래프 저장하기
자주 겪는 문제들
요약
2장 워크플로우: 기초
코딩 기초
주석
이름을 어떻게 지을까?
함수 호출하기
연습문제
요약
3장 데이터 변형하기
들어가며
행
열
파이프
그룹화
사례 연구: 집계와 샘플 크기
요약
4장 워크플로우: 코드 스타일
이름 짓기
공백 넣기
파이프
ggplot2
구획 나누기 주석
연습문제
요약
5장 데이터 정돈하기
들어가며
정돈된 데이터
데이터를 세로로 늘이기
데이터를 가로로 넓히기
요약 97
6장 워크플로우: 스크립트와 프로젝트
스크립트
프로젝트
연습문제
요약
7장 데이터 불러오기
들어가며
파일에서 데이터 불러오기
열 타입 다루기
여러 파일에서 데이터 불러오기
데이터를 파일로 저장하기
데이터 입력하기
요약
8장 워크플로우: 도움 구하기
구글은 우리의 친구
reprex 만들기
자신에게 투자하기
요약
2부 시각화하기
9장 레이어
들어가며
시각적 속성 매핑
기하학 객체
패싯
통계적 변환
위치 조정
좌표계
그래픽 문법의 레이어 구조
요약
10장 탐색적 자료 분석
들어가며
질문
변동
특이한 값
공변동
패턴과 모델
요약
11장 의사소통
들어가며
레이블
주석
스케일
테마
레이아웃
요약
3부 변형하기
12장 논리형 벡터
들어가며
비교하기
불 대수
요약하기
조건부 변형
요약
13장 수치형 벡터
들어가며
숫자 만들기
개수 세기
수치 변환
일반적인 변형 방법들
수치 요약
요약
14장 문자열
들어가며
문자열 만들기
데이터를 이용해 여러 문자열 만들기
문자열에서 데이터 추출하기
글자 다루기
비영어 텍스트
요약
15장 정규 표현식
들어가며
기본적인 패턴
핵심 함수
패턴 세부 사항
패턴 제어하기
연습해 보기
다른 곳에서 정규 표현식 사용하기
요약
16장 팩터
들어가며
팩터 기초
종합사회조사
팩터 순서 바꾸기
팩터 레벨 수정하기
순서형 팩터
요약
17장 날짜와 시간
들어가며
날짜-시간형 변수 만들기
개별 구성 요소로 만들기
날짜-시간 구성 요소
시간 범위
시간대
요약
18장 결측치
들어가며
명시적 결측치
암묵적 결측치
팩터와 빈 그룹
요약
19장 조인
들어가며
키
기본적인 조인
조인은 어떻게 작동할까?
비등가 조인
요약
4부 데이터 불러오기
20장 스프레드시트
들어가며
엑셀
구글 시트
요약
21장 데이터베이스
들어가며
데이터베이스 기초
데이터베이스 연결하기
dbplyr 기초
SQL
함수 번역
요약
22장 Arrow
들어가며
데이터 가져오기
데이터셋 열기
파케이 포맷
dplyr을 arrow와 함께 사용하기
요약
23장 계층형 데이터
들어가며
리스트
펼치기
사례 연구
JSON
요약
24장 웹 스크래핑
들어가며
스크래핑의 윤리성과 합법성
HTML 기초
데이터 추출하기
올바른 선택자 찾기
모두 함께 사용하기
동적 사이트
요약
5부 프로그래밍
25장 함수
들어가며
벡터 함수
데이터 프레임 함수
그래프 함수
스타일
요약
26장 반복
들어가며
여러 열 수정하기
여러 파일 불러오기
여러 출력물 저장하기
요약
27장 base R 현장 가이드
들어가며
[로 여러 요소 선택하기
$와 [[로 단일 요소 선택하기
Apply 계열 함수
for 반복문
그래프
요약
6부 의사소통하기
28장 Quarto
들어가며
Quarto 기초
비주얼 에디터
소스 에디터
코드 청크
그림
표
캐싱
문제 해결하기
YAML 헤더
작업 흐름
요약
29장 Quarto 문서 포맷
들어가며
출력 옵션
다양한 문서 포맷
프레젠테이션
상호작용 문서
웹사이트와 책 만들기
기타 포맷
요약
도서 DB 제공 - 알라딘 인터넷서점 (www.aladin.co.kr)