홈 > 부모님 > 부모님 > 소설,일반 > 컴퓨터,모바일
R을 활용한 데이터 과학  이미지

R을 활용한 데이터 과학
데이터 불러오기, 정돈하기, 변형하기, 시각화하기, 모델링하기, 제2판
인사이트 | 부모님 | 2026.02.04
  • 정가
  • 45,000원
  • 판매가
  • 40,500원 (10% 할인)
  • S포인트
  • 2,250P (5% 적립)
  • 상세정보
  • 18.8x24 | 1.245Kg | 655p
  • ISBN
  • 9788966265145
  • 배송비
  • 2만원 이상 구매시 무료배송 (제주 5만원 이상) ?
    배송비 안내
    전집 구매시
    주문하신 상품의 전집이 있는 경우 무료배송입니다.(전집 구매 또는 전집 + 단품 구매 시)
    단품(단행본, DVD, 음반, 완구) 구매시
    2만원 이상 구매시 무료배송이며, 2만원 미만일 경우 2,000원의 배송비가 부과됩니다.(제주도는 5만원이상 무료배송)
    무료배송으로 표기된 상품
    무료배송으로 표기된 상품일 경우 구매금액과 무관하게 무료 배송입니다.(도서, 산간지역 및 제주도는 제외)
  • 출고일
  • 품절된 상품입니다.
  • ★★★★★
  • 0/5
리뷰 0
리뷰쓰기

구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.

  • 출판사 리뷰
  • 작가 소개
  • 목차
  • 회원 리뷰

  출판사 리뷰

전면 개정되어 돌아온, 데이터 과학 분야의 바이블

이 책은 예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서입니다. 데이터 과학을 빠르고 효율적이며 재미있게 만들어 주는 R 패키지 모음인 tidyverse를 통해 실제 분석 과정을 익힐 수 있습니다. 따라서 프로그래밍 경험이 전혀 없더라도, 이 cor과 함께라면 빠르게 데이터 과학을 시작할 수 있습니다.
독자들은 이 책을 통해 데이터를 불러오고, 변형하고, 시각화하고, 결과를 바탕으로 의사소통하는 방법을 익힐 수 있습니다. 또한 데이터 과학 프로세스 전체를 큰 그림으로 이해하고 세부 요소를 다루는 데 필요한 기본 도구도 폭넓게 이해할 수 있습니다.
이번 개정판에서는 최신 tidyverse 기능과 우수 사례들이 업데이트되었으며, 스프레드시트, 데이터베이스, 웹사이트에서 데이터를 가져오는 방법을 익히는 새로운 장도 추가되었습니다. 연습문제를 풀면서 책에서 익힌 내용을 복습할 수도 있습니다.

이 책에서 다루는 내용
? 시각화하기: 데이터를 탐색하고 분석 결과를 전달하는 데 필요한 그래프를 만듭니다.
? 변형하기: 변수 타입과 이를 다루는 도구를 익힙니다.
? 불러오기: 데이터를 R로 가져오고 분석하기 편한 형태로 만듭니다.
? 프로그래밍하기: 더 명확하고 쉽게 데이터 문제를 해결하는 R 도구를 익힙니다.
? 의사소통하기: Quarto를 이용해 글, 코드, 분석 결과를 통합한 보고서를 만듭니다.

"데이터 분석 작업의 중심에는 R이 있습니다. R을 활용하면 데이터 분석에 필요한 다양한 작업을 쉽고 간결한 명령어로 처리할 수 있습니다. 특히 tidyverse 생태계의 패키지들은 분석가가 프로그래밍 기술의 늪에 빠지지 않고 데이터 분석 본연의 과정에 집중할 수 있도록 도와주는 든든한 도구입니다. 《R을 활용한 데이터 과학》은 tidyverse의 창시자인 해들리 위컴이 직접 패키지의 사용법을 설명하고, 데이터를 정돈해 효율적으로 분석하는 방법을 안내하는 의미 있는 책입니다."
- '옮긴이의 글' 중에서


  작가 소개

지은이 : 해들리 위컴
Posit, PBC의 수석 과학자이며, 2019년 COPSS 상 수상자이자 R 파운데이션 회원이다. 데이터 과학을 더 쉽고 빠르고 재미있게 만들기 위해 프로그래밍 도구와 개념적 도구를 만들고 있으며, 데이터 과학용 패키지(ggplot2, dplyr, tidyr을 포함하는 tidyverse)와 체계적인 소프트웨어 개발 도구(roxygen2, testthat, pkgdown 등)를 개발하였다. R을 이용한 데이터 과학 활동을 장려하기 위해 작가, 교육자, 연사로도 활동하고 있다. 자세한 소개는 그의 웹사이트(http://hadley.nz)에서 확인할 수 있다.

지은이 : 개럿 그롤문드
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다.데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다.교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.

지은이 : 미네 체틴카야-룬델
듀크대학교 통계과학과 실무 교수이자 Posit, PBC의 개발자 교육 담당자이다. 주요 연구 분야는 통계학과 데이터 과학 교육학이며, 특히 컴퓨팅, 재현 가능한 연구, 학생 중심 학습, 오픈 소스 교육에 역점을 두고 있다. OpenIntro 프로젝트의 일환으로 통계학 입문 교과서를 집필하였고, Data Science in a Box를 만들어 관리하고 있다. 또한 코세라의 인기 과정인 Statistics with R specialization을 개설해 운영하고 있다. 그녀는 2021년 Hogg 어워드의 입문 통계학 교육 부문 우수상, 2018년 하버드 피카드 상, 2016년 ASA 월러 교육상을 받았다. 자세한 소개는 그녀의 웹사이트(https://mine-cr.com)에서 확인할 수 있다.

  목차

옮긴이의 글
지은이의 글

1부 전체 흐름

1장 데이터 시각화하기
들어가며
첫 단계
ggplot2 호출하기
분포 시각화하기
변수의 관계 시각화하기
그래프 저장하기
자주 겪는 문제들
요약

2장 워크플로우: 기초
코딩 기초
주석
이름을 어떻게 지을까?
함수 호출하기
연습문제
요약

3장 데이터 변형하기
들어가며


파이프
그룹화
사례 연구: 집계와 샘플 크기
요약

4장 워크플로우: 코드 스타일
이름 짓기
공백 넣기
파이프
ggplot2
구획 나누기 주석
연습문제
요약

5장 데이터 정돈하기
들어가며
정돈된 데이터
데이터를 세로로 늘이기
데이터를 가로로 넓히기
요약 97

6장 워크플로우: 스크립트와 프로젝트
스크립트
프로젝트
연습문제
요약

7장 데이터 불러오기
들어가며
파일에서 데이터 불러오기
열 타입 다루기
여러 파일에서 데이터 불러오기
데이터를 파일로 저장하기
데이터 입력하기
요약

8장 워크플로우: 도움 구하기
구글은 우리의 친구
reprex 만들기
자신에게 투자하기
요약

2부 시각화하기

9장 레이어
들어가며
시각적 속성 매핑
기하학 객체
패싯
통계적 변환
위치 조정
좌표계
그래픽 문법의 레이어 구조
요약

10장 탐색적 자료 분석
들어가며
질문
변동
특이한 값
공변동
패턴과 모델
요약

11장 의사소통
들어가며
레이블
주석
스케일
테마
레이아웃
요약

3부 변형하기

12장 논리형 벡터
들어가며
비교하기
불 대수
요약하기
조건부 변형
요약

13장 수치형 벡터
들어가며
숫자 만들기
개수 세기
수치 변환
일반적인 변형 방법들
수치 요약
요약

14장 문자열
들어가며
문자열 만들기
데이터를 이용해 여러 문자열 만들기
문자열에서 데이터 추출하기
글자 다루기
비영어 텍스트
요약

15장 정규 표현식
들어가며
기본적인 패턴
핵심 함수
패턴 세부 사항
패턴 제어하기
연습해 보기
다른 곳에서 정규 표현식 사용하기
요약

16장 팩터
들어가며
팩터 기초
종합사회조사
팩터 순서 바꾸기
팩터 레벨 수정하기
순서형 팩터
요약

17장 날짜와 시간
들어가며
날짜-시간형 변수 만들기
개별 구성 요소로 만들기
날짜-시간 구성 요소
시간 범위
시간대
요약

18장 결측치
들어가며
명시적 결측치
암묵적 결측치
팩터와 빈 그룹
요약

19장 조인
들어가며

기본적인 조인
조인은 어떻게 작동할까?
비등가 조인
요약

4부 데이터 불러오기

20장 스프레드시트
들어가며
엑셀
구글 시트
요약

21장 데이터베이스
들어가며
데이터베이스 기초
데이터베이스 연결하기
dbplyr 기초
SQL
함수 번역
요약

22장 Arrow
들어가며
데이터 가져오기
데이터셋 열기
파케이 포맷
dplyr을 arrow와 함께 사용하기
요약

23장 계층형 데이터
들어가며
리스트
펼치기
사례 연구
JSON
요약

24장 웹 스크래핑
들어가며
스크래핑의 윤리성과 합법성
HTML 기초
데이터 추출하기
올바른 선택자 찾기
모두 함께 사용하기
동적 사이트
요약

5부 프로그래밍

25장 함수
들어가며
벡터 함수
데이터 프레임 함수
그래프 함수
스타일
요약

26장 반복
들어가며
여러 열 수정하기
여러 파일 불러오기
여러 출력물 저장하기
요약

27장 base R 현장 가이드
들어가며
[로 여러 요소 선택하기
$와 [[로 단일 요소 선택하기
Apply 계열 함수
for 반복문
그래프
요약

6부 의사소통하기

28장 Quarto
들어가며
Quarto 기초
비주얼 에디터
소스 에디터
코드 청크
그림

캐싱
문제 해결하기
YAML 헤더
작업 흐름
요약

29장 Quarto 문서 포맷
들어가며
출력 옵션
다양한 문서 포맷
프레젠테이션
상호작용 문서
웹사이트와 책 만들기
기타 포맷
요약

  회원리뷰

리뷰쓰기