R좀 R려줘: 기본기부터 탄탄하게 배우는 R
- 개인저자
- 김승욱 지음
- 발행사항
- 남양주 : 느린생각, 2017
- 형태사항
- 429 p. : 삽화(일부천연색), 도표 ; 23 cm
- ISBN
- 9791187139119
- 청구기호
- 413.7 김58r
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
1자료실 | 00016769 | 대출가능 | - |
- 등록번호
- 00016769
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 1자료실
책 소개
대부분의 입문자는 R에 대해 표도 잘 그릴 수 있고 그래프 그린다는 사실을 익히 들어 알고 있는 경우가 많다. 하지만 대부분의 R책에선 이런 내용을 책 후반에서나 다룬다. 보기만 해도 어지럽고 이해하기 힘든 통계와 수학이 책 전반부을 채우기 때문에 R을 입문한 사람들 중에 초기에 포기하는 사람들이 많다.
이 책은 초반부터 파일을 불러오는 방법과 표 그리는 방법 그리고 그래프 그리는 방법까지 자세히 설명한다. 전체 그림을 먼저 이해하고 각 파트별로 자세히 배울 수 있도록 구성했다.
R은 수 많은 방법으로 동일한 결과를 낼 수 있다. 그렇기 때문에 경험이 중요하고 경험한 사람의 노하우가 중요하다. 저자는 현업에서 데이터 분석을 하면서 알게 된 수 많은 Tip을 책 전반에 걸쳐 넣었다. 이 Tip만 잘 활용해도 전문가로 가는 좋은 길을 달릴 수 있을 것이다.
이 책은 R을 가장 쉽고 확실히 배우고 싶은 입문자에게 꼭 필요한 책이 될 것이다.
R 프로그래밍도 어려운데 통계까지 공부하려면 상당히 많은 시간과 노력이 필요하다. 저자는 이런 독자의 마음을 너무 잘 알고 있다는 듯이 R 프로그래밍에 입문하는 사람에게 적합한 책을 집필했다. 저자의 의도대로 책은 가볍고 언제든 들고 다니면서 쉽게 볼 수 있도록 만들어졌다. 기본적인 것을 놓치지 않기 위해 차분히 설명하고 있고 저자가 실무에서 터득한 수 많은 팁이 책 전반에 걸쳐있다.
430페이지는 적지 않은 분량이다. 하지만 R과 통계에 입문하기에 너무 적지도 않고 많지도 않은 적당한 내용이다. 소설책과 같은 크기를 가졌기에 쉽게 들고 다니면서 저자가 전하는 강의를 언제든, 어디서든 들을 수 있다.
R 프로그래밍은 환경셋팅이 중요한데 환경셋팅 하면서 지치는 사람도 많다. 이런 경험을 토대로 자세한 환경셋팅 방법과 사용방법을 자세히 설명한다.
데이터를 다루기 위해서는 수 많은 시행착오가 필요하다. 경험을 하기에 시간이 부족하다면 누군가의 경험에 귀 기울여야 한다. 저자는 이 책에서 데이터를 다루는 다양한 방법을 전하기 위해 노력한다. 저자가 실무에서 배웠던 실수를 다른 사람에게 반복되지 않기 위해 가능한 자세한 설명을 한다.
데이터를 시각화 하는 것은 아주 중요하다. R에선 다양한 방법으로 시각화 할 수 있는데 그 중에서 가장 많이 사용하는 방법을 소개한다. 이 책에서 소개하는 방법만 익숙해져도 데이터 시각화하는데 자신감을 가질 수 있게 될 것이다.
이 책은 분명히 가벼운 마음으로 부담 없이 R과 통계학에 입문하는 사람에게 적합하다. 시작은 부담이 없었지만 이 책을 모두 공부하면 자신감으로 가득할 것이다.
목차
서문
들어가며
1.1 R 프로그램의 이해
1.2 R 프로그램 및 R-Studio 설치
1.3 프로그램 시작하기
1.3.1 스크립트 창 생성 및 화면 구성
1.3.2 주석 입력
1.3.3 코드 실행
무작정 따라 하는 실습
2.1 데이터 읽어 오기 1
2.1.1 작업폴더 확인하기
2.1.2 작업폴더 변경하기
2.1.3 폴더/파일 확인하기
2.1.4 데이터 가져오기
2.1.5 데이터 읽어오기
2.2 데이터 확인하기
2.3 데이터 추출하기
2.4 데이터 삽입하기
2.5 기본 표 만들기
2.6 기본 그래프 그리기
2.7 결과물 저장하기
R아보기
3.1 R 스크립트
3.1.1 함수(function)
3.1.2 사용자 정의 함수(User Defined Function)
3.1.3 연산자(operator)
3.2 클래스(Class)
3.2.1 원소
3.2.2 객체 형식
3.2.3 클래스의 확인 및 변환
3.2.4 기타
3.3 패키지
3.3.1 유용한 패키지
3.3.2 패키지 설치 방법
3.4 데이터 읽어 오기 2
3.4.1 특정 구분자로 나뉘어져 있는 텍스트 읽어오기
3.4.2 tsv(tab separated values) 파일 읽어오기
3.4.3 fwf(fixed width file) 파일 읽어오기
3.4.4 엑셀 파일 읽어오기
3.4.5 일부 데이터만 읽어오기
3.5. 사용 편의를 위한 팁
3.5.1 글자 확대
3.5.2 현재 작업 코드 강조하기
3.5.3 스크립트 특정 위치에 마킹하기
3.5.4 스크립트 책갈피 만들기
3.5.5 유용한 단축키
데이터 이해하기
4.1 기술통계량 알아보기
4.1.1 기초 함수
4.1.2 패키지 활용
4.2 상자그림(Box plot)
4.3 첨도, 왜도 그리고 정규분포
4.3.1 정규분포(Normal Distribution)
4.3.2 첨도(Kurtosis)
4.3.3 왜도(Skewness)
4.4 상관계수의 이해와 계산
데이터 다루기
5.1 다양한 데이터 다루기
5.1.1 단순 반복
5.1.2 순차 데이터
5.1.3 조합 데이터
5.1.4 무작위 데이터
5.1.5 시간 데이터
5.2 문자열 처리
5.2.1 기초 함수
5.2.2 문자열 분리
5.2.3 문자열 결합
5.2.4 패턴 매칭
5.2.5 패턴 치환
5.3 조금 더 복잡한 계산
5.3.1 반복문(for)
5.3.2 조건문(if)
5.3.3 조건문(ifelse)
5.3.4 일괄 계산(apply)
5.3.5 자료 요약(aggregate)
5.3.6 피보팅(Pivoting)
5.3.7 자료 병합
5.4 데이터 정렬과 결측 처리
5.4.1 데이터 정렬
5.4.2 결측 처리
시각화
6.1 기본 그래프
6.1.1 파라미터 추가 - 색상
6.1.2 파라미터 추가 - 크기
6.1.3 파라미터 추가 - 축 범위
6.1.4 파라미터 추가 - 모양
6.1.5 파라미터 추가 - 제목
6.1.6 그래프 추가
6.2 ggplot 시작하기
6.2.1 ggplot 기본 문법
6.2.2 ggplot 기본 그래프
6.3 ggplot 제대로 사용하기
6.3.1 size
6.3.2 색상 설정
6.3.3 문자열 입력
6.3.4 축 설정
6.3.6 고급 그래프