일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- code
- 리스트
- 빅데이터
- if문
- 숫자야구
- 하둡
- hadoop
- 데이터과학
- R
- 파이썬
- DataAnalysis
- 루비페이퍼
- 임경덕
- 숫자야구소스
- 야학
- sql
- stat
- 데이터분석
- 생활코딩
- list
- python
- BigData
- 함수
- 코딩야학
- DATABASE
- 숫자야구코드
- 데이터사이언스
- 이토록 쉬운 통계&R
- big_data
- for문
- Today
- Total
목록데이터과학 (12)
yekang
* 1 % 줌아웃 데이터는 나무 한 그루 한 그루가 모여 만들어진 큰 숲과 같다. 데이터 분석은 이 나무들의 특징을 살펴보는 과정이라고 볼 수 있다. 이를 위해서는 먼저 가장 높은 곳에 올라가 숲 전체를 살펴봐야 한다. 즉 크고 복잡한 데이터도 멀리서 바라보면 몇 가지 특징을 확인할 수 있다. 다만 특징을 말로 설명하는 것이 아니라 통계를 활용해서 모두 숫자로 표현한다. ( ex : 평균 ) 이처럼 데이터의 특징을 숫자로 표현하는 과정을 요약이라고 한다. 데이터 요약은 단순히 데이터의 특징을 숫자로 표현하기 위한 것이 아니라 데이터의 특징을 살피고 어떤 차이가 있는지 살펴보며 분석의 방향을 설정하는데 도움이 되는 것이다. *5% 날줄과 씨줄- 데이터의 구성 이름성별 몸무게 홍길동남자 55 라이언남자60 ..
IT 전문 출판사 루비페이퍼의 신간이 나왔다. 실전 데이터 분석에 꼭 필요한 통계의 핵심 만 꼭꼭 눌러 담은 것은 물론 과도한 수식에 체하지 않도록 수식을 최소화하였으며 가볍게 시작하고 마무리할 수 있도록 즐거운 예시와 비유로 가득 채웠다고 하는 이 책은 데이터 분석가 임경덕 님의 저서이다. 머신러닝, 데이터분석에 관심이 많은 나로써는 매우 기대하는 책이다! 평소 파이썬을 쓰는 것을 선호하는데 R 지식의 기초를 다지기 위해서 서평단 겸 100일 스터디에 지원하고 운이 좋게도 참여할 수 있게 되었다. (^^) 통계적 지식에 대한 중요성을 인식한 것도 한몫했다. ( 코드를 봐도 왜 그렇게 했는지 이해를 못하니깐 ... ) R을 이용한 데이터분석을 조금 접한 나로썬 실제 R을 활용해서 현업에서 일하시는 분의 ..