일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- DataAnalysis
- 숫자야구소스
- 이토록 쉬운 통계&R
- 데이터분석
- if문
- big_data
- 야학
- code
- 숫자야구
- DATABASE
- 함수
- 파이썬
- hadoop
- list
- sql
- 데이터사이언스
- 루비페이퍼
- 생활코딩
- 임경덕
- 리스트
- stat
- python
- 빅데이터
- 코딩야학
- BigData
- 데이터과학
- for문
- 하둡
- 숫자야구코드
- R
Archives
- Today
- Total
yekang
[Part 1. 차이를 확인하는 데이터 요약] ~20% 본문
* 20 % 물수능과 불수능
- 표준화(Standardization)
서로 다른 시험에서 얻은 점수를 비교해서 어느 쪽이 상대적으로 더 잘한 것인지 확인할 수 있는 방법
* 중심화(Centering) : 어떤 변수든지 원래 값에서 평균을 뺀 새로운 변수를 만들고 그 평균을 구하면 정확히 0이 나온다. 이렇게 관측치에서 평균을 빼는 과정을 중심화라고 한다.
* 척도화(Scaling) : 각 관측치를 표준편차로 나누는 것. 척도화는 값의 전반적인 크기를 보정할 뿐만 아니라, 단위를 없애준다. 즉, 변수가 어떤 단위를 쓰든 상관 없이 척도화의 결과는 단위가 없는 그냥 숫자인 것이다.
변수를 먼저 중심화하고 다음으로 척도화하는 과정을 표준화라고 한다. 어떤 변수를 가져오든 상관없이 표준화를 거친 변수의 평균은 0이 되고 표준편차는 1이 된다.
평균 47.8점, 표준편차 19.7점인 2011년도 수능에서 80점을 받은 학생과 평균 55.4점, 표준편차가 28.5점인 2015년도 수능에서 100점을 받은 학생 중에서 어느 쪽이 상대적으로 잘했는지 표준화로 계산을 해본다.
시험이 어려우면 어려울수록 점수는 하향평준화된다. 그래서 2011년도의 평균점수와 표준편차는 낮다. 각 수능 점수를 표준화하면 1.63과 1.56이라는 값이 나오는데 이는 2011년대의 80점은 중심에서 오른쪽으로 1.63만큼 떨어져 있고, 2015년의 100점은 중심에서 오른쪽으로 1.56만큼 떨어져 있다는 뜻이 된다. 따라서 2011년의 80점이 2015년의 100점보다 상대적으로 더 낫다고 볼 수 있다.
'빅데이터 > R' 카테고리의 다른 글
[Part 1. 차이를 확인하는 데이터 요약] ~30% (0) | 2018.03.04 |
---|---|
[Part 1. 차이를 확인하는 데이터 요약] ~25% (0) | 2018.03.03 |
[Part 1. 차이를 확인하는 데이터 요약] ~15% (0) | 2018.02.27 |
[Part 1. 차이를 확인하는 데이터 요약] ~10%[2] (0) | 2018.02.26 |
[Part 1. 차이를 확인하는 데이터 요약] ~10%[1] (0) | 2018.02.02 |
Comments