일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 데이터과학
- sql
- hadoop
- 숫자야구
- code
- 파이썬
- R
- 데이터분석
- for문
- 하둡
- 리스트
- stat
- python
- BigData
- big_data
- 생활코딩
- 빅데이터
- 임경덕
- 숫자야구소스
- 데이터사이언스
- 야학
- 루비페이퍼
- DATABASE
- DataAnalysis
- if문
- 숫자야구코드
- 함수
- 이토록 쉬운 통계&R
- 코딩야학
- list
- Today
- Total
목록빅데이터/파이썬 (24)
yekang
Decision Tree- 기계학습에서 지도학습의 알고리즘- 분류 또는 회귀 분석의 목적- 분류와 예측을 수행- 목표변수 유형에 따른 의사결정 트리- 범주형 목표변수 : 분류 트리- 목표변수가 이산형인 경우, 범주에 속하는 빈도에 기초해서 분리가 발생..-> 분류 트리- 연속형 목표변수 : 회귀 트리- 목표변수가 연속형인 경우, 평균과 표준편차에 기초해 분리 발생 ..-> 회귀 트리 Decision Tree 분리 기준- 부모 노드로부터 자식노드들이 형성될 때 생성된 자식노드에 속하는 자료의 순수도가 가장 크게 증가하도록 트리를 형성- 입력 변수를 이용해 목표변수의 분포를 얼마나 잘 구별하는 정도를 파악해 자식 마디가 형성되는데, 목표변수의 구별 정도를 불순도( 다양한 범주들의 개체들이 포함되어 있는 정도..
12345678910111213141516171819202122232425262728293031323334353637383940414243# -*- coding: utf-8 -*-"""Created on Wed Jul 5 11:16:53 2017@author: doden""" def get_average(dataset,index):#정보를 가진 리스트가 dataset임. sum=0 #tot=input('어떤 과목 점수 평균이 궁금하신가요?') for i in range(len(dataset)): sum=sum+int(dataset[i][index]) return sum/len(dataset) def make_dataset(raw_data): outlist=[] #a=["990001addx 17 29 16..
123456789101112131415161718192021222324252627282930313233343536373839# -*- coding: utf-8 -*-"""Created on Wed Jul 5 11:16:53 2017@author: doden""" def get_average(dataset,index):#정보를 가진 리스트가 dataset임. sum=0 #tot=input('어떤 과목 점수 평균이 궁금하신가요?') for i in range(len(dataset)): sum=sum+int(dataset[i][index]) return sum/len(dataset) def make_dataset(raw_data): outlist=[] #a=[ "990001addx 17 29 16 49 431..
임시 데이터 - 영구적으로 저장하기 위해 파일화. 메모장에 칸을 가지고 저장하는 방식. 그리고 ','를 가지고 저장하는 방식이 있음 원시적인 데이터의 저장형태는 데이터를 모아서 저장하는 형태인데 각 의미를 알기 힘드니 인덱스 달고 추가정보를 단다. 파일 형태대로 열어봤을때 얘가 무슨 데이터임을 알고 싶다. => 파일 자체가 ~데이터입니다를 표현하기 바람. self describition 여러가지 속성 어떻게 구별할까? = > 빈칸 => 불편 => 구분자 XML 등장=> 어떤 데이터임을 알려줌. 모든 종류의 파일을 표현할 수 있음/ (pdf ,csv는 콤마로 구분하는 파일)표기법이 조금 복잡했음 => Jason표기법( dictionary표기임 )영구 데이터 1) 파일형태2) 리스트 변환 3) 로직전달영구 ..
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576info='kim12365100 89 87'print(info[:3])print(info[3:8]) # :뒤 숫자는 포함이 안되기 때문에 +1해준다.print(info[8:11])print(info[11:14])print(info[14:])-------------------------------------------------------------------------- infov2='kim,12365,100,89,87'r=infov2.split(","..
문자열 처리방식 1. 해당 문자가 들어갈 칸을 정하는 방법 => substring 사용하는 문법 [자르고자하는 시작인덱스:자신이 얻고자하는 인덱스+1] 2. 데이터와 데이터 사이를 구분자를 두는 방법 => 보통 ','를 사용해 구분자를 둔다. ,를 처리하는건 split함수 사용하면 된다.123456789101112131415161718192021222324import calendardef viewMonth(year,_month): result=calendar.monthrange(year,_month) space=result[0]+1 month=_month lastDay=result[1] print('\t\t\t%d년 %d월'%(year,month)) print('Sun\tMon\tTue\tWed\tThu..
12345678910111213141516171819202122232425info='kim12365100 89 87'print(info[:3])print(info[3:8]) # :뒤 숫자는 포함이 안되기 때문에 +1해준다.print(info[8:11])print(info[11:14])print(info[14:]) infov2='kim,12365,100,89,87'r=infov2.split(",") #() 안에 구분자 넣으면 구분자로 나누어서 return해준다.sum=0for item in r: print(item) for item in r[2:]: sum=sum+int(item)print('합계는=>', sum) data=[1,2,3,4]print(data[:2])print(data[::-1])Color..
12345678910111213141516171819202122232425262728293031323334import randoma=[]while True: rnd=random.random() tmp=int(rnd*10*100/100) if tmp in a: continue a.append(tmp) if len(a)==3: breakprint('숫자생성:',a) while True: b=[] b = [int(x) for x in input('입력해주세요.').split()] """num1,num2,num3=int(input('입력하세요:')),int(input('입력하세요:')),int(input('입력하세요:')) b.append(num1) b.append(num2) b.append(num3)""" p..
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 import random def makeNumber(num): while True: number = int(random.random()*(10**num-10**(num-1)))+10**(num-1) check = isSameNumber(str(number)) if not check: break else : print('중복%d'%(number)) return str(number) def isSameNumber(strNumber): flag = F..
야구게임 작성중복되지 않는 3자리수를 생성한다.사용자는 중복되지 않는 임의의 3자리 수를 입력한다.생성된 수와 입력할 수를 비교하여-숫자가 같고 자리수가 틀리면 ball-숫자가 같고 자리수가 같으면 strike비교결과가 3strike이면 종료되는 코드를 작성하시오 숫자를 생성한다 - 예상 숫자를 입력한다. - 생성 숫자와 예상 숫자를 비교한다. - 3자리 수를 모두 맞추면 종료한다. 핵심로직3자리 수를 생성하는 함수를 생성3자리 수의 중복여부를 판별하는 함수를 생성생성 수와 입력 수를 판별하는 함수 생성중복되지 않는 임의수 생성-함수를 통해 임의 수를 생성한 후 중복여부를 검사하여 중복이면 다시 생성함수를 호출-중복되지 않은 수가 나올때까지 반복중복되지 않는 입력 수 확인-중복 여부를 검사하여 그 결과를..