일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 파이썬
- hadoop
- sql
- for문
- 함수
- 데이터사이언스
- stat
- code
- 리스트
- 야학
- 데이터분석
- 숫자야구
- 숫자야구코드
- 생활코딩
- python
- DataAnalysis
- 숫자야구소스
- 하둡
- 루비페이퍼
- big_data
- if문
- 데이터과학
- 빅데이터
- 임경덕
- list
- 코딩야학
- R
- DATABASE
- 이토록 쉬운 통계&R
- BigData
- Today
- Total
목록python (25)
yekang

데이터 공부를 시작하는사람들은 R을 해야하는지 Python을 해야하는지 SQL을 해야하는지 묻는다.나 또한 그중 한명이었다. 나는 컴퓨터공학도로 Python으로 시작했으며 Sql 공부도 하며 공모전 언어 통일의 이유로 R을 사용하기도 했다.이러한 언어들은 데이터 과학을 하기 위한 도구이고 또한 이들을 함께 공부할 수 있는 책이 나왔으면 하는 생각을 했는데 정확히 '데이터 전처리 대전'이 그 책이다. 또한 데이터 분석 부서의 인턴을 했었는데 실무에서도 Python, R, Sql을 모두 다 사용했었는데 인턴 시기에 나왔다면 동기들과 함께 사서 봤을법한 책이다. 막 입문하는 자보다는 언어 하나를 했고 나무보다는 숲을 보고 싶으며 좀 더 실무적으로 접근하고 싶은 자들에게 추천한다.

4차 산업혁명의 시대의 흐름에 편승하고 싶은 자, IT 업계로의 취업을 꿈꾸는 꿈나무에게 추천하고자 합니다. 인턴하면서 파이썬을 쓰고 있는데 파이썬을 사용한 알고리즘 가이드북이라 좋았고, "코딩게임" 플랫폼을 이용해 재미있게 접근할 수 있었습니다. 사실, 가장 중요한 것은 문제 해결 능력이라고 생각하는데 제가 기존에 본 책들과는 달리 아이디어적으로 접근하는 부분이 친절해 알고리즘 입문자, 알고리즘을 학교에서 배웠지만 응용하지 못하는 학생들에게 더욱 도움이 될거라 생각합니다. 책을 정독하고 나서 TAOCP(The Art of Computer Programming)책을 학습하면 더할 나위 없이 좋고 추후 취업을 위한 코딩 테스트에 많은 도움이 될거라 생각합니다!!
12345678910111213141516171819202122232425262728293031323334353637383940414243# -*- coding: utf-8 -*-"""Created on Wed Jul 5 11:16:53 2017@author: doden""" def get_average(dataset,index):#정보를 가진 리스트가 dataset임. sum=0 #tot=input('어떤 과목 점수 평균이 궁금하신가요?') for i in range(len(dataset)): sum=sum+int(dataset[i][index]) return sum/len(dataset) def make_dataset(raw_data): outlist=[] #a=["990001addx 17 29 16..
123456789101112131415161718192021222324252627282930313233343536373839# -*- coding: utf-8 -*-"""Created on Wed Jul 5 11:16:53 2017@author: doden""" def get_average(dataset,index):#정보를 가진 리스트가 dataset임. sum=0 #tot=input('어떤 과목 점수 평균이 궁금하신가요?') for i in range(len(dataset)): sum=sum+int(dataset[i][index]) return sum/len(dataset) def make_dataset(raw_data): outlist=[] #a=[ "990001addx 17 29 16 49 431..
임시 데이터 - 영구적으로 저장하기 위해 파일화. 메모장에 칸을 가지고 저장하는 방식. 그리고 ','를 가지고 저장하는 방식이 있음 원시적인 데이터의 저장형태는 데이터를 모아서 저장하는 형태인데 각 의미를 알기 힘드니 인덱스 달고 추가정보를 단다. 파일 형태대로 열어봤을때 얘가 무슨 데이터임을 알고 싶다. => 파일 자체가 ~데이터입니다를 표현하기 바람. self describition 여러가지 속성 어떻게 구별할까? = > 빈칸 => 불편 => 구분자 XML 등장=> 어떤 데이터임을 알려줌. 모든 종류의 파일을 표현할 수 있음/ (pdf ,csv는 콤마로 구분하는 파일)표기법이 조금 복잡했음 => Jason표기법( dictionary표기임 )영구 데이터 1) 파일형태2) 리스트 변환 3) 로직전달영구 ..
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576info='kim12365100 89 87'print(info[:3])print(info[3:8]) # :뒤 숫자는 포함이 안되기 때문에 +1해준다.print(info[8:11])print(info[11:14])print(info[14:])-------------------------------------------------------------------------- infov2='kim,12365,100,89,87'r=infov2.split(","..
문자열 처리방식 1. 해당 문자가 들어갈 칸을 정하는 방법 => substring 사용하는 문법 [자르고자하는 시작인덱스:자신이 얻고자하는 인덱스+1] 2. 데이터와 데이터 사이를 구분자를 두는 방법 => 보통 ','를 사용해 구분자를 둔다. ,를 처리하는건 split함수 사용하면 된다.123456789101112131415161718192021222324import calendardef viewMonth(year,_month): result=calendar.monthrange(year,_month) space=result[0]+1 month=_month lastDay=result[1] print('\t\t\t%d년 %d월'%(year,month)) print('Sun\tMon\tTue\tWed\tThu..
12345678910111213141516171819202122232425info='kim12365100 89 87'print(info[:3])print(info[3:8]) # :뒤 숫자는 포함이 안되기 때문에 +1해준다.print(info[8:11])print(info[11:14])print(info[14:]) infov2='kim,12365,100,89,87'r=infov2.split(",") #() 안에 구분자 넣으면 구분자로 나누어서 return해준다.sum=0for item in r: print(item) for item in r[2:]: sum=sum+int(item)print('합계는=>', sum) data=[1,2,3,4]print(data[:2])print(data[::-1])Color..
12345678910111213141516171819202122232425262728293031323334import randoma=[]while True: rnd=random.random() tmp=int(rnd*10*100/100) if tmp in a: continue a.append(tmp) if len(a)==3: breakprint('숫자생성:',a) while True: b=[] b = [int(x) for x in input('입력해주세요.').split()] """num1,num2,num3=int(input('입력하세요:')),int(input('입력하세요:')),int(input('입력하세요:')) b.append(num1) b.append(num2) b.append(num3)""" p..
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 import random def makeNumber(num): while True: number = int(random.random()*(10**num-10**(num-1)))+10**(num-1) check = isSameNumber(str(number)) if not check: break else : print('중복%d'%(number)) return str(number) def isSameNumber(strNumber): flag = F..