일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 함수
- 이토록 쉬운 통계&R
- DataAnalysis
- 숫자야구소스
- 임경덕
- 생활코딩
- hadoop
- 빅데이터
- 숫자야구코드
- 숫자야구
- 리스트
- BigData
- code
- sql
- for문
- python
- 하둡
- 루비페이퍼
- R
- 야학
- if문
- list
- 데이터과학
- 파이썬
- big_data
- 데이터사이언스
- 코딩야학
- stat
- 데이터분석
- DATABASE
- Today
- Total
목록sql (10)
yekang

데이터 공부를 시작하는사람들은 R을 해야하는지 Python을 해야하는지 SQL을 해야하는지 묻는다.나 또한 그중 한명이었다. 나는 컴퓨터공학도로 Python으로 시작했으며 Sql 공부도 하며 공모전 언어 통일의 이유로 R을 사용하기도 했다.이러한 언어들은 데이터 과학을 하기 위한 도구이고 또한 이들을 함께 공부할 수 있는 책이 나왔으면 하는 생각을 했는데 정확히 '데이터 전처리 대전'이 그 책이다. 또한 데이터 분석 부서의 인턴을 했었는데 실무에서도 Python, R, Sql을 모두 다 사용했었는데 인턴 시기에 나왔다면 동기들과 함께 사서 봤을법한 책이다. 막 입문하는 자보다는 언어 하나를 했고 나무보다는 숲을 보고 싶으며 좀 더 실무적으로 접근하고 싶은 자들에게 추천한다.
* 데이터 제어어(DCL : Data Contol Language)는 데이터베이스에 접근하고 객체들을 사용할 수 있도록 권한을 부여하거나 회수하는 명령어GrantRevoke * As-Is : 비절차적 데이터 조작어(DML)는 사용자가 무슨(What) 데이터를 원하는지만을 명세함.To-Be : 비절차적 데이터 조작어(DML)는 사용자가 무슨(What) 데이터를 원하는지만을 명세하지만, 절차적 데이터 조작어는 어떻게 (How) 데이터를 접근해야 하는지 명세한다. 절차적 데이터 조작어로는 PL/SQL(Oracle), T-SQL(Sql-Server) 등이 있다. * 데이터 부속어(Data Sub Language) : 호스트 프로그램 속에 삽입되어 사용되는 DML 명령어 * DDL(Data Definition L..
1234567891011121314151617181920-- 대표적인 동의어SELECT FROM all_objects; DESC user_objects; -- data dictionary view 내가 가진 객체를 보여주는 뷰 -- all 은 내가 가지진 않았지만 볼 수 있는 객체를 보여주는 뷰 -- dba는 없다고 뜬다. 왜냐하면 dba를 볼 수 있는건 dba나 sys정도 되야하기 때문이다. -- 참고 레퍼런스 : https://docs.oracle.com/cloud/latest/db112/REFRN/statviews_1158.htm#REFRN20146SELECT * FROM user_objects; DESC user_tables; -- 주로 복수형이다. --USER_TABLES describes th..
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111-- 날짜 연산ALTER SESSION SET NLS_DATE_FORMAT = 'DD-MON-RR HH:MI:SS [AM]'; SELECT SYSDATE - DATE '2001-04-13'FROM dual; SELECT SYSDATE,SYSDATE+1FROM dual; SELECT SYSDATE,SYSDATE..
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970--단일행 함수 계속SELECT 'SSESS',LTRIM('SSESS','S'),RTRIM('SSESS','S'),TRIM('S' FROM 'SSESS')FROM dual; SELECT 'SSESS', LTRIM('SSESS','S'),RTRIM('SSESS','S'),LTRIM(RTRIM('SSESS','S'),'S')FROM dual; SELECT 'SSESS', TRIM(LEADING 'S' FROM 'SSESS') , TRIM(TRAILING 'S' FROM 'SSE..
SELECT(재료집합-테이블로부터)원하는 결과집합을 정의/요청/기술하는 문장in oracle) select, from은 필수적으로 있어야 함. Realational관계형Relation -> Table: 데이터가 담긴 구조인 "집합"을 의미한다. 데이터베이션 "이론"에 쓰이는 말로. 이를 데이터베이스로 구현하면 "테이블"이 된다. cf: 데이터 모델에서는 엔티티구조적 데이터 Relationship => 참조제약조건, 외래키제약조건 데이터의 형태에 따라...구조적 데이터 : 속성에 따라 분류할 수 있음. 반구조적 데이터비구조적(비정형) 데이터 (빅데이터의 특징.. 양이 엄청 많고 그 데이터가 체계적으로 잡혀있거나 그렇지 않거나 단시간에 발생하고 다양하고) 1 = row2 = 중복을 허용하지 않는column ..
in 오라클 서버) 오라클 메모리 공간을 용도에 따라 쪼개서 블락구조로 관리. 데이터가 저장되는 곳 -> 버퍼캐시 shared pool이라는 공간에서 중요한 곳-> Library Cache 최초로 시행되는 문장은 hard parse를 거치면서 컴퓨터 자원을 많이 씀 그 다음에도 똑같은 문장이 수행되면 shared pool에서 먼저 찾아보고 정보가 들어있으면 바로 실행한다.(Soft Parse) SQL문장 많으면 -> 찾는 시간이 오래 걸린다. 매번 shared pool에서 찾는것보다 hard pool하는게 낫지않을까? => 아니다. shared pool은 해쉬함수를 이용하기 때문에 빨리 찾을 수 있다.
SQL 패러다임 * 기존의 프로그래밍은 대부분 Imperative(명령적)이다. -방법론에 관심- Tools- Building - 기능을 구현해야 함 *SQL은 Declarative하다.- 내가 뭘 하고 싶은가에 관심- 세탁기:DB, 매뉴얼:sql에 비유할 수 있다.- 기능이 이미 갖춰짐 * 기능이 이미 갖춰져 있음- 데이터 삽입, 변경, 삭제, 검색- 데이터베이스 및 데이터베이스 객체 생성, 변경, 삭제 * RDBMS에게 요청 혹은 명령을 내리기만 하면 됨- 사용자의 요청/명령을 CPU가 이해할 수 있는 명령으로 변경- 옵티마이저 * 수많은 기능에 대한 SQL 명령과 수많은 옵션을 익혀야..
use pnudb; # pnudb를 사용하겠다.select count(*) from gisa1; # gisa1의 개수를 count한값을 보인다. create table test( # test 테이블을 작성한다. id varchar(20) not null, pw varchar(8) not null, user_name varchar(30) not null # 마지막은 ','를 찍지않는다.); select * from test; # test 테이블을 보여라!desc test; # test테이블의 field type null default 등을 보여준다.(id / varchar(20) /NO/NULL) insert into test(id,pw,user_name) values ('admin','1234','kim..
데이터베이스 관계형 데이터베이스에서 데이터를 저장하는 방식은? 테이블 데이터 저장 대상? 엔티티(의 속성) (1개 이상의 내용으로 구성)ex)탁자 - 가로 ,세로 ,높이 ,철과 나무속성(attribute)'ㅁ' 하나가 속성. 속성들의 합(한줄로 묶어서) => 레코드ㅁㅁㅁㅁㅁㅁㅁㅁㅁ레코드가 100개면 100명의 정보가 있다는 의미. 하나의 엔티티에 하나의 데이터 타입이 들어가는게 기본 데이터셋서로 다른 사람이 A라는걸 볼때 속성이 다름. 설계자나 요구자에 따라 다른 데이터.. 스키마란? 데이터를 저장하는 형식에 관련된 내용데이터를 저장하는 형식과 관련. --------------------------------------------------> row(행)ㅣㅣㅣㅣㅣㅣㅣㅣ(열,column) 배열을 이용할 때..