BIGDATA
데이터 다루기 2 [ 실제 데이터 ] 실습은 알까기2 를 바탕으로 하였습니다. 1. hflightinstall.packages("hflights")library("hflights") hflightsstr(hflights)head(hflights)names(hflights) # Year Month DayofMonth DayOfWeek DepTime ArrTime UniqueCarrier FlightNum TailNum ActualElapsedTime# 5424 2011 1 1 6 1400 1500 AA 428 N576AA 60# 5425 2011 1 2 7 1401 1501 AA 428 N557AA 60# 5426 2011 1 3 1 1352 1502 AA 428 N541AA 70# 5427 2011 1 ..
########################### 명목형 변수 도수분포표 만들기 ########################################################################################################## Freq
데이터 다루기 [알까기 2의 내용 정리] * 실습 데이터는 알까기2에서 제공된 데이터 입니다. DF
R에서 외부데이터 호출할때. CSVresd.csv해당 파일에 변수열이 있다면 read.csv(FILE, header=T) 없다면 또는 가지고 오고 싶지 않다면 read.csv(FILE,header=F) 사용.디폴트 속성은 header=T이다.TXTread.tableCSV와 마찬가지고 Header 설정에 따라 T/F 지정하면 된다.디폴트 속성은 header=F이다.기분하는 구분자가 있다면 read.table(FILE,hearder, sep="기분기호") 로 표현하면 된다EXCELinstall.packages("readxl") #패키지read_excel(path="File", sheet="", col_names="T/F")XMLinstall.packages("XML")DocFromXML
R 설치 및 기초 [ 작성 중 ] R은 오픈소스 기반의 사용자 라이브러리들로 구성된 통계 전용 언어이다. 1. R 설치 - https://www.r-project.org/ 에서 설치 2. R-Studio 설치R을 그냥 사용하여도 되지만 코드가 긴 것을 사용하거나 스크립트 형태로 사용하는데 어려움이 있어 R-Studio라는 R전용프로그램을 사용하는 것이 더욱 편하다. - https://www.rstudio.com/products/rstudio/#Desktop 3. 기초 R의 최소 단위는 벡터라고 한다. - 벡터는 정수(10), 실수(1.34), 문자('A'), 문자열('Hello') 와 같은 단위를 스칼라 라고하는데 이러한 것들을 여러개 묶은 것을 벡터라고 한다. 다시 말해 스칼라 또한 벡터인데 1개라는 ..
1. USER 생성 및 수정. CREATE USER scott IDENTIFIED BY TEST; ALTER USER scott IDENTIFIED BY lion; DROP USER scott [CASECADE] -- CASECADE를 사용할 경우 사용자 이름과 관련된 모든 데이터베이스 스키마가 삭제된다. 2. 데이터 타입.CHAR 타입 고정길이 문자형, 최대 길이 : 2000 바이트, 변수값이 길이가 s보다 작을 경우에는 그 차이 길이 만큼 공간으로 채워진다. VARCHAR2 타입 가변길이 문자형 데이터 타입최대 길이 : 2000 바이트(반드시 길이 지정)다른 타입에 비해 제한이 적다일부만 입력시 뒷부분은 NULL입력한 값의 뒷부분에 있는 BLANK도 같이 입력전혀 값을 주지 않으면 NULL 상태 입력..
Database동시에 여러사람들이 정보를 공유하고 사용할 목적으로 만든 집합체파일을 조직적으로 통합하여 자료 항목의 중복을 없애고 구조화 한 것.과거프로그램 1개당 데이터 파일 1개 형태로 존재.데이터가 갱신될 때마다 프로그램을 변경하거나 갱신해야하는 단점 발생.데이터 파일 형태로 존재하여 데이터를 관리하는데 불편함이 많음.현재 다수의 프로그램이 하나의 데이터 베이스를 사용하여 데이터의 변화에도 프로그램을 수정할 필요가 없음.다수의 유저가 사용하더라도 동일한 데이터를 가지고 사용할 수 있어 동시성이 좋음.데이터 관리가 용이함.RDB(Relational Database Management System ) = RDBMS관계형 데이터 베이스.관계를 기반으로 한 DB 개체의 내부 관계가 아닌 외부의 관계를 적용..
1. Oracle 11g를 설치 후 Scott 계정만 존재하고 데이터가 없을 경우나 Scott 계정이 존재하지 않을 경우가 있다. -- Scott 계정 생성 및 DBA 권한 부여.CREATE USER scott IDENTIFIED BY tiger; GRANT DBA TO scott; 2. 앞으로 진행 될 실습과 정리에 사용 될 데이터이다. DROP TABLE EMP;DROP TABLE DEPT;DROP TABLE BONUS;DROP TABLE SALGRADE;DROP TABLE DUMMY; CREATE TABLE EMP (EMPNO NUMBER(4) NOT NULL, ENAME VARCHAR2(10), JOB VARCHAR2(9), MGR NUMBER(4), HIREDATE DATE, SAL NUMBER..