R에서 외부데이터 호출할때.
CSV
- resd.csv
- 해당 파일에 변수열이 있다면 read.csv(FILE, header=T) 없다면 또는 가지고 오고 싶지 않다면 read.csv(FILE,header=F) 사용.
- 디폴트 속성은 header=T이다.
TXT
- read.table
- CSV와 마찬가지고 Header 설정에 따라 T/F 지정하면 된다.
- 디폴트 속성은 header=F이다.
- 기분하는 구분자가 있다면 read.table(FILE,hearder, sep="기분기호") 로 표현하면 된다
EXCEL
- install.packages("readxl") #패키지
- read_excel(path="File", sheet="", col_names="T/F")
XML
- install.packages("XML")
- DocFromXML <- xmlTreeParse("FILE",useInernal="T")
- 필요한 컨텐츠만 빼오기 위해서 xmlRoot()를 사용.
- RootNode <- xmlRoot(DocFromXML)
- 해당 노드 값들을 가지고 오는 방법
- Names <- xpathSApply(RootNode,"//name",xmlValue) #name이라는 태그 Value를 가지고 오는 방법.
HTML
- XML package의 readHTMLTable()을 이용. #table데이터를 가지고 온다.
'BIGDATA > R' 카테고리의 다른 글
#06. 특강1. [ 경영통계 데이터 요약 및 정리 ] (0) | 2016.07.03 |
---|---|
#05. 데이터 다루기 2 [ 실제 데이터 ] (0) | 2016.06.30 |
#04. 도수분포 [ 연속, 명목 ] (0) | 2016.06.30 |
#03. 데이터 다루기. (0) | 2016.06.27 |
#01. 기초 (0) | 2016.06.26 |