달력

08

« 2018/08 »

  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  
2016.11.17 14:34

R 스터디 - 기본 I.lib()/I.lib(etc)2016.11.17 14:34

.. .. ..

setwd("D:\\Program Files\\R\\workDir")

getwd()


1. 숫자 변환 : as.numeric('')


2. ' , " 모두 동일하게 인식


3. 알은 날짜도 글자로 인식(class('2016-06-06'))


4. NA : 잘못된 값


5. NULL : 값이 없을 경우

 - na.rm=TRUE   #NA 값을 포함한 모든 값의 합 구하기


6. Factor 형 (요소) - 빈도 분석시 사용


7. summary(xxx) = 요약 함수

 factor = hash 동일 개념 ==> Key 값으로 데이터 관리.

 - summary(as.factor(address))


8. as.POSIXct('2001-01-01') ==> 문자를 날짜로 변환.

 - 졸 불편해. 그래서 R의 헤들리 위켐이라는 영국아재가 패키지 무쟈게 만드렁 배포함.

   날짜를 쉽게 쓰게하는 lubridate 패키지 만듬 짱좋음.


9. lubridate 패키지

 -  year(date) #년도만 출력

 - month(date,label=T) # 월을 출력하되 영문 이름으로 출력

 - month(date,label=F) # 월을 출력하되 숫자로 출력

 - day(date  #일 출력

 - wday(date,label=T) #요일을 출력하되 영문 이름 출력

 - ......


10. var = '11' , var

 - 서로 다른 형태의 변수 선언시 String 으로 모두 변환한다.


11. var = 1:5 는 1,2,3,4,5 가 저장된다. 숫자만 된다.


12. 날짜 함수 as.Data 로 사용해라.


13. 생성한 변수 확인 방법 : objects()


14. 벡터형 (Vector)

 - c(1,2,3,4,5)

 - 벡터 내 인수는 모두 동일해야한다.

 - vac = c(1,2,3,4,5) , 

   vac[3] 3번째만 , 

   vac[-3] 3만 빼고,

   vac(vac,7) 벡터에 새로운 내용 추가

 - 데이터 형이 다른 벡터의 합은 union(var1 , var3)

 - 차집합 : setdiff(var1, var2) var1에는 있는데 var2 에는 없는 요소

 - 교집합 : intersect(var1, var2) 두개 공통으로 있는값

 - 자동증가 벡터 : seq(1,5) => 1,2,3,4,5     , seq (2,-2) => 2,1,0,-1,-2 , seq(1,10,2) 2씩증가하여 10까지

 - 벡터 반복 : rep(1:3,2) ==> 123123 , rep(1:3,each=2=) ==> 112233

 - 벡터 길이 : length(var1)

 - 있나없나 확인 : 3 %in% var7 ==> var7  에서 3있니?? TRUE 리턴


14. 행렬 형 : Matrix()

 - 그래프 그릴때 기초.

 - mat1 = matrix(c(1,2,3,4))

 - mat2 = matrix(c(1,2,3,4), nrow=2     1,3,  2,4

 - mat3 = matrix(c(1,2,3,4), nrow=2, byrow=T)   1 , 2   3,4

 - 출력 : mat3[,1] 모든행 1열만 , mat3[1,] 모든열의 1행만 , mat3[1,1] 1,1 만


15. 배열 : Array


16. 데이터 프레임 (중요!!) 


17. 파일 이름 확인하기. : list.files() , list.files(recursive=T) ==> 하위 디렉토리까지 모두


18. 텍스트 파일 읽어 배열 저장 :  

 - scan = scan("test.txt") , 

 - scan = scan("scan_2.txt",what="")  , 

 - scan = scan() 은 사용자 입력받는것

 - scan = scan(,what="") 문자를 입력할때 사용


19 .파일 읽어 배열 담기

 - input1 = readLine("readfile.exe")


20. 테이블로 파일 읽어오기 read.table()

 - fruits = read.table("file.txt")

 - fruits2 = read.table("fruits.txt",header=T)

 - fruits3 = read.table("인물.txt",skip=5, nrow=3)

 - fruits4 = read.table("fruits.txt",header=T , sep=",")


21. 구분이 , 로되어있으면 csv 함수 사용

 - fruit3 = read.csv("csv파일 읽기.txt")


22. read.csv.sql() 명령 - 원하는 데이터를 SQL 쿼리로 불러 오기

 - install.packages("googleVis")

-library(googleVis)

-install.packages("sqldf")

-library(sqldf)

-Fruits

 - 사용은

  - write.csv(Fruits, "Fruits_sql.csv" ,quote = F , row.names = F)

  - fruits_2 = read.csv.sql("Fruits_sql.csv" , sql="SELECT * FROM DUAL")

  - fruits


23. 엑셀 파일 읽기

 - install.packages("readxl")

 - library(readxl)

 - data1 = read_excel("파일명", sheet=1 , col_names=TRUE , col_types = NULL , na = "" , skip = 0)


24. 파일로 저장

 - write(txt1 , "write.txt")

 - writeLines(txt1 , "text.txt")

 - write.table(txt2, "textt.txt")

.
Posted by .07274.

댓글을 달아 주세요