달력

11

« 2024/11 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
2016. 11. 17. 15:55

R 스터디 - 함수 I.lib()/I.lib(etc)2016. 11. 17. 15:55

.. .. ..

1. 기본 중요 함수

 - aggregate( )  다양한 함수를 사용하여 계산결과를 출력함 

 - apply( ) 다양한 기능이 있어서 아래 예를 참고하세요 

 - cor( ) 상관함수 

 - cumsum( ) 설정된 지점까지의 누적합 

 - cumprom( ) 설정된 지점까지의 누적곱 

 - diff( ) 차이 나는 부분을 찾아냄 

 - length( )  요소갯수를 구해서 출력함 

 - max( )  최대값을 출력함 

 - min( )  최소값을 출력함 

 - mean( ) 평균값을 출력함 

 - median( ) 가운데값을 출력함 

 - order( )  각 요소의 원래 위치 

 - prod( ) 누적곱을 출력함 

 - sd()  표준편차

 - var() 분산

 - sum() 합계

 - 


2. 상세

 - 데이터 프레임 상대로 주어진 함수 값 구하기 : aggregate()

  - 문법 : aggregate(계산될 컬럼~기준될컬럼, 데이터, 함수

  - install.packages("googleVis")

  - library(googleVis)

  - aggregate(Sales~Year,Fruits,sum) <-- Year별로 Sales 값을 sum 하라! 


 - 다양한 함수 apply()

  - 문법 :  apply(data  행/열 , 작업함수)   (행 = 1 ,열 =2)

  - 변종

    - lapply(c(list1, list2) , max) --> list 와 list2 값을 구해서 각각의 가장큰 값을 출력

    - sapply(c(list1, list2) , max) --> list1와 list2 값을 구해서 가장 큰값을 한번에 출력

    - tapply(출력값  기준컬럼, 적용함수)

      - tapply(Fruits$Sales ,Fruits$Fruit,sum)

      - attach(Fruits) 명령어를 줄 경우

        tapply(Sales ,Fruit,sum) 로도 원하는 결과 값 추출 가능.


3. 정리

[ aggregate( ) 함수와 apply( ) 계열 함수 정리 ] 

특정 컬럼이나 행을 기준으로 연산 작업을 한다  ==> apply( ) 계열 함수 

특정 값을 기준으로 집계한 후 연산 작업을 한다  ==> aggregate( ) 계열 함수 


[ apply( ) 계열 함수 정리 ] 

연산 결과를 리스트별로 따로 보여준다  ==> lapply( )함수 

연산 결과를 요약해서 보여준다           ==> sapply( )함수 

연산 결과를 가로로 펴서 보여준다       ==>tapply( )함수 

.
:
Posted by .07274.