R 스터디 - 함수
1. 기본 중요 함수
- aggregate( ) 다양한 함수를 사용하여 계산결과를 출력함
- apply( ) 다양한 기능이 있어서 아래 예를 참고하세요
- cor( ) 상관함수
- cumsum( ) 설정된 지점까지의 누적합
- cumprom( ) 설정된 지점까지의 누적곱
- diff( ) 차이 나는 부분을 찾아냄
- length( ) 요소갯수를 구해서 출력함
- max( ) 최대값을 출력함
- min( ) 최소값을 출력함
- mean( ) 평균값을 출력함
- median( ) 가운데값을 출력함
- order( ) 각 요소의 원래 위치
- prod( ) 누적곱을 출력함
- sd() 표준편차
- var() 분산
- sum() 합계
-
2. 상세
- 데이터 프레임 상대로 주어진 함수 값 구하기 : aggregate()
- 문법 : aggregate(계산될 컬럼~기준될컬럼, 데이터, 함수
- install.packages("googleVis")
- library(googleVis)
- aggregate(Sales~Year,Fruits,sum) <-- Year별로 Sales 값을 sum 하라!
- 다양한 함수 apply()
- 문법 : apply(data 행/열 , 작업함수) (행 = 1 ,열 =2)
- 변종
- lapply(c(list1, list2) , max) --> list 와 list2 값을 구해서 각각의 가장큰 값을 출력
- sapply(c(list1, list2) , max) --> list1와 list2 값을 구해서 가장 큰값을 한번에 출력
- tapply(출력값 기준컬럼, 적용함수)
- tapply(Fruits$Sales ,Fruits$Fruit,sum)
- attach(Fruits) 명령어를 줄 경우
tapply(Sales ,Fruit,sum) 로도 원하는 결과 값 추출 가능.
3. 정리
[ aggregate( ) 함수와 apply( ) 계열 함수 정리 ]
특정 컬럼이나 행을 기준으로 연산 작업을 한다 ==> apply( ) 계열 함수
특정 값을 기준으로 집계한 후 연산 작업을 한다 ==> aggregate( ) 계열 함수
[ apply( ) 계열 함수 정리 ]
연산 결과를 리스트별로 따로 보여준다 ==> lapply( )함수
연산 결과를 요약해서 보여준다 ==> sapply( )함수
연산 결과를 가로로 펴서 보여준다 ==>tapply( )함수