이경수 선생님의 수학실험실

R의 데이터 타입_요인(Factors) 본문

R

R의 데이터 타입_요인(Factors)

(이경수) 2021. 4. 14. 21:58

Factors는 범주형 데이터를 표현하는 데이터 타입으로써 levels이라고 하는 속성을 갖는다. level은 범주내 데이터들의 알파벳 순서에 따라 결정되며 1부터 시작하는 정수값이 차례대로 할당된다.

> x<-factor(c("red","blue","blue","red"))
> x
[1] red  blue blue red 
Levels: blue red
> table(x)
x
blue  red 
   2    2 
> unclass(x)
[1] 2 1 1 2
attr(,"levels")
[1] "blue" "red"

 

level을 임의로 지정해 주는 것도 가능하다. 

> x<-factor(c("red","blue","blue","red"),level=c("red","blue"))
> x
[1] red  blue blue red 
Levels: red blue
> unclass(x)
[1] 1 2 2 1
attr(,"levels")
[1] "red"  "blue"

 

범주형 데이터이지만 순서가 있는 경우에는 ( ex. easy, normal, hard ) ordered()함수를 이용하여 데이터의 순서를 정해 줄 수 있으며, factor를 정의할 때 ordered 값을 TRUE로 하는 인자를 넣어 줌으로써 순서를 가진 level을 만들 수 있다.

> ordered(c("easy","normal","hard"))
[1] easy   normal hard  
Levels: easy < hard < normal
> x<-factor(c("easy","normal","hard"),ordered=TRUE)
> x
[1] easy   normal hard  
Levels: easy < hard < normal

 

Comments