이경수 선생님의 수학실험실

R의 데이터 타입_결측값(Missing Values) 본문

R

R의 데이터 타입_결측값(Missing Values)

(이경수) 2021. 4. 14. 22:10

NA : not available

NaN : not a number 

 

NA는 NA이지만 NaN은 아니다.

NaN은 NA이면서 NaN이다. 

> x<-c(1,2,NA)
> is.na(x)
[1] FALSE FALSE  TRUE
> is.nan(x)
[1] FALSE FALSE FALSE
> x<-c(1,NA,NaN)
> is.na(x)
[1] FALSE  TRUE  TRUE
> is.nan(x)
[1] FALSE FALSE  TRUE

 

아래 예에서 데이터 프레임 x의 [2, 2]와 [3, 3]은 NA이다. 다음은 NA를 처리하는 3가지 서로 다른 경우를 제시하고 있다. 우선, omit은 '생략하다'는 뜻의 단어로 함수 na.omit()은 NA가 있는 행은 생략하여 나타낸다. 그리고 na.pass()는 NA가 있는 행이어도 여과없이 나타내며, na.fail()은 NA가 적어도 하나가 포함되어 있으면 오류메시지를 통해 알려준다.

> x<-data.frame(A=c(10,20,30),B=c(5,NA,15),C=c(3,6,NA))
> x
   A  B  C
1 10  5  3
2 20 NA  6
3 30 15 NA
> na.omit(x)
   A B C
1 10 5 3
> na.pass(x)
   A  B  C
1 10  5  3
2 20 NA  6
3 30 15 NA
> na.fail(x)
Error in na.fail.default(x) : 객체안에 결측값들이 있습니다
Comments