갈루아의 반서재

728x90

결측값에 대해 새로운 가치를 매기는(impute) 작업


ods <- ds

dim(ds[vars])

## [1] 366 18

sum(is.na(ds[vars]))

## [1] 47 // 결측값(missing value)가 47개

ds[vars] <- na.roughfix(ds[vars])  // library(randomForest) : 결측값을 중앙값(median)이나 최빈값(mode)로 대체

sum(is.na(ds[vars]))

## [1] 0 // NA가 0이 되었음

dim(ds[vars])

## [1] 366 18

ds <- ods  //원복

 

728x90