프로그래밍 Programming
Data Preparation (13) - Clean (Deal with Missing Values)
문장전달자
2014. 12. 6. 11:00
728x90
결측값에 대해 새로운 가치를 매기는(impute) 작업
> ods <- ds
> dim(ds[vars])
## [1] 366 18
> sum(is.na(ds[vars]))
## [1] 47 // 결측값(missing value)가 47개
> ds[vars] <- na.roughfix(ds[vars]) // library(randomForest) : 결측값을 중앙값(median)이나 최빈값(mode)로 대체
> sum(is.na(ds[vars]))
## [1] 0 // NA가 0이 되었음
> dim(ds[vars])
## [1] 366 18
> ds <- ods //원복
728x90