728x90
결측값에 대해 새로운 가치를 매기는(impute) 작업
> ods <- ds
> dim(ds[vars])
## [1] 366 18
> sum(is.na(ds[vars]))
## [1] 47 // 결측값(missing value)가 47개
> ds[vars] <- na.roughfix(ds[vars]) // library(randomForest) : 결측값을 중앙값(median)이나 최빈값(mode)로 대체
> sum(is.na(ds[vars]))
## [1] 0 // NA가 0이 되었음
> dim(ds[vars])
## [1] 366 18
> ds <- ods //원복
728x90
'프로그래밍 Programming' 카테고리의 다른 글
Data Preparation (15) - Clean (Normalise Factors) (0) | 2014.12.06 |
---|---|
Data Preparation (14) - Clean (Omitting Observations) (0) | 2014.12.06 |
Data Preparation (12) - Clean (Remove Missing Target) (0) | 2014.12.05 |
Data Preparation (11) - Clean (Feature Selection) (0) | 2014.12.05 |
Data Preparation (10) - Clean (Remove the Variables) (0) | 2014.12.05 |