Season 1 아카이브/프로그래밍
                
              Data Preparation (13) - Clean (Deal with Missing Values)
                문장전달자
                 2014. 12. 6. 11:00
              
              
                    
        728x90
    
    
  결측값에 대해 새로운 가치를 매기는(impute) 작업
> ods <- ds
> dim(ds[vars])
## [1] 366 18
> sum(is.na(ds[vars]))
## [1] 47 // 결측값(missing value)가 47개
> ds[vars] <- na.roughfix(ds[vars]) // library(randomForest) : 결측값을 중앙값(median)이나 최빈값(mode)로 대체
> sum(is.na(ds[vars]))
## [1] 0 // NA가 0이 되었음
> dim(ds[vars])
## [1] 366 18
> ds <- ods //원복
728x90