median
Data Preparation (13) - Clean (Deal with Missing Values)
Data Preparation (13) - Clean (Deal with Missing Values)
2014. 12. 6.결측값에 대해 새로운 가치를 매기는(impute) 작업 > ods dim(ds[vars])## [1] 366 18> sum(is.na(ds[vars]))## [1] 47 // 결측값(missing value)가 47개> ds[vars] sum(is.na(ds[vars]))## [1] 0 // NA가 0이 되었음> dim(ds[vars])## [1] 366 18> ds
R 프로그래밍 - Plotting Data : Box Plots
R 프로그래밍 - Plotting Data : Box Plots
2014. 8. 16.Box Plots은 이상치(outlier)를 비롯하여 4분위를 이용해 값들의 분포 양상을 보여준다. 생성은 boxplot() 명령어로 한다. > par(cex = .6) > boxplot(proteinconc) cex : 좌표내 텍스트의 크기 값 설정하는 옵션 전체를 4등분하여 박스 아랫값은 25% 지점을, 가운데 진한 검정라인은 50% 지점을, 그리고 박스 상단은 75% 지점을 나타낸다. 그리고 IQR(Interquartile Range) = Upper Quartile - Lower Quartile 를 나타낸다. Whiskers는 Lower Quartile - 이상치를 제외한 최소값 또는 이상치를 제외한 최대값 - Upper Quartile 를 나타낸다. Outliers(이상치, 극단치) 는 그림에서 ..