Data Preparation (16) - Clean (Ensure Target is Categoric)
타겟의 카테고리 여부 확인하기
> target
[1] "rain_tomorrow"
> ds[[target]]
[1] Yes Yes Yes Yes No No No No Yes No No No No No No No Yes No
[19] No No No Yes No No No No No No No Yes Yes No Yes No No No
[37] Yes No No No No No No No Yes Yes No No Yes Yes Yes Yes No Yes
[55] No No Yes No No No No No No No No No No No No No No No
[73] Yes No No No Yes No Yes Yes No No No No No No No No No No
[91] Yes Yes No No Yes Yes No No Yes No No No Yes Yes No No No No
[109] No No No Yes Yes No No No No No No Yes No No No No No No
[127] No Yes No No No No No No No No No No No No No No No No
[145] Yes Yes No No No No No No No Yes No No No No No No No No
[163] No Yes Yes No No No No No No No No No No No No No Yes No
[181] No No No No No No No No No No No No No No No No Yes No
[199] No No No No No No No No Yes Yes No No No No No No No Yes
[217] No No No No No Yes Yes No No No No No No No No Yes No No
[235] No No No No No No No No Yes No No No No No No Yes No No
[253] Yes No No No No No No No Yes No Yes No No No No No No Yes
[271] No No No No Yes No No No Yes No Yes No No No No No No No
[289] No No No No No No No No No No No No No No No Yes Yes No
[307] No No No No No No No No No No No Yes Yes Yes No No No No
[325] No No Yes No No No No No No No No No No Yes Yes No Yes No
[343] No No No No No Yes No No No No No No No No No No No No
[361] No No No No No No
Levels: No Yes
> as.factor(ds[[target]]) // factor는 범주형 변수로, 여러 개의 레벨로 구성됨
[1] Yes Yes Yes Yes No No No No Yes No No No No No No No Yes No
[19] No No No Yes No No No No No No No Yes Yes No Yes No No No
[37] Yes No No No No No No No Yes Yes No No Yes Yes Yes Yes No Yes
[55] No No Yes No No No No No No No No No No No No No No No
[73] Yes No No No Yes No Yes Yes No No No No No No No No No No
[91] Yes Yes No No Yes Yes No No Yes No No No Yes Yes No No No No
[109] No No No Yes Yes No No No No No No Yes No No No No No No
[127] No Yes No No No No No No No No No No No No No No No No
[145] Yes Yes No No No No No No No Yes No No No No No No No No
[163] No Yes Yes No No No No No No No No No No No No No Yes No
[181] No No No No No No No No No No No No No No No No Yes No
[199] No No No No No No No No Yes Yes No No No No No No No Yes
[217] No No No No No Yes Yes No No No No No No No No Yes No No
[235] No No No No No No No No Yes No No No No No No Yes No No
[253] Yes No No No No No No No Yes No Yes No No No No No No Yes
[271] No No No No Yes No No No Yes No Yes No No No No No No No
[289] No No No No No No No No No No No No No No No Yes Yes No
[307] No No No No No No No No No No No Yes Yes Yes No No No No
[325] No No Yes No No No No No No No No No No Yes Yes No Yes No
[343] No No No No No Yes No No No No No No No No No No No No
[361] No No No No No No
Levels: No Yes
> ds[target] <- as.factor(ds[[target]])
> table(ds[target])
No Yes
300 66
타겟값의 분포를 ggplot2 를 이용하여 시각화해보자.
> library(ggplot2)
> p <- ggplot(ds, aes_string(x=target))
> p <- p + geom_bar(width=0.2)
>