타겟의 카테고리 여부 확인하기
> target
[1] "rain_tomorrow"
> ds[[target]]
[1] Yes Yes Yes Yes No No No No Yes No No No No No No No Yes No
[19] No No No Yes No No No No No No No Yes Yes No Yes No No No
[37] Yes No No No No No No No Yes Yes No No Yes Yes Yes Yes No Yes
[55] No No Yes No No No No No No No No No No No No No No No
[73] Yes No No No Yes No Yes Yes No No No No No No No No No No
[91] Yes Yes No No Yes Yes No No Yes No No No Yes Yes No No No No
[109] No No No Yes Yes No No No No No No Yes No No No No No No
[127] No Yes No No No No No No No No No No No No No No No No
[145] Yes Yes No No No No No No No Yes No No No No No No No No
[163] No Yes Yes No No No No No No No No No No No No No Yes No
[181] No No No No No No No No No No No No No No No No Yes No
[199] No No No No No No No No Yes Yes No No No No No No No Yes
[217] No No No No No Yes Yes No No No No No No No No Yes No No
[235] No No No No No No No No Yes No No No No No No Yes No No
[253] Yes No No No No No No No Yes No Yes No No No No No No Yes
[271] No No No No Yes No No No Yes No Yes No No No No No No No
[289] No No No No No No No No No No No No No No No Yes Yes No
[307] No No No No No No No No No No No Yes Yes Yes No No No No
[325] No No Yes No No No No No No No No No No Yes Yes No Yes No
[343] No No No No No Yes No No No No No No No No No No No No
[361] No No No No No No
Levels: No Yes
> as.factor(ds[[target]]) // factor는 범주형 변수로, 여러 개의 레벨로 구성됨
[1] Yes Yes Yes Yes No No No No Yes No No No No No No No Yes No
[19] No No No Yes No No No No No No No Yes Yes No Yes No No No
[37] Yes No No No No No No No Yes Yes No No Yes Yes Yes Yes No Yes
[55] No No Yes No No No No No No No No No No No No No No No
[73] Yes No No No Yes No Yes Yes No No No No No No No No No No
[91] Yes Yes No No Yes Yes No No Yes No No No Yes Yes No No No No
[109] No No No Yes Yes No No No No No No Yes No No No No No No
[127] No Yes No No No No No No No No No No No No No No No No
[145] Yes Yes No No No No No No No Yes No No No No No No No No
[163] No Yes Yes No No No No No No No No No No No No No Yes No
[181] No No No No No No No No No No No No No No No No Yes No
[199] No No No No No No No No Yes Yes No No No No No No No Yes
[217] No No No No No Yes Yes No No No No No No No No Yes No No
[235] No No No No No No No No Yes No No No No No No Yes No No
[253] Yes No No No No No No No Yes No Yes No No No No No No Yes
[271] No No No No Yes No No No Yes No Yes No No No No No No No
[289] No No No No No No No No No No No No No No No Yes Yes No
[307] No No No No No No No No No No No Yes Yes Yes No No No No
[325] No No Yes No No No No No No No No No No Yes Yes No Yes No
[343] No No No No No Yes No No No No No No No No No No No No
[361] No No No No No No
Levels: No Yes
> ds[target] <- as.factor(ds[[target]])
> table(ds[target])
No Yes
300 66
타겟값의 분포를 ggplot2 를 이용하여 시각화해보자.
> library(ggplot2)
> p <- ggplot(ds, aes_string(x=target))
> p <- p + geom_bar(width=0.2)
>
'프로그래밍 Programming' 카테고리의 다른 글
Data Preparation (17) - Prepare (Variables) (0) | 2014.12.06 |
---|---|
Data Preparation (10) - Clean (Identify Correlated Variables) (0) | 2014.12.06 |
Data Preparation (15) - Clean (Normalise Factors) (0) | 2014.12.06 |
Data Preparation (14) - Clean (Omitting Observations) (0) | 2014.12.06 |
Data Preparation (13) - Clean (Deal with Missing Values) (0) | 2014.12.06 |