프로그래밍 Programming
Data Preparation (6) - Review (Variable Roles)
문장전달자
2014. 11. 29. 11:44
728x90
이제 데이터세트내의 각각의 변수의 역할에 대한 정의가 필요하다.
1) "date"는 변수로 부적합(차라리 계절이라면 낫겠다)
2) "location"은 상수이므로 여기서 삭제
3) "risk"는 타겟 변수에 관한 관찰의 중요도나 위험의 합을 나타냄으로 아웃풋 변수임
> (vars <- names(ds))
[1] "date" "location" "min_temp" "max_temp"
[5] "rainfall" "evaporation" "sunshine" "wind_gust_dir"
[9] "wind_gust_speed" "wind_dir_9am" "wind_dir_3pm" "wind_speed_9am"
[13] "wind_speed_3pm" "humidity_9am" "humidity_3pm" "pressure_9am"
[17] "pressure_3pm" "cloud_9am" "cloud_3pm" "temp_9am"
[21] "temp_3pm" "rain_today" "risk_mm" "rain_tomorrow"
> target <- "rain_tomorrow"
> risk <- "risk_mm"
> id <- c("date", "location")
728x90