Season 1 아카이브/프로그래밍
Data Preparation (6) - Review (Variable Roles)
크립토갈루아
2014. 11. 29. 11:44
이제 데이터세트내의 각각의 변수의 역할에 대한 정의가 필요하다.
1) "date"는 변수로 부적합(차라리 계절이라면 낫겠다)
2) "location"은 상수이므로 여기서 삭제
3) "risk"는 타겟 변수에 관한 관찰의 중요도나 위험의 합을 나타냄으로 아웃풋 변수임
> (vars <- names(ds))
[1] "date" "location" "min_temp" "max_temp"
[5] "rainfall" "evaporation" "sunshine" "wind_gust_dir"
[9] "wind_gust_speed" "wind_dir_9am" "wind_dir_3pm" "wind_speed_9am"
[13] "wind_speed_3pm" "humidity_9am" "humidity_3pm" "pressure_9am"
[17] "pressure_3pm" "cloud_9am" "cloud_3pm" "temp_9am"
[21] "temp_3pm" "rain_today" "risk_mm" "rain_tomorrow"
> target <- "rain_tomorrow"
> risk <- "risk_mm"
> id <- c("date", "location")
728x90