Normalise Variable Names
모든 변수를 소문자로 놓고 진행하는 것이 유용한 경우도 있다. 하지만 R은 대소문자를 구별하는 프로그램이다. ncm_tax_PyBl 와 같이 서로 다른 대소문자가 섞여 있는 경우, 그리고 1,000개가 넘는 변수들의 표기를 일일이 기억할 수 없을 때 모든 변수 이름을 정돈할 필요성이 있다. 특히 대소문자를 구별하지 않는 데이터베이스에서 위와 같은 형태의 변수를 종종 발견할 수 있다. 이 경우 rattle 의 normVarNames() 을 이용하여 데이터세트의 변수들을 표준 형태로 변환시킬 수 있다. 아래 예제를 보자.
> names(ds)
[1] "Date" "Location" "MinTemp" "MaxTemp"
[5] "Rainfall" "Evaporation" "Sunshine" "WindGustDir"
[9] "WindGustSpeed" "WindDir9am" "WindDir3pm" "WindSpeed9am"
[13] "WindSpeed3pm" "Humidity9am" "Humidity3pm" "Pressure9am"
[17] "Pressure3pm" "Cloud9am" "Cloud3pm" "Temp9am"
[21] "Temp3pm" "RainToday" "RISK_MM" "RainTomorrow"
> names(ds) <- normVarNames(names(ds))
> names(ds)
[1] "date" "location" "min_temp" "max_temp" // 깔끔하게 정리되었다.
[5] "rainfall" "evaporation" "sunshine" "wind_gust_dir"
[9] "wind_gust_speed" "wind_dir_9am" "wind_dir_3pm" "wind_speed_9am"
[13] "wind_speed_3pm" "humidity_9am" "humidity_3pm" "pressure_9am"
[17] "pressure_3pm" "cloud_9am" "cloud_3pm" "temp_9am"
[21] "temp_3pm" "rain_today" "risk_mm" "rain_tomorrow"
>
'프로그래밍 Programming' 카테고리의 다른 글
Data Preparation (6) - Review (Variable Roles) (0) | 2014.11.29 |
---|---|
Data Preparation (5) - Review (Data Formats) (0) | 2014.11.28 |
Data Preparation (3) - Review (Observations, Structure, Summary) (0) | 2014.11.28 |
Data Preparation (2) - Table Data Frame (tbl_df) (0) | 2014.11.28 |
Data Preparation (1) - Load (Dataset, Generic Variables) (0) | 2014.11.28 |