갈루아의 반서재

Normalise Variable Names 

모든 변수를 소문자로 놓고 진행하는 것이 유용한 경우도 있다. 하지만 R은 대소문자를 구별하는 프로그램이다. ncm_tax_PyBl 와 같이 서로 다른 대소문자가 섞여 있는 경우, 그리고 1,000개가 넘는 변수들의 표기를 일일이 기억할 수 없을 때 모든 변수 이름을 정돈할 필요성이 있다. 특히 대소문자를 구별하지 않는 데이터베이스에서 위와 같은 형태의 변수를 종종 발견할 수 있다. 이 경우 rattle 의 normVarNames() 을 이용하여 데이터세트의 변수들을 표준 형태로 변환시킬 수 있다. 아래 예제를 보자.


> names(ds)

 [1] "Date"          "Location"      "MinTemp"       "MaxTemp"      

 [5] "Rainfall"      "Evaporation"   "Sunshine"      "WindGustDir"  

 [9] "WindGustSpeed" "WindDir9am"    "WindDir3pm"    "WindSpeed9am" 

[13] "WindSpeed3pm"  "Humidity9am"   "Humidity3pm"   "Pressure9am"  

[17] "Pressure3pm"   "Cloud9am"      "Cloud3pm"      "Temp9am"      

[21] "Temp3pm"       "RainToday"     "RISK_MM"       "RainTomorrow" 

> names(ds) <- normVarNames(names(ds))

> names(ds)

 [1] "date"            "location"        "min_temp"        "max_temp"       // 깔끔하게 정리되었다.

 [5] "rainfall"        "evaporation"     "sunshine"        "wind_gust_dir"  

 [9] "wind_gust_speed" "wind_dir_9am"    "wind_dir_3pm"    "wind_speed_9am" 

[13] "wind_speed_3pm"  "humidity_9am"    "humidity_3pm"    "pressure_9am"   

[17] "pressure_3pm"    "cloud_9am"       "cloud_3pm"       "temp_9am"       

[21] "temp_3pm"        "rain_today"      "risk_mm"         "rain_tomorrow"