갈루아의 반서재

R에서 히스토그램을 만들때는 hist() 명령어를 이용한다.

 

> hist(proteinconc[,1], main = colnames(proteinconc)[1], xlab ="Concentration")

 

 

 


plot() 명령어에서 쓸 수 있는 파라메터의 대부분은 hist() 에서도 활용가능하다. 위에서 보듯이 "main", colnames(), "xlab" 과 같이 말이다. 하지만 hist() 자체가 가지고 있는 특별한 파라메터들도 있다. 다음을 보자.


> par(mfrow=c(1,2), cex=.75)
> hist(proteinconc[,1], breaks = 50)
> hist(proteinconc[,1], breaks = c(0, .5, .7, .8, .9, 1)) 

 

 

파라메터 "breaks"를 두 가지 방식으로 사용했는데, 첫번째는 상수를 입력하여 고정시키는 방법이고, 두번째는 각각 원하는 만큼 지정해주는 방식이다. 위의 예에서 breaks = 50 이라는 의미는 막대의 갯수가 50개라는 뜻이고, breaks = c(0, .5, .7, .8, .9, 1) 는 () 안에서 보듯이x축의 범위가 0~1 이며, 막대 각각의 크기가 0.5, 0.2, 0.1, 0.1, 0.1 이라는 의미다. 참고로 아래 2개의 히스토그램을 비교해보면 위의 의미가 더욱 분명해질 것이다.

 

> hist(proteinconc[,1], breaks = c(0, .5, .7, .8, .9,1))
> hist(proteinconc[,1], breaks = c(0, .5, .7, .8, .9,2))

 

 

 

마지막으로 볼 것은 y축을 frequency 로 할 것이냐 density 로 할 것인가를 설정하는 옵션이다. 아래와 같이 freq=F 로 값을 주면 y축을 frequency가 아닌 density 로 설정한다.

 

> hist(proteinconc[,1], breaks = 50)
> hist(proteinconc[,1], breaks = 50, freq=F)