r
R 프로그래밍 - Plotting Data : Additions
2014. 8. 16.이번에는 기존 그래프에 선과 점을 추가하는 방법을 알아봅니다. 먼저 예제로 사용할 그래프를 하나 만든다 > plotvector3 = 1:9 > plotvector4 = c(1, 3, 6, 2, 7, 5, 5, 3, 1) > plot(plotvector3, plotvector4) 1. 선 그리기 점사이를 이을 때는 lines() 함수를 이용한다. > lines(plotvector3, plotvector4) 수직선이나 수평선을 긋고 싶을 때는 abline() 함수를 이용한다. > abline(coef = c(1, 1), v = 3, h = 5) coef : (절편, 기울기) 특정 v : x축 좌표와 교차하는 수직선 h : y축 좌표와 교차하는 수평선 2. 점 넣기 아래와 같이 point() 함수..
R 프로그래밍 - Plotting Data : Box Plots
2014. 8. 16.Box Plots은 이상치(outlier)를 비롯하여 4분위를 이용해 값들의 분포 양상을 보여준다. 생성은 boxplot() 명령어로 한다. > par(cex = .6) > boxplot(proteinconc) cex : 좌표내 텍스트의 크기 값 설정하는 옵션 전체를 4등분하여 박스 아랫값은 25% 지점을, 가운데 진한 검정라인은 50% 지점을, 그리고 박스 상단은 75% 지점을 나타낸다. 그리고 IQR(Interquartile Range) = Upper Quartile - Lower Quartile 를 나타낸다. Whiskers는 Lower Quartile - 이상치를 제외한 최소값 또는 이상치를 제외한 최대값 - Upper Quartile 를 나타낸다. Outliers(이상치, 극단치) 는 그림에서 ..
R 프로그래밍 - Plotting Data : Histograms
2014. 8. 14.R에서 히스토그램을 만들때는 hist() 명령어를 이용한다. > hist(proteinconc[,1], main = colnames(proteinconc)[1], xlab ="Concentration") plot() 명령어에서 쓸 수 있는 파라메터의 대부분은 hist() 에서도 활용가능하다. 위에서 보듯이 "main", colnames(), "xlab" 과 같이 말이다. 하지만 hist() 자체가 가지고 있는 특별한 파라메터들도 있다. 다음을 보자. > par(mfrow=c(1,2), cex=.75) > hist(proteinconc[,1], breaks = 50) > hist(proteinconc[,1], breaks = c(0, .5, .7, .8, .9, 1)) 파라메터 "breaks"를 두 가..
R 프로그래밍 - Plotting Data (좌표로 나타내기) : Dot plot(점도표)
2014. 8. 9.Dot plot(점도표)은 plot() 함수를 통해서 호출되는데, 같은 길이의 두 개의 벡터를 처리하고 좌표로 나타낸다. 첫 번째 벡터는 x축에, 두 번재 벡터는 y축에 대응된다. > plotvector1 = 1:9 > plot(plotvector1, plotvector1) 위의 명령을 실행하면 새로운 창이 뜨면서 도표가 표시되는데 이 창은 plotting window 이고 좌표가 표시되는 창이다. 만약 아래와 같이 새로운 명령을 실행하면 이전의 도표는 없어지고 새로운 도표로 대체된다. > plotvector2 = 9:1 > plot(plotvector1,plotvector2) 새로운 도표창을 여는 명령어는 다음과 같다. 아래 명령어를 실행하면 기존 창 옆에 R Graphics: Device 3 (ACT..
R 프로그래밍 - Reading in Data
2014. 8. 9.그럼 예제 파일을 가지고 시작해보자. R 프로그램의 working directory 는 다음의 명령어로 확인가능하다. > getwd() [1] "C:/Users/fukaeri/Documents" 작업 디렉토리 변경은 다음과 같이 한다. setwd() 명령어로는 새폴더를 생성할 수는 없다. 그러므로 해당 폴더가 없는 경우라면 먼저 폴더를 생성한 후 작업 디렉토리로 지정해야 한다. > setwd(C:/Users/myusername/Documents/My Other R Stuff) 본 예제에 필요한 파일을 아래 링크에서 다운로드한 후 다음과 같이 입력한다. http://sites.google.com/site/undergraduateguidetor/manual-files > proteinconc = read.c..
R 프로그래밍 - Data Types (Converting/Using)
2014. 8. 2.아래와 같은 방법으로 데이터 타입을 변경할 수 있다. > matrix4=as.matrix(c(1,2,3))> matrix4 [,1][1,] 1[2,] 2[3,] 3> class(matrix4)[1] "matrix"> vector7=as.numeric(matrix4)> vector7[1] 1 2 3> class(vector7)[1] "numeric"> 변환이 필요한 이유는 특정 함수는 특정 데이터 타입을 필요로 하기 때문이다.
R 프로그래밍 - Data Types (logical, vector, matrix, array, data.frame, list)
2014. 8. 2.1. logical True/False 값(Boolean values)을 포함하는 logical 클래스에 대해 알아보자. > logical1 = c(T,F,F)> logical1[1] TRUE FALSE FALSE> class(logical1)[1] "logical" 2. vector 데이터 타입으로서의 vector 는 수학의 벡터와는 다르게 정의된다. vector 타입은 일견 기존의 numeric, character, logical 과 중복된 것처럼 보일 수 있지만, vector 타입의 장점은 numeric, character, logical 모두를 포함할 수 있다는 것이다. > vector1 = vector(mode="logical",3)> vector1[1] FALSE FALSE FALSE 특정..
R 프로그래밍 - Data Types (numeric, integer, character)
2014. 8. 2.1. numeric 수를 입력하는 경우 기본적으로 numeric 으로 저장된다. > calc1 = 1 + 1> calc1[1] 2 변수의 데이터 타입을 알고자하는 경우 아래 class() 함수를 이용한다.> class(calc1)[1] "numeric" > numbers1 = c(1, 2, 3)> numbers1[1] 1 2 3> class(numbers1)[1] "numeric" 위의 예를 보면 하나의 수가 아니므로 벡터가 아닌가라는 생각이 들 것이다. 여기서 트릭은 c() 함수는 값들을 연결해주는 concatenate 함수이라는 점에 있다. 각각의 값이 numeric 이므로 그 값들을 결합한 1 2 3 역시 numeric 이다. 2. integer > numbers2 = 1:3> numbers2[1..
R 프로그램의 역사, 다운로드 및 설치, 대수(algebra)
2014. 7. 11.1. R의 역사 R 프로그램은 뉴질랜드 오클랜드 대학의 Ross Ihaka 와 Robert Gentleman 에 의해 개발되었습니다. R 에 대한 좀 더 알고 싶으시면 아래 링크를 참조하세요. http://www.r-project.org/ http://en.wikipedia.org/wiki/R_(programming_language) 2. 다운로드 및 설치 가까운 미러 사이트(http://cran.r-project.org/mirrors.html) 다운로드 한 후 설치하시면 됩니다. 3. 대수(Algebra) 1) 산술 연산자 적용이 가능하다. + (addition, 더하기) - (subtraction, 빼기) / (division, 나누기) * (multiplication, 곱하기) ^ (raise to..