R프로그램
ggplot2 패키지 설치 및 기본사용법
2014. 11. 9.※ 본 예제에 사용하는 diamonds dataset 는 ggplot2 패키지에 포함되어 있다. ※ ggplot2 패키지의 설치는 다음과 같이 한다. > install.package('ggplot2') 위 데이터는 정제되지 않은 데이터이므로 아래와 같이 랜덤으로 100개의 샘플을 뽑아낸 dsmall 이라는 dataset 를 이용해서 얘기를 전개해나가고자 한다. > library("ggplot2", lib.loc="~/R/win-library/3.1") > set.set(1410) Error: could not find function "set.set" dsmall qplot(carat, price, data = diamonds) 2. qplot() 은 아래와 같이 변수의 함수를 인수로 가질 수 있음 > ..
Information Visualization (8) - R 그래픽 기초 (선 그리기Adding Connected Line Segments)
2014. 10. 24.기본형태 lines(x, y, lty=str, lwd=num, col=str) 1. lty=int or name선의 스타일 (기본값 "solid")"blank", "solid", "dashed", "dotted", "dotdash", "longdash", "twodash" 등이 있으며 아래 샘플 참조. > plot.new()> plot.window(xlim = c(0, 10), ylim = c(0, 10))> axis(1)> axis(2)> lines(c(0,10),c(1,1),lty="solid")> lines(c(0,10),c(2,2),lty="dashed")> lines(c(0,10),c(3,3),lty="dotted")> lines(c(0,10),c(4,4),lty="dotdash")> lines..
R 프로그래밍 - 좋은 R 코드를 작성하기 위한 팁 Tips for Writing Good R Code
2014. 9. 6.1. General1) 코드에 코멘트 달기 - "#" 을 이용하여 아래와 같이 코멘트를 달 수 있다. > load("~/myfirstRobjects.rdata", ex ls.str(ex) # 코멘트 달기 savevector1 : int [1:9] 1 2 3 4 5 6 7 8 9 savevector2 : chr "Yay!" > "#"의 왼편에 위치한 코드만 실행된다.코멘트가 중요한 이유는 여러분이 잊어버리지 않기 위해서도 중요하지만 여러분의 코드를 쓰는 다른 이들을 위해서도 중요하다는 점은 두말할 나위가 없다. 2) 하드 코드를 쓰지 말 것예를 들어, 설사 길이가 변하지 않는다고 하더라도 벡터의 길이와 같은 하드 코드를 쓰지말고 length() 와 같은 함수를 이용해라.아래 예제에서 2번 코드가 더 훌륭한..
R 프로그래밍 - Types of Output / Exporting Data
2014. 8. 29.1. Types of Output Types of InputTypes of Output delineated files(.csv) delineated files R object (.rdata) R object (.rdata) graphical output (.pdf, .jpg, .png, .bmp, .tiff) 2. How to export data write.csv() : .csv 형태로 저장하기 위한 함수(사용되는 파라메터는 read.csv() 와 동일함) 예를 들어보면, > printvector1 = 1:10 > write.csv(printvector1, file="myfirstoutput.csv") // 데이터, 파일네임순 > getwd()[1] "C:/Users/fukaeri/Documents" ..
R 프로그래밍 - Plotting Data : Additions
2014. 8. 16.이번에는 기존 그래프에 선과 점을 추가하는 방법을 알아봅니다. 먼저 예제로 사용할 그래프를 하나 만든다 > plotvector3 = 1:9 > plotvector4 = c(1, 3, 6, 2, 7, 5, 5, 3, 1) > plot(plotvector3, plotvector4) 1. 선 그리기 점사이를 이을 때는 lines() 함수를 이용한다. > lines(plotvector3, plotvector4) 수직선이나 수평선을 긋고 싶을 때는 abline() 함수를 이용한다. > abline(coef = c(1, 1), v = 3, h = 5) coef : (절편, 기울기) 특정 v : x축 좌표와 교차하는 수직선 h : y축 좌표와 교차하는 수평선 2. 점 넣기 아래와 같이 point() 함수..
R 프로그래밍 - Plotting Data : Box Plots
2014. 8. 16.Box Plots은 이상치(outlier)를 비롯하여 4분위를 이용해 값들의 분포 양상을 보여준다. 생성은 boxplot() 명령어로 한다. > par(cex = .6) > boxplot(proteinconc) cex : 좌표내 텍스트의 크기 값 설정하는 옵션 전체를 4등분하여 박스 아랫값은 25% 지점을, 가운데 진한 검정라인은 50% 지점을, 그리고 박스 상단은 75% 지점을 나타낸다. 그리고 IQR(Interquartile Range) = Upper Quartile - Lower Quartile 를 나타낸다. Whiskers는 Lower Quartile - 이상치를 제외한 최소값 또는 이상치를 제외한 최대값 - Upper Quartile 를 나타낸다. Outliers(이상치, 극단치) 는 그림에서 ..
R 프로그래밍 - Reading in Data
2014. 8. 9.그럼 예제 파일을 가지고 시작해보자. R 프로그램의 working directory 는 다음의 명령어로 확인가능하다. > getwd() [1] "C:/Users/fukaeri/Documents" 작업 디렉토리 변경은 다음과 같이 한다. setwd() 명령어로는 새폴더를 생성할 수는 없다. 그러므로 해당 폴더가 없는 경우라면 먼저 폴더를 생성한 후 작업 디렉토리로 지정해야 한다. > setwd(C:/Users/myusername/Documents/My Other R Stuff) 본 예제에 필요한 파일을 아래 링크에서 다운로드한 후 다음과 같이 입력한다. http://sites.google.com/site/undergraduateguidetor/manual-files > proteinconc = read.c..
R 프로그래밍 - 벡터(Vector)
2014. 7. 11.1) 벡터는 아래 화면에서 보듯이 연속된 수일 수도 있고, 임의의 수일 수도 있다. 2) 포함할 수 있는 수의 갯수에는 제한이 없다. ":" (콜론 연산자)는 아럐 예에서 보듯이 1:9 즉, 1에서부터 1씩 증가하여 9(또는 9 직전의 수)가 될 때까지라는 의미다. >vector1=1:9 >vector1 [1] 1 2 3 4 5 6 7 8 9 3) 그리고 벡터를 만드는 다른 방법에는 c() 함수를 이용하는 방법이 있다. c() 안에 원하는 수를 넣으면 된다. 4) 벡터의 덧셈 연산은 사이즈가 같은 경우 각각의 위치에 있는 값끼리 더하면 된다. 5) 사이즈가 다른 경우 큰 사이즈가 작은 사이즈의 배수인 경우 반복하여 더한다. 사이즈가 배수가 아닌 경우 다음과 같은 에러 메시지를 출력한다. longer ob..
R 프로그램의 역사, 다운로드 및 설치, 대수(algebra)
2014. 7. 11.1. R의 역사 R 프로그램은 뉴질랜드 오클랜드 대학의 Ross Ihaka 와 Robert Gentleman 에 의해 개발되었습니다. R 에 대한 좀 더 알고 싶으시면 아래 링크를 참조하세요. http://www.r-project.org/ http://en.wikipedia.org/wiki/R_(programming_language) 2. 다운로드 및 설치 가까운 미러 사이트(http://cran.r-project.org/mirrors.html) 다운로드 한 후 설치하시면 됩니다. 3. 대수(Algebra) 1) 산술 연산자 적용이 가능하다. + (addition, 더하기) - (subtraction, 빼기) / (division, 나누기) * (multiplication, 곱하기) ^ (raise to..