728x90
Document-term matrix 를 다른 툴에서 활용할 수 있도록 CSV 파일로 저장하기 위해 단순 행렬로 변환할 수 있다.
아래와 같은 방법으로 행렬 변환이 가능하다.
> m <- as.matrix(dtm)
> dim(m)
[1] 10 531
R의 계산한계를 넘어서는 경우에는 아래와 같은 에러 메시지가 출력된다.
## Error in vector(typeof(x$v), nr * nc) : vector size cannot be NA
## In addition: Warning message:
## In nr * nc : NAs produced by integer overflow
이런 경우에는 밀도가 희박한 term 을 제거하는 것을 고려해볼 필요가 있다.
일단 표준 행렬로 변환되고 나면, write.csv() 를 이용하여 파일로 저장할 수 있다.
> write.csv(m, file="dtm.csv")
dtm.csv 를 열어보면 다음과 같다.
728x90
'프로그래밍 Programming' 카테고리의 다른 글
리눅스 방화벽 설정 iptables (0) | 2014.11.25 |
---|---|
ftp 프로그램 파일질라 FileZilla 편집기 설정변경방법 (0) | 2014.11.25 |
09. term의 출현빈도에 대한 분포 구하기 Distribution of Term Frequencies (0) | 2014.11.22 |
08. Exploring the Document Term Matrix (0) | 2014.11.22 |
07. Document-Term행렬 만들기 Creating a Document-Term Matrix (0) | 2014.11.22 |