갈루아의 반서재

728x90

Document-term matrix 를 다른 툴에서 활용할 수 있도록 CSV 파일로 저장하기 위해 단순 행렬로 변환할 수 있다. 

아래와 같은 방법으로 행렬 변환이 가능하다.

> m <- as.matrix(dtm)

> dim(m)

[1]  10 531

R의 계산한계를 넘어서는 경우에는 아래와 같은 에러 메시지가 출력된다.

## Error in vector(typeof(x$v), nr * nc) : vector size cannot be NA

## In addition: Warning message:

## In nr * nc : NAs produced by integer overflow

이런 경우에는 밀도가 희박한 term 을 제거하는 것을 고려해볼 필요가 있다. 

일단 표준 행렬로 변환되고 나면, write.csv() 를 이용하여 파일로 저장할 수 있다.

> write.csv(m, file="dtm.csv")

dtm.csv 를 열어보면 다음과 같다.





728x90