728x90
앞에서 살펴본 term의 출현 빈도에 대한 분포를 구한다
> head(table(freq),15) // Frequency of frequencies
freq
1 2 3 4 5 6 7 8 9 10 11 13 15 27 51 // 그러니깐 1번 나오는 용어가 362개, 2번 나오는 용어가 82개와 같은 식
362 82 31 16 8 11 6 3 1 2 2 1 2 1 1
> tail(table(freq),15)
freq
3 4 5 6 7 8 9 10 11 13 15 27 51 56 71 // 71번 나오는 용어는 1개와 같은 식
31 16 8 11 6 3 1 2 2 1 2 1 1 1 1
>
728x90
'프로그래밍 Programming' 카테고리의 다른 글
ftp 프로그램 파일질라 FileZilla 편집기 설정변경방법 (0) | 2014.11.25 |
---|---|
10. 행렬로 전환하여 CSV 포맷으로 저장하기 Conversion to Matrix and Save to CSV (0) | 2014.11.22 |
08. Exploring the Document Term Matrix (0) | 2014.11.22 |
07. Document-Term행렬 만들기 Creating a Document-Term Matrix (0) | 2014.11.22 |
06. Stemming 어간추출 (0) | 2014.11.22 |