Частоты словоформ и словосочетаний

Вы можете скачать архивы с текстовыми файлами, содержащими частоты словоформ и словосочетаний в основном корпусе.
При подсчёте учитывался регистр букв, а также знаки препинания.
Общий объём корпуса – 192689044 словоформы.

Словоформы zip-архив (5,5 Мб, обрезаны по частоте 3) топ-100
2-граммы zip-архив (39 Мб, обрезаны по частоте 3) топ-100
3-граммы zip-архив (31 Мб, обрезаны по частоте 3) топ-100
4-граммы zip-архив (44 Мб, обрезаны по частоте 2) топ-100
5-граммы zip-архив (28 Мб, обрезаны по частоте 2) топ-100
6-граммы   топ

Национальный корпус русского языка
© 2003–2017
info@ruscorpora.ru