Национальный корпус русского языка


На этом сайте помещен корпус современного русского языка объемом более 300 млн слов. Корпус русского языка — это информационно-справочная система, основанная на собрании русских текстов в электронной форме.

Корпус предназначен для всех, кто интересуется самыми разными вопросами, связанными с русским языком: профессиональных лингвистов, преподавателей языка, школьников и студентов, иностранцев, изучающих русский язык.

Как пользоваться Корпусом (инструкция в формате PDF)

Подробнее о корпусе


Новости проекта

20 января 2012 года
1. Очередное обновление и пополнение ряда корпусов: основного, акцентологического, мультимедийного, параллельного, поэтического, устного. Объем основного корпуса превысил 209 млн словоупотреблений, а общий объем корпусов – 364 млн словоупотреблений.
2. На странице выбора подкорпуса основного корпуса теперь можно выбирать документы, добавленные или изменненные в определенных версиях корпуса.
3. Вкладки с корпусами теперь расположены слева в меню «поиск в корпусе».

13 июля 2011 года
В режиме бета-тестирования запущен новый сервис: распределение результатов поиска по точным формам в основном корпусе по годам.

В формах для ввода слов в лексико-грамматическом поиска появились «подсказки», позволяющие быстро выбрать наиболее частотную лемму.

Появилась возможность искать слова, расположенные в начале или в конце предложений. Включить эти параметры можно через форму выбора дополнительных признаков в лексико-грамматическом поиске

31 мая 2011 года
Произошло обновление и пополнение ряда корпусов: основного, параллельного, поэтического, акцентологического, устного. Общий объем корпусов превысил 340 млн словоупотреблений. Обновлена страница со статистикой.

24 февраля 2011 года
В результатах поиска во всплывающих окошках с информацией о слове появились гиперссылки на словарные статьи из коллекции Яндекс.Словарей.

22 февраля 2011 года
Для свободного пользования выложена случайная выборка предложений (с нарушенным порядком) из корпуса со снятой омонимией объёмом 180 тыс. словоупотреблений (90 тыс. – пресса, по 30 тыс. из художественных текстов, законодательства и научных текстов).

31 декабря 2010 года
Обновление поэтического корпуса. Добавлены произведения поэтов начала и середины XX в.: С. Дрожжина, В. Брюсова, А. Блока, Андрея Белого, М. Кузмина, В. Гофмана, Н. Гумилева, С. Городецкого, О. Мандельштама, Г. Иванова, Г. Адамовича, М. Моравской, В. Меркурьевой, Вс. Рождественского, А. Адалис, А. Ладинского. Общий объём новых текстов – более 800 тыс. словоупотреблений.

30 декабря 2010 года
Произошло обновление акцентологического и устного корпусов.

28 декабря 2010 года
Для общего доступа открыт Мультимедийный русский корпус (МУРКО).

9 октября 2010 года
Выложены материалы сборника «Национальный корпус русского языка: 2006 — 2008. Новые результаты и перспективы».

1 сентября 2010 года
На странице результатов поиска появилось несколько полезных инструментов:

  • — по ссылке «Посмотреть частотный словарь» можно перейти к списку самых частотных лемм и словоформ среди найденных документов;
  • — теперь можно сохранить результаты с текущей страницы выдачи в электронной таблице (Microsoft Excel, OpenOffice Calc);
  • — добавлена возможность случайного перемешивания результатов поиска (чтобы ее включить, перейдите в окно «Настройки» и выберите пункт «Сортировать случайно»).

Архив новостей

Национальный корпус русского языка
© 2003–2012
info@ruscorpora.ru