Архив новостей Национального корпуса русского языка

8 июля 2015 года
Открыт пилотный вариант Мультимедийного параллельного корпуса (МультиПАРК), включающий в себя две театральные постановки и одну экранизацию пьесы Н.В. Гоголя "Ревизор".

8 мая 2015 года
В составе акцентологического корпуса существенно увеличена коллекция публичной речи, а также современных поэтических текстов. Кроме того, организован новый подкорпус «наивной поэзии». Объём акцентологического корпуса увеличен до 30 млн словоупотреблений.

8 мая 2015 года
Пополнены устный корпус (до 11,3 млн словоупотреблений) и мультимедийный корпус (до 4,3 млн).

17 апреля 2015 года
Для общего доступа открыт корпус региональной и зарубежной прессы. Объём корпуса — более 13 млн словоупотреблений, в его составе представлены издания регионов России и ближнего зарубежья. В создании корпуса принимали участие преподаватели кафедры общего и славянского языкознания Гродненского государственного университета имени Янки Купалы (www.grsu.by).

3 апреля 2015 года
Поэтический корпус пополнен на 0,6 млн словоупотреблений. В его состав включены произведения ряда поэтов Серебряного века и поэтов 1940-1970-х годов.

28 октября 2014 года
Пополнен поэтический корпус: общий объем составляет 10,3 млн словоупотреблений. В его состав включены произведения ряда поэтов Серебряного века и поэтов 1940-1960-х годов.

3 июня 2014 года
Объявляется конкурс проектов нового дизайна Национального корпуса русского языка.

29 апреля 2014 года
Национальному корпусу русского языка исполнилось 10 лет.

29 апреля 2014 года
В режиме бета-версии запущен поиск по n-граммам подкорпуса с неснятой омонимией основного корпуса.

11 апреля 2014 года
Обновлён синтаксический корпус, его объём теперь составляет более 860 тыс. словоупотреблений.

18 января 2014 года
Пополнен акцентологический корпус, теперь в его составе 15 млн словоупотреблений.

18 января 2014 года
Пополнен устный корпус, его объём возрос до 11 млн словоупотреблений.

14 января 2014 года
Пополнен параллельный корпус: добавлены двуязычные армянский, болгарский и латышский корпуса, существенно расширены немецкий, английский и белорусский. В двуязычный французский корпус включены поливариантные русско-французские тексты (с несколькими альтернативными переводами). Общий объём корпуса теперь превышает 54 млн словоупотреблений.

14 января 2014 года
Пополнен поэтический корпус: общий объём составляет 9,6 млн словоупотреблений. Включены,в частности, произведения советских и эмигрантских поэтов второй половины XX в.

10 января 2014 года
Пополнен мультимедийный корпус, его объём возрос до 4 млн словоупотреблений. Неоценимую помощь в пополнении МУРКО текстами научного дискурса оказал в 2013 году Фонд поддержки Интернет.

27 июля 2013 года
Скончался Илья Валентинович Сегалович — один из основателей и главных вдохновителей Корпуса. Благодаря Илье Корпус смог возникнуть двенадцать лет назад и развиваться все эти годы. Команда Национального корпуса русского языка выражает глубокие соболезнования всем, кто знал и любил Илью Сегаловича.

25 июля 2013 года
Пополнен мультимедийный корпус, теперь его объём превышает 3 млн словоупотреблений.

25 июля 2013 года
Пополнен поэтический корпус, в его составе теперь более 9 млн словоупотреблений.

8 мая 2013 года
Исторические корпуса пополнились древнерусским корпусом и корпусом берестяных грамот.

15 апреля 2013 года
Часть корпуса со снятой омонимией объёмом около 1 млн словоупотреблений теперь доступна для оффлайн-использования.

17 января 2013 года
Пополнение основного корпуса на 20 млн словоупотреблений (полный объём 230 млн словоупотреблений). Включены новые тексты различных периодов, включая художественную прозу и мемуары XVIII — начала XXI в., а также тексты СМИ и электронной коммуникации.

17 января 2013 года
Открыт новый исторический корпус — корпус среднерусских текстов (XV — начало XVIII века). Объём корпуса — 3 млн словоупотреблений: литературные произведения, летописи, жития, деловые грамоты, бытовая переписка. Доступен поиск точных форм (без морфологической разметки), в том числе с использованием символа *, а также задание подкорпуса.

26 декабря 2012 года
Пополнение мультимедийного, устного и акцентологического корпусов.

26 декабря 2012 года
Обновление поэтического корпуса. Общий объём корпуса теперь составляет почти 8 млн словоупотреблений (50 тыс. документов).

26 декабря 2012 года
Обновление параллельного корпуса. Общий объём составляет 42,8 млн словоупотреблений (вырос на 80%). Пополнены двуязычные английский, немецкий, украинский и белорусский корпуса. Впервые доступны польский, французский, итальянский и испанский корпуса. Возможен поиск внутри предложений на заданном языке (язык задаётся в поле «Дополнительные признаки»).

8 августа 2012 года
Существенно пополнился газетный корпус (большой корпус СМИ 2000-х годов). Теперь его объем превышает 332 тыс. документов, 173 млн словоупотреблений. Напоминаем, что ограничиться поиском по предыдущей версии корпуса можно в разделе «Версии» в форме выбора подкорпуса.

3 августа 2012 года
Произошло очередное пополнение мультимедийного и устного корпусов.

10 июля 2012 года
Год назад был запущен сервис «Графики», аналогичный сервису Google Books Ngram Viewer: распределение найденных по точной форме слов и словосочетаний по годам. Теперь такой график можно построить по результатам произвольного запроса к основному корпусу (а не только по точным формам, как раньше). Для этого перейдите по ссылке «Распределение по годам» на странице с результатами поиска и дождитесь ответа. Кроме того, по соседней ссылке «Статистика» доступны таблицы с распределением найденных документам по авторам, жанрам, типам, тематике текста и т. д.

20 мая 2012 года
Для общего доступа открыт Церковнославянский корпус как первый из разделов Исторического корпуса. Основу церковнославянского корпуса составляют современные богослужебные тексты (XIX-XX век) (60%). Кроме того, в корпусе представлены тексты других периодов (XVII-XVIII век) и жанров: писание, святоотеческие и др. Общий объем корпуса – около 4,7 млн словоупотреблений. Тексты в корпусе снабжены морфологической разметкой, которая позволяет искать слова по лемме и грамматическим признакам. Пользователь может искать словоформы и леммы в трех орфографических системах: точной, упрощенной и модернизированной.

20 января 2012 года
1. Очередное обновление и пополнение ряда корпусов: основного, акцентологического, мультимедийного, параллельного, поэтического, устного. Объем основного корпуса превысил 209 млн словоупотреблений, а общий объем корпусов – 364 млн словоупотреблений.
2. На странице выбора подкорпуса основного корпуса теперь можно выбирать документы, добавленные или изменненные в определенных версиях корпуса.
3. Вкладки с корпусами теперь расположены слева в меню «поиск в корпусе».

13 июля 2011 года
В режиме бета-тестирования запущен новый сервис: распределение результатов поиска по точным формам в основном корпусе по годам.

В формах для ввода слов в лексико-грамматическом поиска появились «подсказки», позволяющие быстро выбрать наиболее частотную лемму.

Появилась возможность искать слова, расположенные в начале или в конце предложений. Включить эти параметры можно через форму выбора дополнительных признаков в лексико-грамматическом поиске

31 мая 2011 года
Произошло обновление и пополнение ряда корпусов: основного, параллельного, поэтического, акцентологического, устного. Общий объем корпусов превысил 340 млн словоупотреблений. Обновлена страница со статистикой.

24 февраля 2011 года
В результатах поиска во всплывающих окошках с информацией о слове появились гиперссылки на словарные статьи из коллекции Яндекс.Словарей.

22 февраля 2011 года
Для свободного пользования выложена случайная выборка предложений (с нарушенным порядком) из корпуса со снятой омонимией объёмом 180 тыс. словоупотреблений (90 тыс. – пресса, по 30 тыс. из художественных текстов, законодательства и научных текстов).

31 декабря 2010 года
Обновление поэтического корпуса. Добавлены произведения поэтов начала и середины XX в.: С. Дрожжина, В. Брюсова, А. Блока, Андрея Белого, М. Кузмина, В. Гофмана, Н. Гумилева, С. Городецкого, О. Мандельштама, Г. Иванова, Г. Адамовича, М. Моравской, В. Меркурьевой, Вс. Рождественского, А. Адалис, А. Ладинского. Общий объём новых текстов – более 800 тыс. словоупотреблений.

30 декабря 2010 года
Произошло обновление акцентологического и устного корпусов.

28 декабря 2010 года
Для общего доступа открыт Мультимедийный русский корпус (МУРКО).

9 октября 2010 года
Выложены материалы сборника «Национальный корпус русского языка: 2006 — 2008. Новые результаты и перспективы».

1 сентября 2010 года
На странице результатов поиска появилось несколько полезных инструментов:

  • — по ссылке «Посмотреть частотный словарь» можно перейти к списку самых частотных лемм и словоформ среди найденных документов;
  • — теперь можно сохранить результаты с текущей страницы выдачи в электронной таблице (Microsoft Excel, OpenOffice Calc);
  • — добавлена возможность случайного перемешивания результатов поиска (чтобы ее включить, перейдите в окно «Настройки» и выберите пункт «Сортировать случайно»).

23 июля 2010 года
Пополнение и усовершенствование функциональности Корпуса:

  • — проведена унификация разметки в основном корпусе со снятой омонимией (вид и залог глагольной лексемы, формы причастий и деепричастий, ударение частотных словоформ имён собственных и несловарных слов, разбор имён собственных, сокращений, иностранных слов, ряд мелких исправлений);
  • — пополнен основной корпус с неснятой омонимией: художественные и публицистические тексты XIX – первой половины XX века, мемуары второй половины XX века, научные тексты, научно-популярные и общественно-политические журналы 1950-1980-х годов, газеты 1990-х годов, тексты электронной коммуникации, официально-деловые тексты. Объём основного корпуса достиг 176 млн словоупотреблений.
  • — пополнен корпус поэтических текстов: творчество поэтов XIX – начала XX в. (материалы выпусков «Библиотеки поэта»: «Поэты 1840-х гг.», «Поэты-петрашевцы», «Поэты 1860-х гг.», «Поэты 1880-1890-х гг.»; авторские сборники поэтов: И. Мятлев, М. Михайлов, Н. Щербина, П. Соловьева, А. Добролюбов, К. Бальмонт, Ю. Балтрушайтис, Е. Дмитриева (Черубина де Габриак), Л. Кобылинский (Эллис), А. Кондратьев, Б. Садовской, Т. Щепкина-Куперник, А. Скалдин, С. Соловьев, А. Тиняков, Вяч. Иванов, М. Волошин). Объём поэтического корпуса достиг 5 млн словоупотреблений.
  • — пополнен корпус параллельных текстов, достигающий 9 млн словоупотреблений; добавлены англо-русские (Э. Бронте, Дж. Голсуорси, К. Льюис, К. Воннегут и др.) и немецко-русские (Новалис, Й. фон Эйхендорф, Г. Гессе, Г. Бёлль и др.) параллельные тексты. Впервые доступны для поиска украинско-русский и русско-украинский параллельные корпуса (500 тыс. словоупотреблений).

8 июля 2010 года
Доступна выдача в формате KWIC (key word in context) с выравниванием ключевых слов по центру. Чтобы включить этот режим, пройдите по ссылке «формат KWIC» или «настройки» в верхней части страницы выдачи.

15 июня 2010 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус.

4 июня 2010 года
Появилась форма для сообщения об ошибках в тексте. Чтобы сообщить об ошибке в разметке слова или документа, выделите его мышкой и во всплывающем окне нажмите «Сообщить об ошибке».
Также на странице с результатами поиска появились ссылки на поиск в других корпусах.

3 февраля 2010 года
Доступен для поиска Корпус современной русской прессы (газеты и сообщения новостных интернет-агентств за период 2000—2008 гг) объёмом около 100 млн словоупотреблений. Тексты предоставлены компанией Corpus Technologies.

1 января 2010 года
В 2009 году вышли два сборника, в которых принимал непосредственное участие коллектив разработчиков Корпуса:

  1. Национальный корпус русского языка: 2006—2008. Новые результаты и перспективы. — СПб.: Нестор-История, 2009. — 502 с.
  2. Корпусные исследования по русской грамматике. — М., Пробел, 2009. — 516 с.

18 ноября 2009 года
Национальный корпус русского языка стал обладателем специального приза конкурса работников электронных средств массовой информации «За образцовое владение русским языком в профессиональной деятельности»

18 ноября 2009 года
На сайте Института русского языка РАН размещены словари, созданные на основе Национального корпуса русского языка: грамматический словарь новых слов русского языка, новый частотный словарь русской лексики, словарь сочетаемости слов со значением высокой степени, словарь глагольной сочетаемости непредметных имён русского языка.

18 ноября 2009 года
Выложена новая версия глубоко аннотированного корпуса русских текстов СинТагРус. По сравнению с предыдущей версией в корпус было добавлено 88 современных статей научно-популярной, экономической и общественно-политической тематики, опубликованных в российской периодической печати в 2007-2008 гг. Попутно были исправлены замеченные ошибки. В настоящий момент СинТагРус содержит 41187 аннотированных предложений.

2 ноября 2009 года
Открыт образовательный портал Национального корпуса русского языка.

2 ноября 2009 года
Пополнение поэтического корпуса (добавлены тексты ряда авторов XVIII – XIX в., включая сборники второстепенных поэтов 1790–1830-х годов «Библиотеки поэта»). Доступен список авторов поэтического корпуса с возможностью перехода на подкорпуса текстов каждого из них.

26 февраля 2009 года
В основном корпусе доступны опции поиска слов в составе идиоматических оборотов и вне оборотов. Доступен также расширенный семантический поиск по первому/не первому значению слова, а также в части контекстов, где разрешена лексико-семантическая омонимия.

25 февраля 2009 года
Пополнение параллельного корпуса; добавлен немецко-русский корпус (доступен для лексико-грамматического поиска в общей форме параллельных корпусов).

12 января 2009 года
Пополнение корпусов. Расширены устный корпус (объём достиг 7,8 млн слов), акцентологический корпус (объём достиг 4,45 млн слов).

25 декабря 2008 года
Пополнение корпусов. Расширены основной корпус (тексты первой половины XX в. — объём достиг 40 млн слов, тексты XVIII в. — объём достиг 2,6 млн слов), поэтический корпус (объём достиг 3 млн слов).

8 декабря 2008 года
Вновь доступны для поиска англо-русский и русско-английский параллельный корпуса; теперь они размещены на основном сайте НКРЯ и проиндексированы аналогично остальным подкорпусам.

10 ноября 2008 года
Доступен англоязычный интерфейс поиска по основному корпусу.

24 октября 2008 года
Доступен поиск в корпусе «История русского ударения», содержащий поэтические и акцентуированные устные тексты. При его помощи можно узнать, как эволюционировало русское ударение, например, в словах музыка или поднялись.

20 октября 2008 года
Доступен словарь редких слов, предназначенный для обучения. Его задача — разрешить лексические трудности, возникающие при чтении текстов, дать представление о грамматических и стилистических особенностях редких слов. См. описание словаря.

3 октября 2008 года
Доступен словарь неоднословных лексических единиц (оборотов) — таких, как предложный оборот во имя, наречный оборот без запинки, вводный оборот таким образом и  т. п.

13 мая 2008 года
По техническим причинам поиск по параллельному корпусу закрыт на профилактику.
Коллектив корпуса приносит свои извинения за причинённые неудобства.

16 апреля 2008 года
Открыт поиск по параллельному русско-немецкому и немецко-русскому корпусам.

26 марта 2008 года
Открыт поиск по корпусу устной речи.

18 марта 2008 года
Открыт поиск по корпусу синтаксически размеченных текстов.

17 марта 2008 года
Открыта англоязычная версия сайта Национального корпуса руссого языка. Интерфейс поиска по корпусу пока доступен только на русском языке; английская версия будет добавлена в ближайшее время.

28 января 2008 года
На сайте размещена библиография публикаций по Корпусу (статьи из сборника 2005 г. доступны в формате PDF). Добавлен список ссылок на другие общедоступные корпуса русского языка. Обновлена статистика Корпуса.

22 января 2008 года
Задействован поиск повтора предыдущей лексемы или грамматической характеристики (в поле «дополнительные признаки»). Размещены инструкции пользователя в формате PDF к основному и обучающему корпусам.

16 января 2008 года
В «Настройках» на странице выдачи доступна сортировка выдачи по правому или левому контексту.

28 декабря 2007 года
Пополнение корпуса со снятой омонимией, объём которого составил около 6 млн словоупотреблений. Добавлены тексты XVIII — 1-й половины XX века, современные нехудожественные тексты (публицистика, специальные тексты, материалы электронной коммуникации)
Пополнение корпуса с неснятой омонимией на 16 млн словоупотреблений. Включены тексты первой половины XX в. (включая также большой массив нехудожественных: мемуары, официальные документы), драматические произведения различных периодов, публицистические и художественные тексты 1960-1980-х гг.

13 декабря 2007 года
Пополнение поэтического корпуса — включены тексты авторов XVIII—XIX вв. (от Кантемира до Огарёва) и трёх авторов XX в. (Бунин, Анненский, Мандельштам); всего около 1 млн словоупотреблений. Появилась возможность поиска по дополнительным параметрам (частные особенности метрики, строфики, рифмы).
Пополнение диалектного корпуса — общий объём корпуса составляет 150 тысяч словоупотреблений. Значительно расширилась тематика и география представленных текстов.

26 ноября 2007 года
На сайте размещён обучающий корпус — предназначенный для образовательных целей корпус с дополнительными грамматическими параметрами, предусмотренными школьной программой (типы склонений, разряды местоимений и др.).
Добавлена возможность регулировать настройки выдачи поиска (количество документов или контекстов на странице, сортировка).

8–11 июня 2007 года
Национальный корпус русского языка участвует в выставке «Инновационные достижения России» в рамках XI Петербургского международного экономического форума.

26 декабря 2006 года
Масштабное обновление Корпуса:

    1. Открытие двух новых составляющих корпусов: корпуса поэтических текстов (ряд авторов первой половины XIX в.), снабжённого, помимо обычной морфологической и семантической, разметкой параметров стиха -- рифмы, строфики, метрики, -- и корпуса диалектных текстов, снабжённого лингвистической разметкой специфических диалектных форм.
    2. Открытие в составе главного корпуса особого подкорпуса живой русской речи: расширение массива устных публичных и непубличных текстов. добавления текстов мультимедиа (кинофильмов).
    3. Пополнение основного корпуса со снятой грамматической омонимией, в основном записями устной речи и текстами XVIII — первой половины XX в.
    4. Пополнение основного корпуса с неснятой грамматической омонимией: художественная литература, научные журналы, тексты 1750-1950 гг.

21 июня 2006 года
Расширен поиск по лексико-семантическим признакам. Теперь можно искать имена собственные: ФИО, топонимы и названия учреждений.

7 февраля 2006 года
Пополнение корпуса с неснятой омонимией (до объёма 120 млн словоупотреблений): добавлены научные тексты, художественные произведения, тексты XIX века (разных жанров), советская пресса середины XX века, записи устной речи (публичных выступлений и непубличных микродиалогов).
Доступен поиск по подкорпусу устной речи.
Доступна лексико-семантическая разметка на корпусе с неснятой омонимией.

19 декабря 2005 года
На сайте работает виртуальная клавиатура (кнопка справа от поля ввода). Теперь, пользуясь только мышью, вы можете ввести в строку запроса русские лексемы и словоформы на компьютере, где нет русской клавиатуры.

14 декабря 2005 года
Пополнение корпуса с неснятой грамматической омонимией. Добавлены тексты общим объёмом 20,5 млн словоупотреблений: специальные и региональные газеты и журналы, художественная литература XX в., тексты разных жанров (художественные, научные, религиозные) XVIII—XIX в.

28 октября 2005 года
Открыт корпус выровненных параллельных текстов (русско-английский и англо-русский); доступен лексико-грамматический поиск по оригинальным текстам (с неснятой грамматической омонимией).

19 августа 2005 года
Пополнение корпуса с неснятой грамматической омонимией — добавлены тексты общим объёмом 11 млн словоупотреблений, общий объём корпуса с неснятой грамматической омонимией превысил 65 млн слов. Среди новых текстов — драматические произведения, тексты XIX и начала XX веков, современная художественная литература, периодика, материалы Интернет-форумов.

13 мая 2005 года
Значительное пополнение корпуса со снятой грамматической омонимией, в котором теперь представлены также нехудожественные жанры (газетные, журнальные статьи, мемуары, научно-технические, церковно-богословские тексты; записи устной речи). Общий объём корпуса со снятой грамматической омонимией достиг 3,8 млн словоупотреблений в 1000 документах. Эти тексты акцентуированы и доступны для лексико-семантического поиска.

19 апреля 2005 года
Реализована функция «расширение контекста». Пользователю, помимо выдаваемого по умолчанию контекста длиной в одно предложение, доступен также расширенный контекст длиной в 7 предложений (по 3 предложения слева и справа).

7 апреля 2005 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 15 млн словоупотреблений: художественная литература XIX — первой половины XX века; художественная литература 1960 — 1970-х гг. (включая фантастику и детскую литературу); учебно-научные тексты, специальные и региональные журналы и газеты 1990 — 2000-х гг., массовая литература (детективы, любовные романы) этого же периода. Общий объём корпуса превысил 50 млн словоупотреблений.

10 марта 2005 года
Доступна версия для сохранения/печати (в том числе вариант со снятием ударений в акцентуированных текстах). В выдаче указывается количество не только документов, но и контекстов (если найдено слишком много, то число контекстов оценивается приблизительно).

18 октября 2004 года
Расширены возможности лексико-грамматического поиска в корпусе. Доступна экспериментальная система поиска по семантическим и словообразовательным характеристикам лексем (семантическая неоднозначность в настоящее время не снята).
Пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 3 млн словоупотреблений: пресса (центральная и региональная), научные издания, художественная литература, мемуары, стенограммы устной речи.
Доступна страница статистики корпуса.
Внимание: несколько изменен язык запросов. Логическое «ИЛИ» задается при помощи знака |, логическое«И» при помощи пробела или & (см. подробнее)

16 июля 2004 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом 11 млн словоупотреблений: художественная литература (в том числе произведения В. Астафьева, Г. Бакланова, Ю. Давыдова, В. Шукшина), мемуары (в том числе М. Цветаевой, А. Мариенгофа, Н. Гершензон-Чегодаевой), церковно-богословские тексты.

27 апреля 2004 года
По адресу http://ruscorpora.ru открыт сайт «Национального корпуса русского языка». Поддержка сайта и поиск по корпусу осуществляется компанией «Яндекс».

Национальный корпус русского языка
© 2003–2017
info@ruscorpora.ru