Новости Национального корпуса русского языка
8 декабря 2008 года Вновь доступны для поиска англо-русский и
русско-английский параллельный корпуса; теперь они размещены на
основном сайте НКРЯ и проиндексированы аналогично остальным
подкорпусам.
10 ноября 2008 года Доступен англоязычный интерфейс поиска по основному корпусу.
24 октября 2008 года Доступен поиск в корпусе
«История русского ударения», содержащий поэтические и
акцентуированные устные тексты. При его помощи можно узнать, как эволюционировало русское ударение, например, в словах музыка или поднялись.
20 октября 2008 года Доступен словарь редких слов, предназначенный для обучения. Его задача — разрешить лексические трудности, возникающие при чтении текстов, дать представление о грамматических и стилистических особенностях редких слов. См. описание словаря.
3 октября 2008 года Доступен словарь неоднословных лексических единиц (оборотов) — таких, как предложный оборот во имя, наречный оборот без запинки, вводный оборот таким образом и т. п.
13 мая 2008 года По техническим причинам поиск по параллельному корпусу закрыт на профилактику.
Коллектив корпуса приносит свои извинения за причинённые неудобства.
16 апреля 2008 года Открыт поиск по параллельному русско-немецкому и немецко-русскому корпусам.
26 марта 2008 года Открыт поиск по корпусу устной речи.
18 марта 2008 года Открыт поиск по корпусу синтаксически размеченных текстов.
17 марта 2008 года Открыта англоязычная версия сайта Национального корпуса руссого языка.
Интерфейс поиска по корпусу пока доступен только на русском языке; английская версия будет добавлена в ближайшее время.
28 января 2008 года На сайте размещена библиография публикаций по Корпусу (статьи из сборника 2005 г. доступны в формате PDF). Добавлен список ссылок на другие общедоступные корпуса русского языка. Обновлена статистика Корпуса.
22 января 2008 года Задействован поиск повтора предыдущей лексемы или грамматической характеристики (в поле «дополнительные признаки»). Размещены инструкции пользователя в формате PDF к основному и обучающему корпусам.
16 января 2008 года В «Настройках» на странице выдачи доступна сортировка выдачи по правому или левому контексту.
28 декабря 2007 года Пополнение корпуса со снятой омонимией, объём которого составил около 6 млн словоупотреблений. Добавлены тексты XVIII — 1-й половины XX века, современные нехудожественные тексты (публицистика, специальные тексты, материалы электронной коммуникации)
Пополнение корпуса с неснятой омонимией на 16 млн словоупотреблений. Включены тексты первой половины XX в. (включая также большой массив нехудожественных: мемуары, официальные документы), драматические произведения различных периодов, публицистические и художественные тексты 1960-1980-х гг.
13 декабря 2007 года Пополнение поэтического корпуса — включены тексты авторов XVIII—XIX вв. (от Кантемира до Огарёва) и трёх авторов XX в. (Бунин, Анненский, Мандельштам); всего около 1 млн словоупотреблений. Появилась возможность поиска по дополнительным параметрам (частные особенности метрики, строфики, рифмы).
Пополнение диалектного корпуса — общий объём корпуса составляет 150 тысяч словоупотреблений. Значительно расширилась тематика и география представленных текстов.
26 ноября 2007 года На сайте размещён обучающий корпус — предназначенный для образовательных целей корпус с дополнительными грамматическими параметрами, предусмотренными школьной программой (типы склонений, разряды местоимений и др.).
Добавлена возможность регулировать настройки выдачи поиска (количество документов или контекстов на странице, сортировка).
8–11 июня 2007 года
Национальный корпус русского языка участвует в выставке
«Инновационные достижения России»
в рамках
XI Петербургского международного экономического форума.
26 декабря 2006 года
Масштабное обновление Корпуса:
1. Открытие двух новых составляющих корпусов: корпуса поэтических текстов (ряд авторов первой половины XIX в.),
снабжённого, помимо обычной морфологической и семантической, разметкой параметров стиха -- рифмы, строфики,
метрики, -- и корпуса диалектных текстов, снабжённого лингвистической разметкой специфических диалектных форм.
2. Открытие в составе главного корпуса особого подкорпуса живой русской речи: расширение массива устных публичных и
непубличных текстов. добавления текстов мультимедиа (кинофильмов).
3. Пополнение основного корпуса со снятой грамматической омонимией, в основном записями устной речи и текстами
XVIII — первой половины XX в.
4. Пополнение основного корпуса с неснятой грамматической омонимией: художественная литература, научные журналы,
тексты 1750-1950 гг.
21 июня 2006 года
Расширен поиск по лексико-семантическим признакам. Теперь можно искать
имена собственные: ФИО, топонимы и названия учреждений.
7 февраля 2006 года
Пополнение корпуса с неснятой омонимией (до объёма 120 млн словоупотреблений): добавлены научные тексты, художественные произведения, тексты XIX века (разных жанров), советская пресса середины XX века, записи устной речи (публичных выступлений и непубличных микродиалогов).
Доступен поиск по подкорпусу устной речи.
Доступна лексико-семантическая разметка на корпусе с неснятой омонимией.
19 декабря 2005 года
На сайте работает виртуальная клавиатура (кнопка справа от поля ввода).
Теперь, пользуясь только мышью, вы можете
ввести в строку запроса русские лексемы и словоформы на компьютере, где
нет русской клавиатуры.
14 декабря 2005 года
Пополнение корпуса с неснятой грамматической омонимией. Добавлены тексты общим объёмом 20,5 млн словоупотреблений: специальные и региональные газеты и журналы, художественная литература XX в., тексты разных жанров (художественные, научные, религиозные) XVIII—XIX в.
28 октября 2005 года
Открыт корпус выровненных параллельных текстов (русско-английский и англо-русский); доступен лексико-грамматический поиск по оригинальным текстам (с неснятой грамматической омонимией).
19 августа 2005 года
Пополнение корпуса с неснятой грамматической омонимией — добавлены тексты общим объёмом 11 млн словоупотреблений,
общий объём корпуса с неснятой грамматической омонимией превысил 65 млн слов. Среди новых текстов — драматические
произведения, тексты XIX и начала XX веков, современная художественная литература, периодика, материалы
Интернет-форумов.
13 мая 2005 года
Значительное пополнение корпуса со снятой грамматической омонимией, в котором теперь представлены также
нехудожественные жанры (газетные, журнальные статьи, мемуары, научно-технические, церковно-богословские
тексты; записи устной речи). Общий объём корпуса со снятой грамматической омонимией достиг 3,8 млн словоупотреблений
в 1000 документах. Эти тексты акцентуированы и доступны для лексико-семантического поиска.
19 апреля 2005 года
Реализована функция «расширение контекста». Пользователю, помимо выдаваемого по умолчанию
контекста длиной в одно предложение, доступен также расширенный контекст длиной в 7 предложений (по
3 предложения слева и справа).
7 апреля 2005 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим
объемом 15 млн словоупотреблений: художественная литература XIX —
первой половины XX века; художественная литература 1960 — 1970-х гг.
(включая фантастику и детскую литературу); учебно-научные тексты, специальные и региональные журналы
и газеты 1990 — 2000-х гг., массовая литература (детективы, любовные романы)
этого же периода. Общий объём корпуса превысил 50 млн словоупотреблений.
10 марта 2005 года
Доступна версия для сохранения/печати (в том числе вариант со снятием ударений в акцентуированных
текстах). В выдаче указывается количество не только документов, но и контекстов (если найдено слишком
много, то число контекстов оценивается приблизительно).
18 октября 2004 года
Расширены возможности лексико-грамматического поиска в корпусе. Доступна экспериментальная система
поиска по семантическим и словообразовательным характеристикам лексем (семантическая неоднозначность
в настоящее время не снята).
Пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы тексты общим объемом
3 млн словоупотреблений: пресса (центральная и региональная), научные издания, художественная
литература, мемуары, стенограммы устной речи.
Доступна страница статистики корпуса.
Внимание: несколько изменен язык запросов. Логическое «ИЛИ» задается при помощи
знака |, логическое«И» при помощи пробела или &
(см. подробнее)
16 июля 2004 года
Значительное пополнение корпуса с неснятой грамматической омонимией. Добавлены и проиндексированы
тексты общим объемом 11 млн словоупотреблений: художественная литература
(в том числе
произведения В. Астафьева, Г. Бакланова, Ю. Давыдова, В. Шукшина), мемуары
(в том числе
М. Цветаевой, А. Мариенгофа, Н. Гершензон-Чегодаевой), церковно-богословские тексты.
27 апреля 2004 года
По адресу http://ruscorpora.ru открыт сайт «Национального корпуса
русского языка». Поддержка сайта и поиск по корпусу осуществляется компанией
«Яндекс».
|