ZetHUB
Administrator
- Регистрация
- 18 Дек 2018
- Сообщения
- 46.129
- Реакции
- 10.028
Другие темы автора:
Слив курса «Виктория Молдавская ― Точка роста 2.0. Тариф Под...
Слив курса «AI Инжиниринг Буткемп: Создание приложений на базе ИИ...
Слив курса «Гений общения (2025)» [Ольга Грищенко] [f5game]
Слив курса «ИИздец AI челлендж. Август (2025)» [Тимофей Ларионов]...
Слив курса «Подписка на контент Осознанная меркантильность. Тариф...
Слив курса «AI Инжиниринг Буткемп: Создание приложений на базе ИИ...
Слив курса «Гений общения (2025)» [Ольга Грищенко] [f5game]
Слив курса «ИИздец AI челлендж. Август (2025)» [Тимофей Ларионов]...
Слив курса «Подписка на контент Осознанная меркантильность. Тариф...
- #1
Голосов: 0
Авторство: Архэ
Наименование: Компьютерная лингвистика. Лингвистические корпуса и их количественный анализ (2024)
3. Лингвистические корпуса и их количественный анализ
Бо́льшая часть компьютерно-лингвистических приложений сейчас опирается на большие массивы собранных текстов — лингвистические корпуса. Некоторые из них, например Национальный корпус русского языка, доступны для онлайн-поиска и позволяют также получать результаты, интересные и с точки зрения традиционной, некомпьютерной лингвистики. На занятии мы поговорим о том, как устроены такие большие собрания текстов и какими количественными свойствами они обладают: например, чем частотное распределение слов в корпусах похоже на численность населения городов и почему большинство слов в любом корпусе, какой бы мы ни взяли, встречаются только один раз.
Скачать
Наименование: Компьютерная лингвистика. Лингвистические корпуса и их количественный анализ (2024)
3. Лингвистические корпуса и их количественный анализ
Бо́льшая часть компьютерно-лингвистических приложений сейчас опирается на большие массивы собранных текстов — лингвистические корпуса. Некоторые из них, например Национальный корпус русского языка, доступны для онлайн-поиска и позволяют также получать результаты, интересные и с точки зрения традиционной, некомпьютерной лингвистики. На занятии мы поговорим о том, как устроены такие большие собрания текстов и какими количественными свойствами они обладают: например, чем частотное распределение слов в корпусах похоже на численность населения городов и почему большинство слов в любом корпусе, какой бы мы ни взяли, встречаются только один раз.
Скачать