Основной функционал платформы RuLingva
1. Анализ сложности текстаПлатформа RuLingva предлагает комплексный анализ текстовой сложности, оценивая параметры текста для разных категорий пользователей:
- носителей русского языка
- изучающих русский как иностранный (РКИ)
Методы анализа сложности
Для носителей языка система анализирует следующие параметры:
количество слов (Tokens), количество уникальных лемм (Types),
количество слогов, количество предложений, GENERAL POS / SENTENCES
ratio, среднее количество слов в предложении, среднее количество слогов
в слове, среднее количество символов в слове, существительные, среднее
количество существительных в предложении, глаголы, среднее количество
глаголов в предложении, прилагательные, среднее количество
прилагательных в предложении, наречия, местоимения, числительные,
средний ранг (по словарю Шарова), частотность (по словарю Шарова),
индекс ФК (мод) SIS, индекс ФК (О), индекс абстрактности, local noun
overlap, Global noun overlap, local argument overlap, Global argument
overlap, TTR (абсолютное), TTR (среднее), именительный падеж
(существительное), родительный падеж (существительное), творительный
падеж (существительное), винительный падеж (существительное),
творительный падеж (Существительное), предложный падеж
(Существительное), настоящее время (глагол), будущее время (глагол),
прошедшее время (глагол), отношение глаголов к существительным,
отношение прилагательных к существительным, количество существительных в
родительном падеже, термины обществознания, односложные слова,
двусложные слова, трехсложные слова, четырехсложные слова, среднее
количество наречий в одном предложении, соотношение количества
синглтонов на текст, слова содержания, лексическая плотность.
Помимо вышеперечисленных метрик, RuLingva предоставляет следующую информацию по анализируемому тексту:
1. Морфологическая разметка
2. Частота распределений (интервалы, количество токенов, леммы)
3. Дополнительные списки (Гапакс легемене, юридические термины, уникальные юридические термины, существительные, уникальные существительные, глаголы, уникальные глаголы, прилагательные, уникальные прилагательные, существительные в родительном падеже, уникальные существительные в родительном падеже, абстрактные слова)
Для РКИ система анализирует 8 параметров:
количество токенов, количество лемм, лексическое разнообразие, количество предложений, средняя длина предложений, количество слогов, средняя длина слов (в слогах), индекс Флеш-Кинкейда
Помимо 8 параметров, RuLingva предоставляет следующую информацию по анализируемому тексту:
1. Распределение по уровням (количество токенов, количество лемм, кумулятивная доля токенов, кумулятивная доля лемм, уровни CEFR, доля слов разной частотности в тексте)
2. Классификация слов по уровням (слова, отсутствующие в списках A1-C2, уровень А1, уровень А2, уровень В1, уровень В2, уровень С1, уровень С2)
3. Общий список
Практическое применение
1. Для преподавателей
- подбор текстов под конкретный уровень группы
- упрощение/усложнение текста
- создание глоссариев для незнакомых слов.
- отслеживание прогресса учеников через анализ их письменных работ
2. Для учащихся РКИ
- проверка собственных текстов перед сдачей
- тренировка с рекомендованными материалами своего уровн
Шаг 1: Ввод данных
Варианты ввода текста:
1. Вручную – поле для прямого ввода текста
2. Автоматически - сгенерируйте образец текста

3. Файл – загрузка документов (поддерживаются PDF и DOCX форматы)

Обратите внимание, если в документе формата DOCX есть картинка - текст с картинки не будет считан
4. Изображение – распознавание текста с фото/скана (поддерживаются JPEG и PNG форматы)
Шаг 2: Настройка анализа
Выберите с помощью переключателя какой анализ вы хотите сделать:
Русский для носителей / Русский как иностранный

Шаг 3: Получение результатов
После нажатия кнопки "Анализировать":
Основные показатели отобразятся ниже под центральной панелью
Вариант 1: результат анализа текста с включенным переключателем “Русский
для носителей”

Вариант 2: результат анализа текста с включенным переключателем “Русский как иностранный”

Используйте вкладки над результатами для переключения между
разделами.
Вариант 1: доступные разделы анализа текста с включенным переключателем
“Русский для носителей”

Вариант 2: доступные разделы анализа текста с включенным переключателем “Русский как иностранный”

Нажмите на иконку "i" рядом с непонятным параметром для получения подсказки

2. Анализ словарного запаса