Функции вычисления метрик¶
Тест Флеша-Кинкайда¶
ruts.readability_stats.calc_flesch_kincaid_grade()
Вычисление теста Флеша-Кинкайда.
Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_syllables |
int | - |
Количество слогов |
n_words |
int | - |
Количество слов |
n_sents |
int | - |
Количество предложений |
a |
int | 0.49 |
Коэффициент a |
b |
int | 7.3 |
Коэффициент b |
c |
int | 16.59 |
Коэффициент c |
Индекс удобочитаемости Флеша¶
ruts.readability_stats.calc_flesch_reading_easy()
Вычисление индекса удобочитаемости Флеша.
Чем выше показатель, тем легче текст для чтения. Значения индекса лежат в пределах от 0 до 100 и могут интерпретироваться следующим образом:
Показатель | Уровень сложности |
---|---|
100.0-90.0 |
5-й класс |
90.0-80.0 |
6-й класс |
80.0-70.0 |
7-й класс |
70.0-60.0 |
8-й и 9-й класс |
60.0-50.0 |
10-й и 11-й класс |
50.0-30.0 |
Университет |
30.0-0.0 |
Выпускник университета |
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_syllables |
int | - |
Количество слогов |
n_words |
int | - |
Количество слов |
n_sents |
int | - |
Количество предложений |
a |
int | 1.3 |
Коэффициент a |
b |
int | 60.1 |
Коэффициент b |
c |
int | 206.835 |
Коэффициент c |
Индекс Колман-Лиау¶
ruts.readability_stats.calc_coleman_liau_index()
Вычисление индекса Колман-Лиау.
Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_letters |
int | - |
Количество букв |
n_words |
int | - |
Количество слов |
n_sents |
int | - |
Количество предложений |
a |
int | 6.26 |
Коэффициент a |
b |
int | 0.2805 |
Коэффициент b |
c |
int | 31.04 |
Коэффициент c |
Индекс SMOG¶
ruts.readability_stats.calc_smog_index()
Вычисление индекса SMOG (Simple Measure of Gobbledygook, «Простое измерение разглагольствований»). Наиболее авторитетная метрика читабельности.
Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_complex |
int | - |
Количество сложных слов |
n_sents |
int | - |
Количество предложений |
a |
int | 1.1 |
Коэффициент a |
b |
int | 64.6 |
Коэффициент b |
c |
int | 0.05 |
Коэффициент c |
Автоматический индекс удобочитаемости¶
ruts.readability_stats.calc_automated_readability_index()
Вычисление автоматического индекса удобочитаемости.
Чем выше показатель, тем сложнее текст для чтения. Результатом является возраст, необходимый для понимания текста. Значения индекса могут интерпретироваться следующим образом:
Показатель | Возраст |
---|---|
1 |
6-7 лет |
2 |
7-8 лет |
3 |
8-9 лет |
4 |
9-10 лет |
5 |
10-11 лет |
6 |
11-12 лет |
7 |
12-13 лет |
8 |
13-14 лет |
9 |
14-15 лет |
10 |
15-16 лет |
11 |
16-17 лет |
12 |
17-18 лет |
13 |
18-24 года |
14 |
24+ года |
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_letters |
int | - |
Количество букв |
n_words |
int | - |
Количество слов |
n_sents |
int | - |
Количество предложений |
a |
int | 6.26 |
Коэффициент a |
b |
int | 0.2805 |
Коэффициент b |
c |
int | 31.04 |
Коэффициент c |
Индекс удобочитаемости LIX¶
ruts.readability_stats.calc_lix()
Вычисление индекса удобочитаемости LIX.
Чем выше показатель, тем сложнее текст для чтения. Значения индекса лежат в пределах от 0 до 100 и могут интерпретироваться следующим образом:
Показатель | Уровень сложности |
---|---|
4.9 и меньше |
до 4 класса включительно |
5.0-5.9 |
5-6 класс |
6.0-6.9 |
7-8 класс |
7.0-7.9 |
9-10 класс |
8.0-8.9 |
11-12 класс |
9.0-9.9 |
Университет |
Формула:
Параметры:
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
n_long_words |
int | - |
Количество длинных слов |
n_words |
int | - |
Количество слов |
n_sents |
int | - |
Количество предложений |