Перейти к содержанию

Функции вычисления метрик

Тест Флеша-Кинкайда

ruts.readability_stats.calc_flesch_kincaid_grade()

Вычисление теста Флеша-Кинкайда.

Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.

Формула:

\[ a\times\frac{\textrm{Количество слов}}{\textrm{Количество предложений}}+b\times\frac{\textrm{Количество слогов}}{\textrm{Количество слов}}–C \]

Параметры:

Параметр Тип По умолчанию Описание
n_syllables int - Количество слогов
n_words int - Количество слов
n_sents int - Количество предложений
a int 0.49 Коэффициент a
b int 7.3 Коэффициент b
c int 16.59 Коэффициент c

Индекс удобочитаемости Флеша

ruts.readability_stats.calc_flesch_reading_easy()

Вычисление индекса удобочитаемости Флеша.

Чем выше показатель, тем легче текст для чтения. Значения индекса лежат в пределах от 0 до 100 и могут интерпретироваться следующим образом:

Показатель Уровень сложности
100.0-90.0 5-й класс
90.0-80.0 6-й класс
80.0-70.0 7-й класс
70.0-60.0 8-й и 9-й класс
60.0-50.0 10-й и 11-й класс
50.0-30.0 Университет
30.0-0.0 Выпускник университета

Формула:

\[ c–a\times\frac{\textrm{Количество слов}}{\textrm{Количество предложений}}-b\times\frac{\textrm{Количество слогов}}{\textrm{Количество слов}} \]

Параметры:

Параметр Тип По умолчанию Описание
n_syllables int - Количество слогов
n_words int - Количество слов
n_sents int - Количество предложений
a int 1.3 Коэффициент a
b int 60.1 Коэффициент b
c int 206.835 Коэффициент c

Индекс Колман-Лиау

ruts.readability_stats.calc_coleman_liau_index()

Вычисление индекса Колман-Лиау.

Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.

Формула:

\[ a\times\frac{\textrm{Количество букв}}{\textrm{Количество слов}}+b\times\frac{\textrm{Количество слов}}{\textrm{Количество предложений}}–c \]

Параметры:

Параметр Тип По умолчанию Описание
n_letters int - Количество букв
n_words int - Количество слов
n_sents int - Количество предложений
a int 6.26 Коэффициент a
b int 0.2805 Коэффициент b
c int 31.04 Коэффициент c

Индекс SMOG

ruts.readability_stats.calc_smog_index()

Вычисление индекса SMOG (Simple Measure of Gobbledygook, «Простое измерение разглагольствований»). Наиболее авторитетная метрика читабельности.

Чем выше показатель, тем сложнее текст для чтения. Результатом является число лет обучения в американской системе образования, необходимых для понимания текста.

Формула:

\[ a\times\sqrt{b\times\frac{\textrm{Количество сложных слов}}{\textrm{Количество предложений}}}+c \]

Параметры:

Параметр Тип По умолчанию Описание
n_complex int - Количество сложных слов
n_sents int - Количество предложений
a int 1.1 Коэффициент a
b int 64.6 Коэффициент b
c int 0.05 Коэффициент c

Автоматический индекс удобочитаемости

ruts.readability_stats.calc_automated_readability_index()

Вычисление автоматического индекса удобочитаемости.

Чем выше показатель, тем сложнее текст для чтения. Результатом является возраст, необходимый для понимания текста. Значения индекса могут интерпретироваться следующим образом:

Показатель Возраст
1 6-7 лет
2 7-8 лет
3 8-9 лет
4 9-10 лет
5 10-11 лет
6 11-12 лет
7 12-13 лет
8 13-14 лет
9 14-15 лет
10 15-16 лет
11 16-17 лет
12 17-18 лет
13 18-24 года
14 24+ года

Формула:

\[ a\times\frac{\textrm{Количество букв}}{\textrm{Количество слов}}+b\times\frac{\textrm{Количество слов}}{\textrm{Количество предложений}}–c \]

Параметры:

Параметр Тип По умолчанию Описание
n_letters int - Количество букв
n_words int - Количество слов
n_sents int - Количество предложений
a int 6.26 Коэффициент a
b int 0.2805 Коэффициент b
c int 31.04 Коэффициент c

Индекс удобочитаемости LIX

ruts.readability_stats.calc_lix()

Вычисление индекса удобочитаемости LIX.

Чем выше показатель, тем сложнее текст для чтения. Значения индекса лежат в пределах от 0 до 100 и могут интерпретироваться следующим образом:

Показатель Уровень сложности
4.9 и меньше до 4 класса включительно
5.0-5.9 5-6 класс
6.0-6.9 7-8 класс
7.0-7.9 9-10 класс
8.0-8.9 11-12 класс
9.0-9.9 Университет

Формула:

\[ \frac{\textrm{Количество слов}}{\textrm{Количество предложений}}+100\times\frac{\textrm{Количество длинных слов}}{\textrm{Количество слов}} \]

Параметры:

Параметр Тип По умолчанию Описание
n_long_words int - Количество длинных слов
n_words int - Количество слов
n_sents int - Количество предложений