Дерево слов¶
ruts.visualizers.wordtree()
Описание¶
Построение дерева слов (Word Tree), отображающее контекст для заданного ключевого слова в тексте.
Примечание
Более подробно с деревом слов можно ознакомиться в данной публикации.
Параметры¶
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
texts |
List[List[str]] | - |
Список списков слов |
keyword |
str | None |
Ключевое слово, по которому ищется контекст |
max_n |
int | 5 |
Максимальные размер контекста |
max_per_n |
int | 8 |
Максимальное число примеров для каждого размера контекста |
Пример использования¶
Рассмотрим работу визуализатора на примере 100 текстов из набора данных StalinWorks.
Пример
Код:
# Загрузка библиотек
import tempfile
from ruts import SentsExtractor, WordsExtractor
from ruts.datasets import StalinWorks
from ruts.visualizers import wordtree
# Подготовка данных
sw = StalinWorks()
se = SentsExtractor()
we = WordsExtractor(min_len=3)
texts = [text for text in sw.get_texts(limit=50)]
text = '\n'.join(texts)
# Подготовка списка списков слов
words = []
for text in texts:
sents = se.extract(text)
for sent in sents:
words.append(we.extract(sent))
# Построение графика
g = wordtree(words, "рабочий", max_n=6)
# Сохранение визуализации на диск
g.view(tempfile.mktemp(".gv"))
Результат:
Предупреждение
Для просмотра визуализации необходимо установить инструмент Graphviz
.