АНАЛИЗ И КЛАССИФИКАЦИЯ КОРОТКИХ ТЕКСТОВ НА ОСНОВЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ
pdf

Ключевые слова

классификатор, метод опорных векторов, социальные сети.

Аннотация

В статье представлены результаты исследования методов текстового анализа с использованием таких методов машинного обучения, как «Метод опорных векторов», «Наивный байесовский классификатор» и «Метод случайных деревьев». Также представлены результаты исследования, использованные при анализе смысла текста, а также результаты экспериментов, в том числе собранные кейсы и процесс моделирования. Кроме того, возникла идея создания фильтра путем их классификации с целью использования современных средств массовой информации при доставке новостей, неограниченного количества информации в социальных сетях без отрицательного воздействия на психологию людей. В статье определены понятия кластеризации, классификации. И есть возможность проанализировать работу авторов, которые работали в этой сфере, чтобы улучшить качество работы, используя опыт этих авторов. В качестве научной новизны работы в статье рассматривается вероятность правильности анализа корпуса на казахском языке. То есть с помощью методов машинного обучения можно было определить чувствительность коротких текстов на казахском языке. Наиболее эффективные методы для коротких текстов на казахском языке были определены с использованием машинных алгоритмов, таких как NBC, SVM. Результаты корпуса на казахском языке во время применения каждого алгоритма отслеживались. Точность была достигнута за счет объединения работы алгоритмов.

Ключевые слова: классификатор, метод опорных векторов, социальные сети.

 

https://doi.org/10.51775/1999-9801_2021_52_1_138
pdf