ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ВИЯВЛЕННЯ УКРАЇНОМОВНИХ ФЕЙКОВИХ НОВИН В КІБЕРПРОСТОРІ СОЦІАЛЬНИХ МЕРЕЖ НА ОСНОВІ МЕТОДІВ МАШИННОГО НАВЧАННЯ ТА ОБРОБКИ ПРИРОДНОЇ МОВИ

Марта Грудзинська; Вікторія Висоцька; Любомир Чирун

doi:10.28925/2663-4023.2026.32.1120

Автор(и)

Марта Грудзинська Національний університет «Львівська Політехніка» https://orcid.org/0009-0004-5183-2269
Вікторія Висоцька Національний університет «Львівська Політехніка» https://orcid.org/0000-0001-6417-3689
Любомир Чирун Національний університет «Львівська Політехніка» https://orcid.org/0000-0002-9448-1751

DOI:

https://doi.org/10.28925/2663-4023.2026.32.1120

Ключові слова:

фейкові новини, обробка природної мови, машинне навчання, українська мова, Sentence-BERT, Support Vector Machine

Анотація

У статті розглянуто проблему автоматизованого виявлення фейкових новин в україномовному інформаційному просторі, що набула особливої актуальності в умовах гібридної війни та інтенсивного використання дезінформації як інструменту інформаційного впливу. Метою дослідження є розробка та експериментальна перевірка ефективної системи класифікації новин українською мовою з використанням методів обробки природної мови та машинного навчання. У вступному розділі обґрунтовано актуальність теми, визначено об’єкт і предмет дослідження, сформульовано мету та основні завдання роботи. У розділі аналізу сучасних досліджень здійснено огляд наявних підходів до виявлення фейкових новин, зокрема класичних алгоритмів машинного навчання, глибинних нейронних мереж і трансформерних моделей, а також окреслено їхні обмеження у контексті української мови.

У теоретичному розділі систематизовано методи автоматичного аналізу текстів, визначено особливості україномовного контенту та проблеми, пов’язані з нестачею розмічених корпусів і мовних ресурсів. Методичний розділ присвячено опису повного конвеєра дослідження: збору та попередньої обробки новинних текстів, очищення, токенізації та лематизації з використанням інструментів, адаптованих до української мови, а також побудові семантичних векторних подань за допомогою моделі Sentence-BERT. Для класифікації текстів реалізовано та порівняно кілька моделей машинного навчання, зокрема Logistic Regression, Random Forest, Support Vector Machine та XGBoost, із використанням крос-валідації та оптимізації гіперпараметрів.

У розділі результатів наведено експериментальну оцінку якості моделей за метриками accuracy, precision, recall, F1-score та ROC-AUC. Показано, що найкращі результати демонструє модель SVM, яка досягає точності класифікації 93,2% навіть за умов дисбалансу класів. Також проаналізовано часові та обчислювальні характеристики запропонованого підходу та можливості його практичного застосування. У висновках підсумовано основні результати дослідження, підтверджено досягнення поставленої мети та окреслено перспективи подальших робіт, зокрема розширення системи до мультимовного середовища та підвищення інтерпретованості моделей. Запропоноване рішення може бути використане для медіамоніторингу, фактчекінгу та підвищення інформаційної безпеки.

Завантаження

Дані завантаження ще не доступні.

Посилання

Lipianina-Honcharenko, K., Soia, M., Yurkiv, K., & Ivasechko, A. (2023). Evaluation of the effectiveness of machine learning methods for detecting disinformation in Ukrainian text data. CEUR Workshop Proceedings, 3702, Paper 9. https://ceur-ws.org/Vol-3702/paper9.pdf

Farokhian, M., Rafe, V., & Veisi, H. (2022). Fake news detection using parallel BERT deep neural networks. arXiv. https://arxiv.org/abs/2204.04793

Khairova, N., Galassi, A., Lo Scudo, F., Ivasiuk, B., & Redozub, I. (2024). Unsupervised approach for misinformation detection in Russia–Ukraine war news. CEUR Workshop Proceedings, 3722, Paper 3. https://ceur-ws.org/Vol-3722/paper3.pdf

StopFake. (n.d.). About us. https://www.stopfake.org/uk/pro-nas/

Lendyuk, D. T., & Lipianina-Honcharenko, H. V. (2024). Ensemble learning of classifiers for online detection of disinformation. Tavria Scientific Bulletin. Series: Technical Sciences, (6), 46–63. https://doi.org/10.32782/tnv-tech.2024.6.6

Paraschiv, M., et al. (2022). A unified graph-based approach to disinformation detection using contextual and semantic relations. Proceedings of the International AAAI Conference on Web and Social Media, 16. https://doi.org/10.48550/arXiv.2109.11781

Monti, F., et al. (2019). Fake news detection on social media using geometric deep learning. arXiv. https://doi.org/10.48550/arXiv.1902.06673

Gong, S., et al. (2023). Fake news detection through graph-based neural networks: A survey. arXiv. https://doi.org/10.48550/arXiv.2307.12639

Papadopoulou, O., et al. (2022). MeVer NetworkX: Network analysis and visualisation for tracing disinformation. Future Internet, 14(5), 147. https://doi.org/10.3390/fi14050147

Soga, K., Yoshida, S., & Muneyasu, M. (2024). Graph-based interpretability for fake news detection through topic- and propagation-aware visualisation. Computation, 12(4), 82. https://doi.org/10.3390/computation12040082

Luo, H., Cai, M., & Cui, Y. (2021). Spread of misinformation in social networks: Analysis based on Weibo tweets. Security and Communication Networks, 2021, 7999760. https://doi.org/10.1155/2021/7999760

Béres, F., et al. (2023). Network embedding aided vaccine skepticism detection. Applied Network Science, 8(1), 11. https://doi.org/10.1007/s41109-023-00534-x

Liu, P., et al. (2025). A comparison between Independent Cascade and SIR models. Proceedings of the AAAI Conference on Artificial Intelligence, 39(1). https://doi.org/10.1609/aaai.v39i1.32028

Muñoz, P., Díez, F., & Bellogín, A. (2024). Modeling disinformation networks on Twitter: Structure, behavior, and impact. Applied Network Science, 9(1), 4. https://doi.org/10.1007/s41109-024-00610-w

Su, T., Macdonald, C., & Ounis, I. (2022). Leveraging social network embeddings for fake news detection on Twitter. arXiv. https://doi.org/10.48550/arXiv.2211.10672

Schiffrin, A., et al. (2022). AI startups and the fight against mis/disinformation online: An update. German Marshall Fund of the United States

Shu, K., Sliva, A., Wang, S., Tang, J., & Liu, H. (2017). Fake news detection on social media: A data mining perspective. ACM SIGKDD Explorations Newsletter, 19(1), 22–36. https://doi.org/10.1145/3137597.3137600

Zhou, X., & Zafarani, R. (2020). A survey of fake news: Fundamental theories, detection methods, and opportunities. ACM Computing Surveys, 53(5), 109. https://doi.org/10.1145/339504

Stanford NLP Group. (n.d.). Stanza NLP toolkit. https://stanfordnlp.github.io/stanza/

Kaggle. (n.d.). Fake and real news dataset. https://www.kaggle.com/datasets/zepopo/ukrainian-fake-and-true-news

Skupriienko, S. (n.d.). Ukrainian stop words. https://github.com/skupriienko/Ukrainian-Stopwords/blob/master/stopwords_ua.txt