ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ВИЯВЛЕННЯ УКРАЇНОМОВНИХ ФЕЙКОВИХ НОВИН В КІБЕРПРОСТОРІ СОЦІАЛЬНИХ МЕРЕЖ НА ОСНОВІ МЕТОДІВ МАШИННОГО НАВЧАННЯ ТА ОБРОБКИ ПРИРОДНОЇ МОВИ
DOI:
https://doi.org/10.28925/2663-4023.2026.32.1120Ключові слова:
фейкові новини, обробка природної мови, машинне навчання, українська мова, Sentence-BERT, Support Vector MachineАнотація
У статті розглянуто проблему автоматизованого виявлення фейкових новин в україномовному інформаційному просторі, що набула особливої актуальності в умовах гібридної війни та інтенсивного використання дезінформації як інструменту інформаційного впливу. Метою дослідження є розробка та експериментальна перевірка ефективної системи класифікації новин українською мовою з використанням методів обробки природної мови та машинного навчання. У вступному розділі обґрунтовано актуальність теми, визначено об’єкт і предмет дослідження, сформульовано мету та основні завдання роботи. У розділі аналізу сучасних досліджень здійснено огляд наявних підходів до виявлення фейкових новин, зокрема класичних алгоритмів машинного навчання, глибинних нейронних мереж і трансформерних моделей, а також окреслено їхні обмеження у контексті української мови.
У теоретичному розділі систематизовано методи автоматичного аналізу текстів, визначено особливості україномовного контенту та проблеми, пов’язані з нестачею розмічених корпусів і мовних ресурсів. Методичний розділ присвячено опису повного конвеєра дослідження: збору та попередньої обробки новинних текстів, очищення, токенізації та лематизації з використанням інструментів, адаптованих до української мови, а також побудові семантичних векторних подань за допомогою моделі Sentence-BERT. Для класифікації текстів реалізовано та порівняно кілька моделей машинного навчання, зокрема Logistic Regression, Random Forest, Support Vector Machine та XGBoost, із використанням крос-валідації та оптимізації гіперпараметрів.
У розділі результатів наведено експериментальну оцінку якості моделей за метриками accuracy, precision, recall, F1-score та ROC-AUC. Показано, що найкращі результати демонструє модель SVM, яка досягає точності класифікації 93,2% навіть за умов дисбалансу класів. Також проаналізовано часові та обчислювальні характеристики запропонованого підходу та можливості його практичного застосування. У висновках підсумовано основні результати дослідження, підтверджено досягнення поставленої мети та окреслено перспективи подальших робіт, зокрема розширення системи до мультимовного середовища та підвищення інтерпретованості моделей. Запропоноване рішення може бути використане для медіамоніторингу, фактчекінгу та підвищення інформаційної безпеки.
Завантаження
Посилання
Lipianina-Honcharenko, K., Soia, M., Yurkiv, K., & Ivasechko, A. (2023). Evaluation of the effectiveness of machine learning methods for detecting disinformation in Ukrainian text data. CEUR Workshop Proceedings, 3702, Paper 9. https://ceur-ws.org/Vol-3702/paper9.pdf
Farokhian, M., Rafe, V., & Veisi, H. (2022). Fake news detection using parallel BERT deep neural networks. arXiv. https://arxiv.org/abs/2204.04793
Khairova, N., Galassi, A., Lo Scudo, F., Ivasiuk, B., & Redozub, I. (2024). Unsupervised approach for misinformation detection in Russia–Ukraine war news. CEUR Workshop Proceedings, 3722, Paper 3. https://ceur-ws.org/Vol-3722/paper3.pdf
StopFake. (n.d.). About us. https://www.stopfake.org/uk/pro-nas/
Lendyuk, D. T., & Lipianina-Honcharenko, H. V. (2024). Ensemble learning of classifiers for online detection of disinformation. Tavria Scientific Bulletin. Series: Technical Sciences, (6), 46–63. https://doi.org/10.32782/tnv-tech.2024.6.6
Paraschiv, M., et al. (2022). A unified graph-based approach to disinformation detection using contextual and semantic relations. Proceedings of the International AAAI Conference on Web and Social Media, 16. https://doi.org/10.48550/arXiv.2109.11781
Monti, F., et al. (2019). Fake news detection on social media using geometric deep learning. arXiv. https://doi.org/10.48550/arXiv.1902.06673
Gong, S., et al. (2023). Fake news detection through graph-based neural networks: A survey. arXiv. https://doi.org/10.48550/arXiv.2307.12639
Papadopoulou, O., et al. (2022). MeVer NetworkX: Network analysis and visualisation for tracing disinformation. Future Internet, 14(5), 147. https://doi.org/10.3390/fi14050147
Soga, K., Yoshida, S., & Muneyasu, M. (2024). Graph-based interpretability for fake news detection through topic- and propagation-aware visualisation. Computation, 12(4), 82. https://doi.org/10.3390/computation12040082
Luo, H., Cai, M., & Cui, Y. (2021). Spread of misinformation in social networks: Analysis based on Weibo tweets. Security and Communication Networks, 2021, 7999760. https://doi.org/10.1155/2021/7999760
Béres, F., et al. (2023). Network embedding aided vaccine skepticism detection. Applied Network Science, 8(1), 11. https://doi.org/10.1007/s41109-023-00534-x
Liu, P., et al. (2025). A comparison between Independent Cascade and SIR models. Proceedings of the AAAI Conference on Artificial Intelligence, 39(1). https://doi.org/10.1609/aaai.v39i1.32028
Muñoz, P., Díez, F., & Bellogín, A. (2024). Modeling disinformation networks on Twitter: Structure, behavior, and impact. Applied Network Science, 9(1), 4. https://doi.org/10.1007/s41109-024-00610-w
Su, T., Macdonald, C., & Ounis, I. (2022). Leveraging social network embeddings for fake news detection on Twitter. arXiv. https://doi.org/10.48550/arXiv.2211.10672
Schiffrin, A., et al. (2022). AI startups and the fight against mis/disinformation online: An update. German Marshall Fund of the United States
Shu, K., Sliva, A., Wang, S., Tang, J., & Liu, H. (2017). Fake news detection on social media: A data mining perspective. ACM SIGKDD Explorations Newsletter, 19(1), 22–36. https://doi.org/10.1145/3137597.3137600
Zhou, X., & Zafarani, R. (2020). A survey of fake news: Fundamental theories, detection methods, and opportunities. ACM Computing Surveys, 53(5), 109. https://doi.org/10.1145/339504
Stanford NLP Group. (n.d.). Stanza NLP toolkit. https://stanfordnlp.github.io/stanza/
Kaggle. (n.d.). Fake and real news dataset. https://www.kaggle.com/datasets/zepopo/ukrainian-fake-and-true-news
Skupriienko, S. (n.d.). Ukrainian stop words. https://github.com/skupriienko/Ukrainian-Stopwords/blob/master/stopwords_ua.txt
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Марта Грудзинська, Вікторія Висоцька, Любомир Чирун

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.