TINYBERT З CROSS-ATTENTION + LORA + BI-GRU: КОМПАКТНА НЕЙРОМЕРЕЖЕВА АРХІТЕКТУРА ДЛЯ РОЗПІЗНАВАННЯ ФЕЙКОВИХ НОВИН
DOI:
https://doi.org/10.28925/2663-4023.2025.29.908Ключові слова:
виявлення фейкових новин, TinyBERT, перехресна увага, LoRA, Bi-GRU, обробка природної мови, трансформерні моделі, AI-фактчекінгАнотація
У роботі запропоновано компактну нейромережеву архітектуру TinyBERT з механізмом перехресної уваги (Cross-Attention), адаптацією низького рангу (LoRA) та двонапрямним рекурентним шаром Bi-GRU для задачі автоматичного розпізнавання фейкових новин. Розвиток цифрового інформаційного простору спричинив різке зростання кількості фейків, а класичні методи факт-чекінгу вже не здатні ефективно протистояти такій динаміці. Наявні нейромережеві підходи, що базуються на великих трансформерних моделях, часто непридатні до практичного застосування через надмірну ресурсозатратність та нездатність явно аналізувати семантичну невідповідність між заголовком і текстом новини. Запропонована модель усуває ці обмеження завдяки використанню дистильованого трансформера TinyBERT, що значно зменшує обчислювальні вимоги, та спеціалізованого модуля Cross-Attention, який забезпечує чутливість до невідповідностей у заголовку й тексті. Використання LoRA-доповнень мінімізує кількість параметрів, що тренуються, прискорюючи процес донавчання, а додавання Bi-GRU дозволяє зберігати контекстуальну інформацію послідовностей. Експериментальне дослідження, виконане на наборі Fake News Classification, продемонструвало, що ця модель перевершує класичні алгоритми машинного навчання, досягнувши точності 99%, F1-score 0,985 і ROC AUC 0,998. Завдяки низьким ресурсним витратам, швидкій адаптації до нових тематик і високій інтерпретованості рішень, модель є перспективним рішенням для інтеграції в сервіси факт-чекінгу в реальному часі.
Завантаження
Посилання
Yoon, S., et al. (2021). Learning to detect incongruence in news headline and body text via a graph neural network. IEEE Access, 9, 36195–36206. https://doi.org/10.1109/access.2021.3062029
Jiao, X., et al. (2020). TinyBERT: Distilling BERT for natural language understanding. Findings of the Association for Computational Linguistics: EMNLP 2020. https://doi.org/10.18653/v1/2020.findings-emnlp.372
Ye, H., et al. (2025). LoRA-Adv: Boosting text classification in large language models through adversarial low-rank adaptations. IEEE Access, 1. https://doi.org/10.1109/access.2025.3579539
Taher, Y., Moussaoui, A., & Moussaoui, F. (2022). Automatic fake news detection based on deep learning, FastText and news title. International Journal of Advanced Computer Science and Applications, 13(1). https://doi.org/10.14569/ijacsa.2022.0130118
Mishra, R., & Setty, V. (2019). SADHAN: Hierarchical attention networks to learn latent aspect embeddings for fake news detection. In Proceedings of the 2019 ACM SIGIR International Conference on Theory of Information Retrieval (ICTIR ’19) (pp. 197–204). ACM. https://doi.org/10.1145/3341981.3344229
Shu, K., et al. (2020). Hierarchical propagation networks for fake news detection: Investigation and exploitation. Proceedings of the International AAAI Conference on Web and Social Media, 14, 626–637. https://doi.org/10.1609/icwsm.v14i1.7329
Chang, Q., Li, X., & Duan, Z. (2024). Graph global attention network with memory: A deep learning approach for fake news detection. Neural Networks, 106115. https://doi.org/10.1016/j.neunet.2024.106115
Qawasmeh, E., Tawalbeh, M., & Abdullah, M. (2019). Automatic identification of fake news using deep learning. In 2019 Sixth International Conference on Social Networks Analysis, Management and Security (SNAMS) (pp. 1–7). IEEE. https://doi.org/10.1109/snams.2019.8931873
Dun, Y., et al. (2021). KAN: Knowledge-aware attention network for fake news detection. Proceedings of the AAAI Conference on Artificial Intelligence, 35(1), 81–89. https://doi.org/10.1609/aaai.v35i1.16080
Alghamdi, J., Lin, Y., & Luo, S. (2024). Enhancing hierarchical attention networks with CNN and stylistic features for fake news detection. Expert Systems with Applications, 125024. https://doi.org/10.1016/j.eswa.2024.125024
Zhang, W., et al. (2024). Cross-attention multi-perspective fusion network-based fake news censorship. Neurocomputing, 128695. https://doi.org/10.1016/j.neucom.2024.128695
Maham, S., et al. (2024). ANN: Adversarial news net for robust fake news classification. Scientific Reports, 14(1). https://doi.org/10.1038/s41598-024-56567-4
Zhou, D., et al. (2024). GS2F: Multimodal fake news detection utilizing graph structure and guided semantic fusion. ACM Transactions on Asian and Low-Resource Language Information Processing. https://doi.org/10.1145/3708536
Kuntur, S., et al. (2024). Under the influence: A survey of large language models in fake news detection. IEEE Transactions on Artificial Intelligence, 1–21. https://doi.org/10.1109/tai.2024.3471735
Kabir, M. M., et al. (2025). CUET-NLP_MP@DravidianLangTech 2025: A transformer and LLM-based ensemble approach for fake news detection in Dravidian. In Proceedings of the Fifth Workshop on Speech, Vision, and Language Technologies for Dravidian Languages (pp. 420–426). ACL. https://doi.org/10.18653/v1/2025.dravidianlangtech-1.75
Kaggle. (2023, October 8). Fake news classification.
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Іван Пелещак, Василь Литвин, Вікторія Висоцька, Олексій Хобор

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.