КЛАСТЕРИЗАЦІЯ СТАНЦІЙ ДЛЯ ВИЯВЛЕННЯ НЕСТАБІЛЬНОСТІ ДАНИХ У МЕРЕЖІ МОНІТОРИНГУ ЯКОСТІ АТМОСФЕРНОГО ПОВІТРЯ

Автор(и)

DOI:

https://doi.org/10.28925/2663-4023.2026.32.1198

Ключові слова:

Data Mining, K-Means, екологічний моніторинг, моніторинг атмосферного повітря, інформаційно-аналітична система, інтелектуальна технологія, інформаційні технології, надійність та достовірність даних

Анотація

У роботі запропоновано та апробовано підхід до автоматизованого виявлення нестабільності даних у мережі моніторингу якості атмосферного повітря на основі методів інтелектуального аналізу даних. На відміну від традиційних перевірок за пороговими значеннями, підхід орієнтований на поведінкові ознаки «якості потоку вимірювань» (повнота, частка пропусків, варіативність сигналу та ознаки «залипання» сенсора), розраховані на погодинних агрегатах. Об’єктом кластеризації є пари «станція та сенсор», що дає змогу локалізувати проблеми як на рівні станції, так і на рівні окремих вимірювальних каналів. Для групування застосовано алгоритм K-Means із попереднім масштабуванням ознак; оптимальну кількість кластерів визначено за методами «ліктя» та коефіцієнтом силуету. Для інтерпретації кластерів використано проєкцію на двох головних компонентах, що відображають індекс доступності/неповноти даних та індекс динаміки сигналу (варіативність проти «залипання»). Експеримент на реальних даних продемонстрував наявність стійких профілів деградації вимірювань і дозволив сформувати перелік надійних станцій та проблемних каналів (зокрема, сенсорів із високою часткою пропусків або з близькою до нуля погодинною варіацією). Практична цінність полягає у можливості інтеграції методу в інформаційно-аналітичні системи екологічного моніторингу як модуль контролю якості даних із подальшим використанням результатів для відбору референтних сенсорів, калібрування та побудови прогнозних моделей.

Завантаження

Дані завантаження ще не доступні.

Посилання

European Environment Agency. (2022). Air quality in Europe 2022. https://doi.org/10.2800/488115

Agbo, B., Al-Aqrabi, H., Hill, R., & Alsboui, T. (2022). Missing data imputation in the Internet of Things sensor networks. Future Internet, 14(5), Article 143. https://doi.org/10.3390/fi14050143

Jiao, W., Hagler, G., Williams, R., Sharpe, R., Brown, R., Garver, D., Judge, R., Caudill, M., Rickard, J., Davis, M., Weinstock, L., Zimmer-Dauphinee, S., & Buckley, K. (2016). Community Air Sensor Network (CAIRSENSE) project: Evaluation of low-cost sensor performance in a suburban environment in the southeastern United States. Atmospheric Measurement Techniques, 9(11), 5281–5292. https://doi.org/10.5194/amt-9-5281-2016

U.S. Environmental Protection Agency. (2025, May 1). How to use air sensors: Air sensor guidebook. https://www.epa.gov/air-sensor-toolbox/how-use-air-sensors-air-sensor-guidebook

Buelvas, J., Múnera, D., Tobón V., D. P., Aguirre, J., & Gaviria, N. (2023). Data quality in IoT-based air quality monitoring systems: A systematic mapping study. Water, Air, & Soil Pollution, 234(4), Article 248. https://doi.org/10.1007/s11270-023-06127-9

Chen, M., Zhu, H., Chen, Y., & Wang, Y. (2022). A novel missing data imputation approach for time series air quality data based on logistic regression. Atmosphere, 13(7), 1044. https://doi.org/10.3390/atmos13071044

International Organization for Standardization. (2008). ISO/IEC 25012:2008. Software engineering—Software product quality requirements and evaluation (SQuaRE)—Data quality model. https://www.iso.org/standard/35736.html

Wand, Y., & Wang, R. Y. (1996). Anchoring data quality dimensions in ontological foundations. Communications of the ACM, 39(11), 86–95. https://doi.org/10.1145/240455.240479

Scikit-learn developers. (n.d.). StandardScaler. In Scikit-learn. Retrieved March 2026, from https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler

Scikit-learn developers. (n.d.). KMeans. In Scikit-learn. Retrieved March 2026, from https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans

Shevchenko, D. V., & Holub, B. L. (2025). Air quality monitoring in real time. Mathematical Machines and Systems, (1), 103–112.

Shevchenko, D. V., & Holub, B. L. (2025). Application of data mining methods for multidimensional analysis of atmospheric air quality based on environmental data. Science and Technology Today. Series: Engineering, 8(49), 1801–1810.

Shevchenko, D. V., & Holub, B. L. (2025). Multidimensional analytics of environmental data: Application of OLAP in monitoring systems. Mathematical Machines and Systems, (3–4), 54–65

Downloads


Переглядів анотації: 63

Опубліковано

2026-03-26

Як цитувати

Шевченко, Д., Голуб, Б., & Бородкіна, І. (2026). КЛАСТЕРИЗАЦІЯ СТАНЦІЙ ДЛЯ ВИЯВЛЕННЯ НЕСТАБІЛЬНОСТІ ДАНИХ У МЕРЕЖІ МОНІТОРИНГУ ЯКОСТІ АТМОСФЕРНОГО ПОВІТРЯ. Електронне фахове наукове видання «Кібербезпека: освіта, наука, техніка», 4(32), 1054–1064. https://doi.org/10.28925/2663-4023.2026.32.1198