ПОРІВНЯННЯ МЕТОДІВ ПРОГНОЗУВАННЯ КОНЦЕНТРАЦІЙ PM₁₀ В КРИВОМУ РОЗІ В ЗИМОВИЙ ПЕРІОД
DOI:
https://doi.org/10.20998/2079-0821.2025.02.13Ключові слова:
прогнозування, дрібнодисперсні частки, PM₁₀, лінійна регресія, Random Forest, важливість змінних, якість повітряАнотація
У статті порівнюються два підходи для прогнозування концентрації дрібнодисперсних частинок PM₁₀ - класичне статистичне моделювання (множинна лінійна регресі, МЛР) та сучасний алгоритм машинного навчання Random Forest (RF). Об’єктом дослідження обрано одне з найбільших промислових міст України - Кривий Ріг, яке відоме своєю складною екологічною ситуацією. Розглянуто зимовий період 2024-2025 рр., протягом якого виконано безперервний моніторинг PM₁₀ та метеорологічних показників за допомогою автоматизованої міні-станції Cairnet із сертифікованими датчиками. Проведено попередню обробку даних (очищення від аномалій, заповнення пропусків, нормалізація) та формування ознак, зокрема введено категоріальні змінні для частини доби, типу дня (вихідний/робочий) та інтенсивності викидів. Обидві моделі показали схожі добові та тижневі цикли концентрації PM₁₀: пікові значення спостерігаються у вечірній і нічний час, найнижчі - вдень, що узгоджується з очікуваннями та літературними даними. Водночас точність прогнозу суттєво різниться: Random Forest забезпечив значно вищу детермінацію (R²≈0,72 проти R²≈0,27 у регресії) і вдвічі меншу середню абсолютну похибку. Наведено порівняння важливості факторів для обох моделей: Random Forest виділив атмосферний тиск, температуру та вологість як ключові чинники, тоді як лінійна регресія приписує найбільшу вагу впровадженим штучним змінним (індикаторам часу доби та інтенсивності викидів). Проаналізовано причини цих розбіжностей з огляду на нелінійні взаємодії та мультиколінеарність. Зроблено висновок, що для високоточного оперативного прогнозування рівня PM₁₀ доцільно застосовувати Random Forest, тоді як проста лінійна модель може використовуватися для швидких попередніх оцінок та інтерпретації впливу окремих факторів.
Посилання
World Health Organization (WHO). WHO Global Air Quality Guidelines: Particulate Matter (PM2.5 and PM10), Ozone, Nitrogen Dioxide, Sulfur Dioxide and Carbon Monoxide. Geneva: WHO; 2021. https://www.who.int/publications/i/item/9789240034228
Directive (EU) 2024/2881 of the European Parliament and of the Council of 23 October 2024 on ambient air quality and cleaner air for Europe (recast). Official Journal of the EU, L 309, 20.11.2024. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX%3A32024L2881&qid=1758282016559
European Environment Agency (EEA). Air Quality in Europe - 2022 Report. EEA Report No.13/2022. Copenhagen, 2022. https://www.eea.europa.eu/en/analysis/publications/air-quality-in-europe-2022
Arnika NGO. Poisonous air: Satellites of the European Space Agency testify to the most polluted areas of Ukraine. News release, 23.11.2020. [Online]. https://arnika.org/en/news/poisonous-air-satellites-of-the-european-space-agency-testify-to-the-most-polluted-areas-of-ukraine
Kamińska J.A. The use of random forests in modelling short-term air pollution effects based on traffic and meteorological conditions: a case study in Wroclaw. Journal of Environmental Management. 2018;217:164-174. https://doi.org/10.1016/j.jenvman.2018.03.094
Rubal S., Kumar D. Evolving differential evolution method with random forest for prediction of air pollution. Procedia Computer Science. 2018;132:824-833. https://doi.org/10.1016/j.procs.2018.05.094
Stoimenova M., et al. Regression trees modeling and forecasting of PM10 air pollution in urban areas. AIP Conference Proceedings. 2017;1895:030005. http://dx.doi.org/10.1063/1.5007364
Chen G., et al. Spatiotemporal patterns of PM10 concentrations over China during 2005-2016: a satellite-based estimation using the random forests approach. Environmental Pollution. 2018;242(A):605-613. https://doi.org/10.1016/j.envpol.2018.07.012
Plocoste T., Laventure S. Forecasting PM10 concentrations in the Caribbean area using machine learning models. Atmosphere. 2023;14(1):134. https://doi.org/10.3390/atmos14010134
Zarate A.R., Rodriguez A.A. Application of Random Forest in a predictive model of PM10 particles in Mexico City. Nature Environment and Pollution Technology. 2024;23(2):711-724. https://neptjournal.com/upload-images/(9)D-1554.pdf
Abuouelezz W., Ali N., Aung Z., Altunaiji A., Shah S.B., Gliddon D. Exploring PM2.5 and PM10 ML forecasting models: a comparative study in the UAE. Scientific Reports. 2025;15:9797. https://doi.org/10.1038/s41598-025-94013-1
Adamenko S.Ya., Arkhypova L.M. Study of patterns of PM2.5 and PM10 changes in Prykarpattia air. Ekologichna Bezpeka ta Pryrodokorystuvannya. 2024;3(51):47-58. https:// ekmair.ukma. edu.ua/items/3fdcfc77-483d-4890-bd28-f11ff41c0a19
Chuhai A.V., Terzeman V.V. Forecasting air pollution of the city of Odesa by nitrogen dioxide. Odessa State Environmental University, 2020. Preprint, 12 p. http://dx.doi.org/10.32782/pcsd-2022-1-12
Gupta N.S., et al. Prediction of air quality index using machine learning techniques: a comparative analysis Journal of Environmental Public Health. 2023;2023:4916267 2001;45(1):5-32. http://dx.doi.org/10.1155/2023/4916267.
Breiman L. Random Forests. Machine Learning https://link.springer.com/article/10.1023/A:1010933404324