Применение перестановочного метода к оценке прогностической способности моделей пространственного распределения концентраций меди и железа в верхнем слое почвы

№2 (2022)

Сергеев А.П., Буторова А.С., Шичкин А.В., Буевич А.Г., Баглаева Е.М., Субботина И.Е.

УДК 504.064.2.001.18
https://doi.org/10.47148/1609-364X-2022-2-42-53

АннотацияОб авторахСписок литературы
В статье предложено применение перестановочного метода к оценке прогностической способности моделей на основе искусственных нейронных сетей. Для апробации этого метода были реализованы три модели: многослойный персептрон, сеть радиально-базисных функций, нейронная сеть с обобщенной регрессией. Для моделирования были использованы данные о пространственном распределении меди и железа в верхнем слое почвы (глубина 0,05 м) на территории субарктического города Ноябрьск, Ямало-Ненецкий автономный округ, Россия. Всего было отобрано 237 проб почвы. Для моделирования данные о концентрации меди и железа были разбиты на два подмножества: тренировочное и тестовое. Моделируемые пространственные наборы данных сравнивались с наблюдаемыми значениями тестового подмножества. Для оценки работоспособности построенных моделей использовались три подхода: 1) расчет коэффициентов корреляции, индексов ошибок или согласия, 2) графический подход (диаграмма Тейлора), 3) рандомизационная оценка вероятности получить расхождение между наблюдаемым и смоделированным наборами данных в предположении, что оба этих набора данных извлечены из одной и той же популяции. Для рандомизационного алгоритма были использованы две статистики: разность средних и коэффициент корреляции. Перестановочный метод показал свою продуктивность, так как позволил оценить значимость расхождения между наблюдаемыми и предсказанными наборами данных.
Сергеев Александр Петрович
Кандидат физико-математических наук
Ведущий научный сотрудник, и.о. заведующего лабораторией Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20
е-mail: sergeev@ecko.uran.ru

Буторова Анастасия Сергеевна
Инженер-исследователь Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20;
Aспирант 1 курса Института радиоэлектроники и информационных технологий – РтФ Уральского федерального университета им. Б.Н. Ельцина
620002 г. Екатеринбург, ул. Мира, д. 19
е-mail: amoskalyova11@yandex.ru

Шичкин Андрей Васильевич
Научный сотрудник Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20
е-mail: and@ecko.uran.ru

Буевич Александр Геннадьевич
Научный сотрудник Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20
е-mail: bag@ecko.uran.ru

Баглаева Елена Михайловна
Кандидат физико-математических наук
Cтарший научный сотрудник Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20
е-mail: e.m.baglaeva@urfu.ru

Субботина Ирина Евгеньевна
Кандидат физико-математических наук
Научный сотрудник Института промышленной экологии УрО РАН
620990 г. Екатеринбург, ул. С. Ковалевской, д. 20
е-mail: iesub@mail.ru

  1. Субботина И.Е., Буевич А.Г., Сергеев А.П., Шичкин А.В., Баглаева Е.М., Ремезова М.С. Двухшаговый комбинированный алгоритм повышения точности прогнозирования концентрации метана в атмосферном воздухе на основе нейронной сети NARX и последующего прогнозирования невязок // Арктика: Экология и экономика. – – № 2 (38). – C. 59–67. DOI:10.25283/2223-4594-2020-2-59-67.
  2. Ali I., Alharbi O.M.L., ALOthman Z.A., Al-Mohaimeed A.M., Alwarthan  A. Modeling of fenuron pesticide adsorption on CNTs for mechanistic insight and removal in water // Environmental Research. – 2019. – Vol. 170. – P. 389–397. DOI:10.1016/j.envres.2018.12.066.
  3. Baglaeva E.M., Sergeev A.P., Shichkin A.V., Buevich  A. G. The extraction of the training subset for the spatial distribution modelling of the heavy metals in topsoil // Catena. – 2021. – Vol. 207. – 105699. DOI:10.1016/j.catena.2021.105699.
  4. Berry K.J., Johnston J.E., Mielke P.W., Johnston L.A. Permutation methods. Part II // Wiley Interdisciplinary Reviews: Computational Statistics. – 2018. – Vol. 10. – Iss. 3. – e1429. DOI:10.1002/wics.1429.
  5. Broomhead D.S., Lowe  D. Radial basis functions, multi-variable functional interpolation and adaptive networks. – Malvern : Royals Signals & Radar Establishment, 1988.– 34 p.
  6. Fernández Jaramillo J.M., Mayerle R. Sample selection via angular distance in the space of the arguments of an artificial neural network // Computers and Geosciences. – 2018. – Vol. 114. – P. 98–106. DOI:10.1016/j.cageo.2018.02.003.
  7. Fişek M.H., Barlas Z. Permutation tests for goodness-of-fit testing of mathematical models to experimental data // Social Science Research. – 2013. – Vol. 42. – Iss. 2. – P. 482–495. DOI:10.1016/j.ssresearch.2012.09.010.
  8. Goovaerts P. Geostatistics in soil science: state-of-the-art and perspectives // Geoderma. –1999. – Vol. 89. – P. 1–45. DOI:10.1016/S0016-7061(98)00078-0
  9. Graf R., Zhu S., Sivakumar B. Forecasting river water temperature time series using a wavelet–neural network hybrid modelling approach // Journal of Hydrology. – 2019. – Vol. 578. –124115. DOI:10.1016/j.jhydrol.2019.124115.
  10. Hamilton S.H., Fu B., Guillaume J.H.A., Badham J., Elsawah S., Gober P., Hunt R.J., Iwanaga T., Jakeman A.J., Ames D.P., Curtis A., Hill M.C., Pierce S., Zare F. A framework for characterising and evaluating the effectiveness of environmental modelling // Environmental Modelling & Software. – 2019. – Vol. 118. – P. 83–98. DOI:10.1016/j.envsoft.2019.04.008.
  11. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. – New York : Springer, 2009.–745 p.
  12. Lambiotte R., Rosvall M., Scholtes I. From networks to optimal higher-order models of complex systems // Nature Physics. – 2019. – Vol. 15. – P. 313–320. DOI:10.1038/s41567-019-0459-y.
  13. Liodakis S., Kyriakidis P., Gaganis P. Conditional Latin Hypercube Simulation of (Log) Gaussian Random Fields // Mathematical Geosciences. – 2018. – Vol. 50. – P. 127–146. DOI:10.1007/s11004-017-9715-9.
  14. McKay M.D., Beckman R.J., Conover W.J. Comparison of Three Methods for Selecting Values of Input Variables in the Analysis of Output from a Computer Code // Technometrics. – 1979. – Vol. 21. – Iss. 2. – P. 239–245. DOI: 1080/00401706.1979.10489755.
  15. Mielke P.W., Berry K.J. Permutation Methods. A Distance Function Approach. – New York : Springer, 2001. DOI:10.1007/978-1-4757-3449-2.
  16. Moré J.J. The Levenberg-Marquardt algorithm: Implementation and theory // Numerical Analysis. (Lecture Notes in Mathematics. Vol. 630.) / Ed. G.A. Watson. – Berlin, Heidelberg : Springer, 1978. – P. 105–116. DOI:10.1007/BFb0067700.
  17. Nath A., Subbiah K. The role of pertinently diversified and balanced training as well as testing data sets in achieving the true performance of classifiers in predicting the antifreeze proteins // Neurocomputing. – 2018. – Vol. 272. – P. 294–305. DOI:10.1016/j.neucom.2017.07.004.
  18. Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. – Washington : Spartan Books, 1962.– 616 p.
  19. Ross S.M. Simulation, bootstrap statistical methods, and permutation tests // Introduction to Probability and Statistics for Engineers and Scientists. – Amsterdam : Academic Press; Elsevier, 2021. – P. 619–647. DOI:10.1016/B978-0-12-824346-6.00024-7.
  20. Sakizadeh M., Mirzaei R., Ghorbani H. Support vector machine and artificial neural network to model soil pollution: a case study in Semnan Province, Iran // Neural Computing and Applications. – – Vol. 28. – P. 3229–3238.
  21. Samadianfard S., Asadi E., Jarhan S., Kazemi H., Kheshtgar S., Kisi O., Sajjadi S., Manaf A.A. Wavelet neural networks and gene expression programming models to predict short-term soil temperature at different depths // Soil and Tillage Research. – 2018. – Vol. 175. – P. 37–50. DOI:10.1016/j.still.2017.08.012.
  22. Sergeev A.P., Buevich A.G., Baglaeva E.M., Shichkin A.V. Combining spatial autocorrelation with machine learning increases prediction accuracy of soil heavy metals // Catena. – 2019. – Vol. 174. – P. 425–435. DOI: 10.1016/j.catena.2018.11.037.
  23. Simão M.L., Videiro P.M., Silva P.B.A., Assad L.P.F., Sagrilo L.V.S. Application of Taylor diagram in the evaluation of joint environmental distributions’ performances // Marine Systems & Ocean Technology. – 2020. – Vol. 15. – P. 151–159. DOI:10.1007/s40868-020-00081-5.
  24. Specht D.F. A general regression neural network // IEEE Transactions on Neural Networks. – 1991. – Vol. 2. – No. 6. – P. 568–576.
  25. Tan A.P., Cheong C.H., Lee T., Seng K.Y., Teo C.J. Computer modelling of heat strain responses of exercising personnel in tropical climate // Computers in Biology and Medicine. – 2021. – Vol. 134. – 104530. DOI:10.1016/j.compbiomed.2021.104530.
  26. Taylor K. Summarizing multiple aspects of model performance in a single diagram // Journal of Geophysical Research Atmospheres. – 2001. – Vol. 106. – Iss. D7. – P. 7183–7192. DOI:10.1029/2000JD900719.
  27. Taylor A.B., MacKinnon D.P. Four applications of permutation methods to testing a single-mediator model // Behavior Research Methods. – 2012. – Vol. 44. – Iss. 3. – P. 806–844. DOI:10.3758/s13428-011-0181-x.
  28. Ucun Ozel H., Gemici B. T., Gemici E., Ozel H.B., Cetin M., Sevik H. Application of artificial neural networks to predict the heavy metal contamination in the Bartin River // Environmental Science and Pollution Research. – 2020. – Vol. 27. – P. 42495–42512. DOI:10.1007/s11356-020-10156-w.
  29. Wang F., Gao J., Zha Y. Hyperspectral sensing of heavy metals in soil and vegetation: Feasibility and challenges // ISPRS Journal of Photogrammetry and Remote Sensing. – 2018. – Vol. 136. – P. 73–84. DOI:10.1016/j.isprsjprs.2017.12.003.
  30. Willmott C.J. On the validation of models // Physical Geography. – 1981. – Vol. 2. – P. 184–194. DOI:1080/02723646.1981.10642213.
  31. Willmott C.J., Robeson S.M., Matsuura K. A refined index of model performance // International Journal of Climatology. – 2012. – Vol. 32. – Iss. 13. – P. 2088–2094. DOI:10.1002/joc.2419.
  32. Xu W., Peng H., Zeng X., Zhou F., Tian X., Peng X. Deep belief network-based AR model for nonlinear time series forecasting // Applied Soft Computing. – 2019. – Vol. 77. – P. 605–621. DOI:10.1016/J.ASOC.2019.02.006.
  33. Ziggah Y.Y., Youjian H., Tierra A.R., Laari P. B. Coordinate Transformation between Global and Local Data Based on Artificial Neural Network with K-Fold Cross-Validation: A Case Study , Ghana  // Earth Sciences Research Journal. – 2019. – Vol. 23. – Iss. 1. – P. 67–77. doi:10.15446/esrj.v23n1.63860.

Ключевые слова: перестановочный метод, рандомизация, прогнозируемые значения, наблюдаемые значения, пространственное распределение, оценка прогностической способности, искусственные нейронные сети

Раздел: Моделирование геообъектов и геопроцессов