Оптимизация разбиения исходных данных для предсказания пространственного распределения хрома нейронной сетью прямого распространения.

№4 (2019)

УДК 504.064.2.001.18

Буевич А.Г., Рахматова А.Ю., Сергеев А.П., Баглаева Е.М., Шичкин А.В., Субботина И.Е., Сергеева М.В., Маркелов Ю.И.

Рецензент: Финкельштейн М.Я., доктор технических наук.

АннотацияОб авторахСписок литературы
В работе предложен подход для оптимизации разбиения исходных данных на обучающее и тестовое подмножества при моделировании пространственного распределения признака методом искусственных нейронных сетей (ИНС). Подход учитывает пространственные неравномерности и разброс значений моделируемой переменной. Исследование выполнено на основе данных, полученных во время почвенного скрининга урбанизированных территорий в Российской субарктической зоне: городах Тарко-Сале и Ноябрьск. Для моделирования был выбран химический элемент хром (Cr). В г. Тарко-Сале были обнаружены области с аномально высоким значением моделируемого элемента. В г. Ноябрьске аномалий в значениях содержания Cr выявлено не было. Методом многослойного перцептрона (МЛП) построены пространственные распределения Cr в поверхностном слое почвы. Структура МЛП была выбрана методом компьютерного симулирования на основе минимизации среднеквадратической ошибки (RMSE). Проведено сравнение моделей, использующих полностью случайное разбиение исходных данных на обучающее и тестовое подмножество, и моделей, которые строились на основе предложенного подхода. Для каждого из подходов вычислялись средняя абсолютная ошибка (MAE), среднеквадратическая ошибка (RMSE) и среднеквадратическая относительная ошибка (RMSRE). Для обеих территорий модели, использующие предложенный подход, показали более точные результаты (улучшение составило до 50%).

Буевич Александр Геннадьевич, инженер лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: bagalex3@gmail.com.

Рахматова Анна Юрьевна, младший научный сотрудник лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: anyarakhmatova@gmail.com.

Сергеев Александр Петрович, кандидат физико-математических наук, и.о. заведующего лабораторией физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: aleksandrpsergeev@gmail.com.

Баглаева Елена Михайловна, кандидат физико-математических наук, старший научный сотрудник лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: elenbaglaeva@gmail.com.

Шичкин Андрей Васильевич, инженер лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: and@ecko.uran.ru.

Субботина Ирина Евгеньевна, кандидат физико-математических наук, научный сотрудник лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: iesub@mail.ru.

Сергеева Марина Викторовна, научный сотрудник лаборатории физики и экологии Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: marin@ecko.uran.ru.

Маркелов Юрий Иванович, кандидат физико-математических наук, начальник ЦКП Института промышленной экологии УрО РАН (ИПЭ УрО РАН). 620219, Екатеринбург, ул. С. Ковалевской, д. 20. E-mail: markelov@ecko.uran.ru.

  1. Sergeev A.P., Buevich A.G., Baglaeva E.M., Shichkin A.V. Combining spatial autocorrelation with machine learning increases prediction accuracy of soil heavy metals // Catena. – 2019. – Vol. 174. – P. 425-435.
  2. Guo G.H., Wu F., Xie F., Zhang R. Spatial distribution and pollution assessment of heavy metals in urban soils from southwest China // Journal of Environmental Sciences. – 2012. – Vol. 24, Issue 3. – P. 410-418.
  3. Liu F., He X., Zhou L. Application of generalized regression neural network residual kriging for terrain surface interpolation // Proc. SPIE 7492, International Symposium on Spatial Analysis, Spatial-Temporal Data Modeling, and Data Mining. – 2009. – 74925F.
  4. Land cover and landscape as predictors of groundwater contamination: a neural-network modelling approach applied to Dobrogea, Romania / R.R. Shaker [et al.] // Journal of Environmental Protection and Ecology. – 2010. – Vol. 11, Issue 1. – P. 337-348.
  5. Shaker R.R., Ehlinger T.J. Exploring non-linear relationships between landscape and aquatic ecological condition in southern Wisconsin: A GWR and ANN approach // International Journal of Applied Geospatial Research. – 2014. – Vol. 5, Issue 4. – P. 1-20.
  6. Use of trans-Gaussian kriging for national soil geochemical mapping in Ireland / C. Zhang [et al.] // Geochemistry: Exploration Environment Analysis. – 2008. – Vol. 8, Issue 3-4. – P. 255-265.
  7. Koike K., Matsuda S., Suzuki T., Ohmi M. Neural Network-Based Estimation of Principal Metal Contents in the Hokuroku District, Northern Japan, for Exploring Kuroko-Type Deposits // Natural Resources Research. – 2002. – Vol. 11, Issue 2. – P. 135-156.
  8. Samanta B., Ganguli R., Bandopadhyay S. Comparing the Predictive Performance of Neural Networks with Ordinary Kriging in a Bauxite Deposit // Transactions of Institute of Mining and Metallurgy, Section A, Mining Technology. – 2005. – Vol. 114, Issue 3. – P. 129-139.
  9. Spatial prediction of soil organic matter content integrating artificialneural network and ordinary kriging in Tibetan Plateau / F. Dai [et al.] // Ecological Indicators. – 2014. – Vol. 45. – P. 184-194.
  10. Falamaki A. Artificial neural network application for predicting soil distribution coefficient of nickel // Journal of Environmental Radioactivity. – 2014. – Vol. 115. – P. 6-12.
  11. Li Y., Li C., Tao J.-J., Wang L.-D. Study on Spatial Distribution of Soil Heavy Metals in Huizhou City Based on BP-ANN Modeling and GIS // Procedia Environmental Sciences. – 2011. – Vol. 10. – P. 1953-1960.
  12. Qualitative and quantitative investigation of chromium-polluted soils by laser-induced breakdown spectroscopy combined with neural networks analysis / J.-B. Sirven [et al.] // Anal Bioanal Chem. – 2006. – Vol. 385, Issue 2. – P. 256-262.
  13. Anagu I., Ingwersen J., Utermann J., Streck T. Estimation of heavy metal sorption in German soils using artificial neural networks // Geoderma. – 2009. – Vol. 152. – P. 104-112.
  14. Добровольский Г.В., Урусевская И.С. География почв. – М. : Изд-во МГУ ; Изд-во «КолосС», 2004. – 460 с.
  15. Геохимия окружающей среды / Ю.Е. Сает [и др.]. – М. : Недра, 1990. – 335 с.
  16. Справочник по геохимии / Г.В. Войткевич [и др.]. – М. : Недра, 1990. – 479 с.

Ключевые слова: искусственные нейронные сети, многослойный перцептрон, моделирование, разбиение, выборка.

Раздел: Моделирование геообъектов и геопроцессов