Индивидуальная и парная репрезентативность точек пробоотбора в задачах интерполяции распределения тяжелых металлов в верхнем слое почвы

№ 3 (2023)

УДК 504.064.2.001.18
https://doi.org/10.47148/1609-364X-2023-3-63-70

Баглаева Е.М., Сергеев А.П., Шичкин А.В., Буевич А.Г., Буторова А.С.

АннотацияОб авторахСписок литературы
Статья посвящена проблеме выбора репрезентативного тренировочного подмножества для обучения искусственной нейронной сети в задачах интерполяции распределения тяжелых металлов в верхнем слое почвы. Экологические данные, часто используемые для построения моделей искусственных нейронных сетей, представляют наборы данных в нерегулярных точках. Традиционно разделение исходных данных на обучающее и тестовое подмножество происходит случайным образом, что приводит к ряду проблем. Для отбора в обучающее подмножество предложен способ оценки индивидуальной и коллективной репрезентативности точек, обеспечивающих достоверные данные о содержании элемента в почве на заданной территории. Наиболее представительными по индивидуальной репрезентативности оказались точки с максимальным содержанием элемента, их присутствие в обучающем подмножестве ИНС уменьшает ошибку и повышает корреляцию между результатами модельных расчетов и натурных измерений на тестовом наборе. При оценке парной репрезентативности обнаружены эффекты синергии, при котором включение пары обеспечивает лучшую точность модели) и антисинергии (пара точек представляет меньше информации для описания распределения содержания элементов, чем отдельно точки, входящие в пару). Разные геопозиции сэмплинга несут разную информацию и имеют неодинаковую ценность для интерполяции распределения признака.

Баглаева Елена Михайловна
Кандидат физико-математических наук
Старший научный сотрудник
Институт промышленной экологии УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, д. 20
e-mail: e.m.baglaeva@urfu.ru

Сергеев Александр Петрович
Кандидат физико-математических наук
Ведущий научный сотрудник, и.о. заведующего лабораторией Институт промышленной экологии УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, д. 20
e-mail: sergeev@ecko.uran.ru

Шичкин Андрей Васильевич
Научный сотрудник
Институт промышленной экологии УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, д. 20
e-mail: and@ecko.uran.ru

Буевич Александр Геннадьевич
Научный сотрудник
Институт промышленной экологии УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, д. 20
e-mail: bag@ecko.uran.ru

Буторова Анастасия Сергеевна
Инженер-исследователь
Институт промышленной экологии УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, д. 20
Аспирант 1 курса
Институт радиоэлектроники и информационных
технологий — РтФ Уральского федерального университета
им. Б.Н. Ельцина
620002 Екатеринбург, ул. Мира, д. 19
e-mail: a.s.butorova@urfu.ru

1. Буслаева О.В., Королев В.А. Неопределенности в эколого-геологических системах и их систематизация // Инженерная геология. – 2013. – № 6. – С. 56–62.
2. ГОСТ 17.4.3.01-2017 Межгосударственный стандарт. Охрана природы. Почвы. Общие требования к отбору проб / Введен в действие Приказом Росстандарта от 01.06.2018 № 302-ст. – М. : Стандартинформ, 2018. – 8 с.
3. Кургузов К.В., Фоменко И.К., Сироткина О.Н. Вероятностно-статистические подходы при оценке неопределенности литотехнических систем // Геоэкология. Инженерная геология, гидрогеология, геокриология. – 2020. – № 2. – C. 80–89. DOI: 10.31857/S0869780920020071.
4. Мокрушин А.А., Тарасов Д.А., Сергеев А.П., Буевич А.Г., Баглаева Е.М. Подбор типа и структуры искусственных нейронных сетей для оценки распределения химических элементов в верхнем слое почвы // Экологические системы и приборы. – 2017. – № 8. – С. 36–48.
5. РД 52.18.156-93. Методические указания. Охрана природы. Почвы. Методы отбора представительных проб почвы и оценка загрязнения сельскохозяйственного угодья остаточными количествами пестицидов [Электронный ресурс] / Утвержден и введен в действие Федеральной службой России по гидрометеорологии и мониторингу окружающей среды 01.09.1999 г. – Режим доступа: https://docs.cntd.ru/document/1200041909 (дата обращения: 11.09.2023 г.).
6. Радомская В.И., Бородина Н.А. Оценка антропогенного загрязнения почвы урбанизированной территории на примере города Благовещенска // Геоэкология. Инженерная геология, гидрогеология, геокриология. – 2019. – № 6. – C. 79–93. DOI: 10.31857/S0869-78092019679-93.
7. СанПиН 1.2.3685-21 Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания [Электронный ресурс] / Утверждён Постановлением Главного государственного санитарного врача России от 28.01.2021 г. № 2. – Режим доступа: http://publication.pravo.gov.ru/document/0001202102030022 (дата обращения: 29.06.2023 г.).
8. Тасейко О.В., Сугак Е.В. Репрезентативность пунктов наблюдения при оценке качества воздуха в городской среде [Электронный ресурс] // Современные проблемы науки и образования. – 2014. – № 6. – 11 с. Режим доступа: https://science-education.ru/ru/article/view?id=15560 (дата обращения: 29.06.2023 г.).
9. Шичкин А.В., Буевич А.Г., Сергеев А.П., Баглаева Е.М., Субботина И.Е. Прогнозирование содержания аномально распределенного в почве хрома гибридными моделями на основе искусственных нейронных сетей // Геоэкология. Инженерная геология, гидрогеология, геокриология. – 2018. – № 3. – C. 86–96. DOI: 10.7868/S0869780318030109.
10. Baglaeva E.M., Sergeev A.P., Shichkin A.V., Buevich A.G. The Effect of Splitting of Raw Data into Training and Test Subsets on the Accuracy of Predicting Spatial Distribution by a Multilayer Perceptron // Mathematical Geosciences. – 2020. – Vol. 52. – pp. 111–121. DOI: 10.1007/s11004-019-09813-9.
11. Demyanov V., Gloaguen E., Kanevski M. A special issue on data science for geosciences // Mathematical Geosciences. – 2020. – Vol. 52. – pp. 1–3. DOI: 10.1007/s11004-019-09846-0.
12. Fernandez Jaramillo J. M., Mayerle R. Sample selection via angular distance in the space of the arguments of an artificial neural network // Computers and Geosciences. – 2018. – Vol. 114. – P. 98–106. DOI: 10.1016/j.cageo.2018.02.003.
13. Kramm T., Hoffmeister D. Assessing the influence of environmental factors and datasets on soil type prediction with two machine learning algorithms in a heterogeneous area in the Rur catchment, Germany // Geoderma Regional. – 2020. – Vol. 22. – e00316. DOI: 10.1016/j.geodrs.2020.e00316.
14. Malof J.M., Reichman D., Collins L.M. How do we choose the best model? The impact of cross-validation design on model evaluation for buried threat detection in ground penetrating radar // Proceedings Volume 10628, Detection and sensing of mines, explosive objects, and obscured targets XXIII. – 2018. – 106280C. DOI: 10.1117/12.2305793.
15. Nath A., Subbiah K. The role of pertinently diversified and balanced training as well as testing data sets in achieving the true performance of classifiers in predicting the antifreeze proteins // Neurocomputing. – 2018. – Vol. 272. – pp. 294–305. DOI: 10.1016/j.neucom.2017.07.004.
16. Timofeeva Y.O., Kosheleva Y., Semal V., Burdukovskii M. Origin, baseline contents, and vertical distribution of selected trace lithophile elements in soils from nature reserves, Russian Far East // Journal of Soils and Sediments. – 2018. – Vol. 18. – No. 3. – pp. 968–982. DOI: 10.1007/s11368-017-1847-5.
17. Wang X., An Sh., Xu Y., Hou H., Chen F., Yang Y., Zhang Sh., Liu R. A back propagation neural network model optimized by mind evolutionary algorithm for estimating Cd, Cr, and Pb concentrations in soils using Vis-NIR diffuse reflectance spectroscopy // Applied Sciences. – 2020. – Vol. 10. – No. 1. – 51. DOI: 10.3390/app10010051.
18. Zhong L., Guo X., Xu Zh., Ding M. Soil properties: Their prediction and feature extraction from the LUCAS spectral library using deep convolutional neural networks // Geoderma. – 2021. – Vol. 402. – 115366. DOI: 10.1016/j.geoderma.2021.115366.

Ключевые слова: репрезентативность точек, сэмплинг, тяжелые металлы, искусственные нейронные сети, выбор обучающего подмножества

Раздел: Геоэкология