May 15, 2024
Многопорядковая гидрологическая позиция для Европы — набор функций для машинного обучения и анализа в гидрологии
Том 9 научных данных, номер статьи: 662 (2022) Цитировать эту статью 1059 Доступов 5 Подробности об альтметрических метриках Представленный набор данных EU-MOHP v013.1.1 предоставляет многомасштабную информацию о
Научные данные, том 9, Номер статьи: 662 (2022) Цитировать эту статью
1059 доступов
5 Альтметрика
Подробности о метриках
Представленный набор данных EU-MOHP v013.1.1 предоставляет многомасштабную информацию о гидрологическом положении (MOHP) географической точки в пределах соответствующей речной сети и водосбора в виде карт с координатной сеткой. Точнее, он включает в себя три показателя: «расстояние от деления до ручья» (DSD) как сумма расстояний до ближайшего ручья и водораздела, «латеральное положение» (LP) как относительная мера положения между ближайшим ручьем и водоразделом. и «расстояние потока» (SD) как расстояние до ближайшего ручья. Эти три показателя рассчитаны для девяти гидрологических порядков и отражают различные пространственные масштабы: от локального до континентального. Его пространственная протяженность охватывает основные части Европейской экономической зоны (ЕЭЗ39), которая также во многом совпадает с физико-географической Европой. Хотя существует множество потенциальных вариантов использования, этот набор данных преимущественно служит ценным статическим дескриптором окружающей среды или предикторной переменной для гидрогеологического и гидрологического моделирования, такого как задачи картографирования или прогнозирования с использованием машинного обучения. Для создания этого набора данных используется только бесплатное программное обеспечение с открытым исходным кодом, поэтому его можно перенести в другие регионы или входные наборы данных.
Измерение(я)
разделить на расстояние потока • боковое положение • расстояние потока
Тип(ы) технологии
дистанционное зондирование
Пример характеристики — окружающая среда
водосборный бассейн • подземный водораздел • водосбор
Пример характеристики – Местоположение
Европа
В последние годы инструменты обработки данных, такие как машинное обучение, все чаще применяются и специально разрабатываются для решения гидро(ге)ологических задач и исследовательских вопросов1,2. В области гидрогеологии машинное обучение успешно используется для прогнозирования уровня грунтовых вод и решения различных картографических задач3,4,5,6,7,8,9,10,11,12,13. Поскольку модели машинного обучения — за исключением гибридных или физических моделей — основаны исключительно на данных без каких-либо знаний о физических процессах, важно предоставить значимые функции (также называемые предикторными или объясняющими переменными), которые влияют на целевую переменную, чтобы что алгоритм машинного обучения может моделировать функцию между входными и целевыми значениями. Для поверхностных и приповерхностных процессов этот критерий может быть более или менее выполнен при наличии данных дистанционного зондирования, тогда как для моделирования подземных процессов, например, в гидрогеологии, это представляет собой серьезную проблему.
Основная мотивация создания этого набора данных — частично закрыть этот пробел, предоставив набор функций, которые вводят гидрологический контекст в модели машинного обучения относительно горизонтального положения точки в пределах ее водосбора. Три меры, определяемые этим горизонтальным положением, рассчитываются для нескольких так называемых гидрологических порядков. Гидрологические порядки представляют собой различные пространственные масштабы: от локального до регионального и континентального. Таким образом, эти меры служат показателем геофизических характеристик гидрологических систем в различных масштабах и дополняют общедоступные и используемые характеристики, такие как карты землепользования и растительного покрова, геологические или почвенные карты. Этот набор данных во многом вдохновлен Белитцем и др.14 и адаптирует их идеи и методы к «Базе данных ЕС-Гидро-речной сети»15, но, напротив, использует бесплатное программное обеспечение с открытым исходным кодом и уделяет большое внимание воспроизводимости. Эта концепция может быть пространственно расширена путем применения представленных методов к наборам данных глобальной речной сети или гидрографов, таких как HYDRO1k16 или MERIT Hydro-Vector17. Более подробную информацию о концепции и методах можно найти у Belitz et al.14.
В своем исследовании Белитц и др.14 также представили результаты тематических исследований, чтобы доказать, что многопорядковое гидрологическое положение является ценной особенностью при картировании различных геофизических целевых переменных с использованием машинного обучения. Его польза для производительности моделей машинного обучения также была признана в ряде других исследований7,18,19.