Подробнее о роли аналитики больших данных в инженерно-геологических изысканиях — ГеоИнфо — метапортал для инженеров
Реклама
  • Реклама, 0+. АО «Мостдоргеотрест» ИНН 7716750744
  • erid: 2vfnxwa1cem
Баннер МОСТДОРГЕОТРЕСТ правая колонка Баннер МОСТДОРГЕОТРЕСТ правая колонка
Реклама
  • Реклама, 0+. ООО «ИнжПроектСтрой» ИНН 5902163884
  • erid: 2vfnxvifrnd
Баннер MalininSoft правая колонка Баннер MalininSoft правая колонка

Подробнее о роли аналитики больших данных в инженерно-геологических изысканиях

Подробнее о роли аналитики больших данных в инженерно-геологических изысканиях
ВАНИ В.Д.
ВАНИ В.Д.
Институт аэрокосмической инженерии, г. Дундигал, р-н Хайдарабад, шт. Телангана, Индия
РАДЖ В.Х.
РАДЖ В.Х.
Факультет прикладных наук Инженерного колледжа «Нью Хорайзон» (New Horizon – «Новый горизонт»), г. Бангалор, шт. Карнатака, Индия
ДАТТ А.
ДАТТ А.
Университет «Лавли Профешинал» (Прекрасный профессиональный университет»), г. Фагвара, шт. Пенджаб, Индия
РАВИНДРАНАТХ Р.
РАВИНДРАНАТХ Р.
Факультет менеджмента Инженерного колледжа «Мангалам» (Mangalam – «Удача»), г. Коттаям, шт. Керала, Индия
ТЬЯГИ Л.К.
ТЬЯГИ Л.К.
Институт менеджмента и технологий «Ллойд» (Lloyd), г. Грейтр-Нойда, шт. Уттар-Прадеш, Индия
АЛМУСАВИ М.
АЛМУСАВИ М.
Факультет инженерии компьютерных технологий Колледжа технической инженерии Исламского университета, г. Наджаф, Ирак
ЯДАВ Д.К.
ЯДАВ Д.К.
Институт инженерии и технологий «Ллойд», сектор Ноледж Парк II, г. Грейтр-Нойда, шт. Уттар-Прадеш, Индия

Предлагаем вниманию читателей немного сокращенный и адаптитрованный перевод доклада преимущественно индийских инженеров-геологов и геотехников «Подробнее о роли аналитики больших данных в инженерно-геологических изысканиях» (Vani et al., 2024), который был сделан на 3-й Международной конференции по гражданскому строительству, проектированию строительных объектов и инженерным методам охраны окружающей среды (ICS-MEE), проходившей 2–3 мая 2024 года в индийском городе Коттаям штата Керала. Данное мероприятие было организовано Инженерным колледжем «Мангалам», получило финансовую поддержку от Министерства науки и технологий Индии и собрало более 1000 участников со всего мира. Материалы этой конференции были в том же году опубликованы в рецензируемом сборнике трудов научных конференций E3S Web of Conferences, который выпускает французское издательство EDP Sciences (Edition Diffusion Presse Sciences).

Рассматриваемая статья находится в открытом доступе по лицензии CC BY 4.0, позволяющей распространять, переводить, адаптировать и дополнять ее при условии указания типов изменений, ссылки на первоисточник и DOI. В нашем случае полная ссылка на источник для представленного перевода (Vani et al., 2024) приводится в конце.

В данной обзорной статье рассматривается преобразующая роль аналитики больших данных для инженерно-геологических исследований, которая заключается в переходе от традиционных методов прошлого к парадигме, основанной на данных, что позволяет дополнить процесс принятия решений и повысить точность результатов исследований подземной среды. Данный обзор демонстрирует значительные улучшения в описании площадок будущего строительства, оценках рисков и методах строительства при использовании методов статистической аналитики больших массивов данных при инженерно-геологических изысканиях. В статье подчеркивается способность технологии больших данных радикально трансформировать инженерно-геологические изыскания благодаря усовершенствованию прогнозного моделирования, управления рисками и повышению устойчивости инженерных практик. Также подчеркивается важнейшая роль технологии больших данных в решении проблем глобального потепления и разрушения озонового слоя. Путем анализа многих случаев из практики и методов, основанных на искусственном интеллекте (ИИ), в работе проливается свет на повышение эффективности и экологические преимущества инженерно-геологических изысканий с использованием ИИ.

Введение

Строительство, в том числе геотехническое, значительно выигрывает при огромных объемах данных, собираемых в ходе инженерно-геологических изысканий. Для перевода данных в осмысленную форму необходимы их анализ и визуализация. Последние также нужны для понимания трудностей, с которыми сталкиваются организации, собирающие и/или использующие инженерно-геологические данные. Для анализа и визуализации данных, например, для систем бизнес-интеллекта (Business Intelligence, BI) подходит интерактивный продукт компании Microsoft под названием Power BI.

При инженерно-геологических изысканиях для оценки геоданных, изменяющихся как в пространстве, так и во времени, важнейшую роль играет статистический анализ. По причине быстрого развития средств измерений и оцифровки были разработаны специальные методы анализа данных для эффективной обработки огромного количества неоднозначной и неполной информации. В сферах цифрового интеллекта (digital intelligence) и цифровой экономики происходит непрерывная смена парадигм от традиционных моделей, основанных на физике, к подходам, основанным на данных (data-driven frameworks). Это объясняется тем, что модели, основанные на данных, являются более гибкими и полезными в ситуациях, когда физические особенности или механизмы либо недостаточно хорошо поняты, либо слишком сложны для точного моделирования [1].

Для характеристики генетических свойств геоматериалов авторами работы [2] была предпринята попытка использовать биологические понятия из области генетики. Они предложили новую стратегию, основанную на общих характеристиках определенных типов горных пород в определенной местности или зоне. Этот подход позволяет выявлять генетические признаки геоматериалов путем анализа параметрических данных по ним с использованием теории больших данных (big data). Была создана программная платформа для обработки и оценки больших объемов данных. В процессе представленного в указанной публикации исследования было проанализировано около 80 тысяч наборов данных по физико-механическим свойствам геоматериалов из типичного района в целях выработки рекомендаций по определению характеристик геоматериалов, обеспечению проектирования данными и возможному их использованию для предотвращения стихийных бедствий.

В инженерной геологии хорошо известно, что особенности площадок будущего строительства имеют индивидуальный характер. Данные, полученные в результате исследований на одной площадке, нельзя напрямую использовать для другой. Тем не менее на практике часто случается так, что принятие решений для конкретной площадки опирается не на набор данных, специфичный именно для нее, а на обобщенную информацию. Например, для расчета проектных характеристик грунтов инженеры часто используют модели трансформации (transformation models), причем в большинстве случаев их калибруют с использованием обобщенных данных. С другой стороны, полный отказ от применения таких моделей был бы крайне непрактичным и избыточным [3]. Их эффективность позволяет предположить, что использование обобщенных данных может принести пользу при принятии решений по конкретным площадкам. В эпоху технологии больших данных инженерам-геологам целесообразно учитывать полезность обобщенных баз данных.

В публикации [4] рассматривается значение расчетов надежности в геотехническом проектировании с акцентом на контроль качества на протяжении всего жизненного цикла здания или сооружения. Подчеркивается, что хотя неопределенности можно обрабатывать вероятностными методами, они обычно являются «известными неизвестными», для работы с которыми требуются исторические данные и измеримая информация.

При работе со сложными реальными данными, неточными данными и географической изменчивостью, которые трудно обрабатывать с использованием детерминированных методов, большую роль играет достоверность. Поскольку географические неопределенности влияют, например, на сейсмические характеристики разных участков, важна геопространственная база данных для описания инженерно-геологической информации, специфичной для конкретной площадки, а также для совершенствования методик геопространственного зонирования. В работе [5] представлена многоисточниковая геопространственная информационная система, включающая такие компоненты, как платформа больших данных, геостатистическая оценка плотности распределения значений, оптимизация метода геостатистической интерполяции и др. Эта система была применена для территории Сеульского Столичного Региона в Южной Корее для обеспечения геопространственного зонирования сейсмических воздействий, характерных для конкретных площадок. Для каждого административного района зонирование включало получение многoисточниковых геопространственных карт, геослоев и факторов воздействия на площадки.

Инженерно-геологические изыскания требуют проведения специальных испытаний, однако сделанные на их основе выводы могут быть неверными из-за сложности методик, неточного управления данными или уникальных свойств грунтов. Для обеспечения бесперебойного хода работ и точности данных при изысканиях используют геоинформационную систему на основе BP нейронной сети (обучаемой методом обратного распространения ошибки – BackPropagation). Такой подход обеспечивает надлежащую обработку данных и дает заслуживающую доверия основу для исследований, гарантируя надежность и точность результатов [6].

В Казахстане в свое время большое внимание исследователей было уделено созданию инженерно-геологической базы данных для Университета Назарбаева в г. Астане. Для построения этой базы данных использовался фиксированный набор данных, включавший карту города и информацию, сгенерированную пользователями по данным более чем 2000 скважин. В зависимости от стратиграфических особенностей и геологического происхождения территорию Астаны разделили на восемь зон. При этом выделили шесть основных инженерно-геологических элементов [7]. Были учтены инженерно-геологические характеристики грунтов. Границы между элювиальными и аллювиальными грунтами, а также пределы пластичности были точно связаны с модулем упругости E. Для определения оптимальных изменений длины забивных свай для каждой зоны была составлена инженерно-геологическая карта.

Появление технологии больших данных в инженерной геологии

В области инженерной геологии работа по предписаниям уступила место использованию более точных приближений, основанных на ограниченной информации, полученной при инженерных изысканиях на площадках. В эпоху, когда методы принятия решений должны больше основываться на данных и зависеть от них, особенно при работе с зеттабайтами (миллиардами терабайтов) информации, процесс обработки геоданных включает несколько этапов, представленных на рисунке 1.

Рис. 1. Цифровой конвейер геоданных включает пять этапов.

Согласно статье [8] каждое данное имеет ценность независимо от его качества или способности вписываться в физическую модель. Определение этой ценности путем изучения реальности данных с использованием вероятностных методов, машинного обучения или других подходов, основанных на данных, представляет собой серьезную задачу для научного сообщества. Ее решение позволит по-новому взглянуть на работу инженеров-геологов и геотехников в иммерсивной цифровой среде, где, вероятно, уже присутствует машинный интеллект.

В работе [10] предлагается делать упор на развитие инженерной геологии и в том числе геотехники, основанных на данных. Предлагается применять инновационные алгоритмы для работы с геоданными с помощью новых технологий, отвечающих практическим требованиям и использующих существующие знания.

Продолжаются исследования в области описания площадок на основе данных. Они охватывают в том числе такие вопросы, как объяснимая идентификация участков на основе данных и работа с «непривлекательными» данными. Среди требующих решения задач – развитие машинного обучения с превращением его в ключевой инструмент, методов этого обучения с достижением интеллектуальности по аналогии с цифровыми двойниками. Цель данной повестки – в перспективе революционизировать машинное обучение в сфере инженерной геологии.

В докладе [11] рассматривается применение технологий больших данных и искусственного интеллекта (ИИ) при исследованиях геоопасностей в основном на примере района водохранилища «Три ущелья» (Three Gorges). В этой работе предлагается актуальная информация о возможностях ИИ при изучении геоопасностей. Она может стать ориентиром для будущих исследований. Для улучшения знаний о геологических условиях в разных местностях и связанных с ними рисках необходимо выработать рекомендации по усилению технологий ИИ и больших данных в сфере инженерно-геологических изысканий.

Инженерно-геологическое описание площадки имеет очень большое значение для проектов гражданского строительства. В настоящее время этот процесс стал более точным и эффективным благодаря сочетанию технологий искусственного интеллекта и интернета вещей (Internet of Things, IoT) [12]. С использованием ИИ анализируются геологические и геопространственные данные, тогда как технология интернета вещей делает возможными мониторинг и сбор полевых данных по площадке в реальном времени.

Точность описания площадки становится выше и прогнозы получаются качественнее при вводе в модели ИИ геофизических данных, собираемых посредством встроенных в грунт сенсорных сетей, которые дают динамическую картину подповерхностных условий.

Совместное использование технологии искусственного интеллекта и интернета вещей при инженерных изысканиях можно облегчить благодаря таким платформам и инструментам, как информационное моделирование объектов строительства (Building Information Modeling, BIM) и геоинформационные системы (ГИС, GIS). От этой синергии зависят развитие современной инфраструктуры и обеспечение долговечности и устойчивости проектов гражданского строительства в будущем.

Концепция «Индустрия 4.0» («Четвертая промышленная революция» – переход к автоматизированному и интеллектуальному производству, интеграция цифровых технологий и физических производственных систем) и новые технологии, такие как машинное обучение, стимулируют развитие инженерной геологии в направлении цифровой трансформации и интеллектуализации. Однако из-за скудности и «непривлекательности» данных исследования в области машинного обучения и его применения в инженерно-геологической практике продвигаются медленно. В одном из таких исследований [13] предлагается разработать обучающую базу данных, отражающую специфику конкретного проекта и знания в области инженерной геологии, такие как механика грунтов и принципы численного анализа.

Стремительное развитие новых технологий существенно расширило наши знания и компетенции в области искусственного интеллекта. Например, быстрое увеличение объемов географических данных, мощные вычислительные возможности и достижения в области ИИ привели к росту использования географического анализа в экологических приложениях. Искусственный интеллект меняет все поле исследований и делает возможным выполнение геопространственного анализа с высоким разрешением [14]. Большие массивы данных до сих пор требовали использования традиционных инструментов обработки данных, однако на замену таким приложениям пришел искусственный интеллект, обеспечивающий лучшее понимание и возможность извлечения информации из огромных объемов данных [15].

Применение аналитики больших данных в инженерно-геологических изысканиях

В условиях глобального потепления и разрушения озонового слоя необходимы технологии, которые могут заменить опасные методы в строительной отрасли [16]. Подходы, основанные на использовании искусственного интеллекта, могут уменьшить зависимость от лабораторных работ, снизить выбросы углекислого газа и повысить точность геотехнического проектирования и строительства. В публикации [17] представлено исследование использования в инженерной геологии интеллектуальных алгоритмов обучения, таких как: искусственные нейронные сети; нечеткая логика (Fuzzy Logic); эволюционный алгоритм обучения GEP (Gene Expression Programming); адаптивная нейро-нечеткая система вывода (ANFIS – adaptive neuro-fuzzy inference system), то есть гибридная система, которая сочетает принципы нейронных сетей и нечеткой логики; инструмент «дисперсионный анализ» (ANOVA – Analysis of Variance) (следует отметить, что это статистический метод, который не является интеллектуальным алгоритмом обучения, но используется в машинном обучении для анализа различий между средними значениями двух или более выборок и оценки их статистической значимости. – Ред.). Данные алгоритмы помогают прогнозировать геотехнические и экологические проблемы, тем самым снижая опасные глобальные эффекты.

Экспериментальные подходы к земляным работам в уже застроенных местах, где строительство осложнено, могут приводить к ошибкам (в том числе из-за человеческого фактора), вызывающим непредвиденные проблемы. Но при использовании эволюционных подходов к обучению большинство таких задач удалось решить.

Исследование, представленное в статье [18], было сосредоточено на применении искусственных нейронных сетей (ИНС) для прогнозирования конечной осевой несущей способности буровых свай, часто используемых для строительства дорог, мостов и высотных сооружений. В указанной работе использовались результаты испытаний на нагрузку фундаментов глубокого заложения в Неваде, взятые из соответствующей базы данных (Nevada Deep Foundation Stress Test Database). Модель ИНС показала хорошие результаты по неизвестным данным в отношении обобщений и точности прогнозирования: среднеквадратическое отклонение (СКО, RMSE – Root Mean Squared Error – «корень из среднеквадратической ошибки») составило 12486,509 кН, средняя абсолютная ошибка – 10589,4364 кН, а 
коэффициент детерминации R2 достиг 0,87.

В обзоре [19] рассказывается о многомерном наборе данных по глинам китайской провинции Цзянсу (J-CLAY/5/124), использованном для разработки модели искусственной нейронной сети с целью прогнозирования модуля упругости основания дорожной одежды (subgrade resilience modulus, Mr). Модель ИНС была обучена и оптимизирована с помощью метода поиска с запретами, или табу-поиска (tabu search). Результаты использования этой версии показали высокую точность: значения скорректированного коэффициента детерминации R2 составили 0,87560629 и 0,892192118. Прогнозы имели низкие погрешности: средняя абсолютная ошибка составила 0,217086317, а среднеквадратическое отклонение – 0,071266013. Оптимизация табу-поиска повысила общую эффективность модели, что дало увеличение таких показателей, как: полнота (recall); точность (precision); F1-мера, или сбалансированная F-оценка (F1 score); общая точность (accuracy). Также это привело к снижению функции потерь (loss reduction). Таким образом, полученная модель ИНС продемонстрировала обнадеживающие результаты при оценке модуля упругости земляного полотна Mr для глин J-CLAY/5/124, что дало полезную информацию для работ с приложениями для инженерной геологии.

Исследование, представленное в статье [20], было направлено на поиски возможностей объединения предыдущих достижений в области байесовских методов при характеристике площадок и на создание базовой системы байесовского обратного оценивания/анализа (Bayesian inverse evaluation/analysis) для непосредственной оценки фактической изменчивости. Эта система связывает распределение и степень природной изменчивости грунтов основания, статистическую непредсказуемость, погрешности измерений и неопределенность, присущую формулам/моделям преобразований, в процессе описания площадки на различных этапах инженерных изысканий. Такая работа с данными упрощает вывод функций распределения вероятностей для случайных величин характеристик дисперсных и скальных грунтов, что дает более эффективный метод, необходимый для описания площадок с теми или иными инженерно-геологическими условиями.

В обзоре [21] описывается гибридный подход к работе с инженерно-геологическими данными, сочетающий метод адаптивной выборки и метод последовательной выборки (hybrid adaptive sequential sampling approach). Он включает использование ИНС, метод Монте-Карло с отсеиванием (Monte Carlo dropout) и алгоритм «случайный лес» (Random Forest). Искусственные нейронные сети хорошо подходят для решения задач с множественными выходными данными, тогда как метод Монте-Карло с отсеиванием позволяет эффективно прогнозировать неопределенности для неизученных участков. Алгоритм «случайный лес» позволяет оценивать относительную значимость данных для их классификации и снижает риск переобучения (за счет использования ансамбля деревьев решений, построенных на различных подвыборках данных. – Ред.). Данный подход показал свою эффективность применения в инженерной геологии благодаря снижению вычислительных затрат и расширению возможностей выборочных инженерно-геологических исследований (взятия образцов, испытаний).

Одним из наиболее популярных методов исследований грунтов и оценки их физических свойств является статическое зондирование – испытания грунтов на внедрение конусного зонда/пенетрометра (Cone Penetration Tests, CPT). При исследовании, представленном в докладе [22], сравнивалась эффективность таких алгоритмов машинного обучения, как «случайный лес» и глубокое обучение, на основе данных CPT для прогнозирования сопротивлений грунта под конусом и по боковой поверхности зонда. Метод использования алгоритма «случайный лес» для регрессионного анализа (random forest regression technique) превзошел глубокие нейронные сети по эффективности прогнозирования, дав коэффициенты детерминации R2 в диапазонах 0,65–0,68 для сопротивления под конусом и 0,14–0,75 для сопротивления по боковой поверхности. На практике это дало такие преимущества, как сбор проектных параметров на основе более простых испытаний, снижение стоимости проекта, повышение качества и эффективности испытаний методом CPT, а также помощь в выборе геотехнического проекта. В таблице сопоставлены различные методы искусственного интеллекта и машинного обучения, применяемые в геотехнике.

Таблица. Различные методы искусственного интеллекта и машинного обучения, используемые в геотехнике

Рис. 2. Различные методы предварительной обработки инженерно-геологических данных

Для улучшения прогнозирования устойчивости склонов в работах [31–34] была предложена гибридная стратегия ансамблевого обучения методом стекинга (стекинг-ансамблирования). Среди 11 оптимизированных методов машинного обучения при данном подходе использовался алгоритм искусственной пчелиной колонии (Artificial Bee Colony) для определения оптимальной комбинации базовых классификаторов и соответствующего мета-классификатора. Авторы работ [35–36] проводили обучение и тестирование с использованием конечноэлементного анализа. Благодаря указанной выше стратегии удалось значительно улучшить прогнозирование устойчивости склонов: показатель AUC (Area Under Curve – «площадь под кривой рабочих характеристик (ROC-кривой)») оказался на уровне 90,4%, что на 7% выше, чем у лучших из 11 оптимизированных методов машинного обучения [37]. Предложенный подход продемонстрировал заметно более хорошие результаты также и по сравнению с использованием стандартного ансамблевого классификатора. Еще для исследования значимости переменных, влияющих на устойчивость склонов, применялся метод линейной квантизации векторов признаков, или линейной векторной квантизации (Learning Vector Quantization, LVQ) [38–41].

Выводы

В данном обзоре хорошо продемонстрировано значительное влияние использования аналитики больших данных на инженерно-геологические изыскания. Эти исследования стали точными, эффективными и экологичными благодаря переходу от старых эмпирических подходов к революционным методам, основанным на данных.

  • Переход от традиционных эмпирических методов к технологиям, основанным на данных, повышает точность, эффективность и устойчивость.
  • Искусственный интеллект и машинное обучение снижают неопределенности и повышают качество прогнозирования характеристик дисперсных и скальных грунтов.
  • Интеграция аналитики больших данных в инженерно-геологические изыскания способствует внедрению устойчивых методов, согласующихся с международными усилиями по уменьшению воздействий на изменения климата.
11 Сентябрь 2025
Комментарии
Читайте также
Первый дом в Rengа: начнется ли массовый переход на отечественное ПО
Правомерно ли передавать результаты инженерных изысканий по электронной почте?
110 лет со дня рождения В. Д. Ломтадзе
Стрелка вверхнаверх
Удалить пост?
Пост будет удален полностью и его нельзя будет востановить
Закрыть
Ссылка скопирована Закрыть
Главная страница
Главная
Новости
Новости
Меню
Ещё
  • Поделиться
Поделиться
  • Скопировать ссылку