Продолжаем публиковать адаптированный перевод исчерпывающего обзора «Трансформации в геотехнике с помощью искусственного интеллекта: достижения, проблемы и перспективы», который был подготовлен международной группой исследователей. Подробная аннотация к этой работе приведена в начале первой части. Сегодня представляем третью часть, посвященную современным технологическим возможностям и перспективам интеграции искусственного интеллекта в геотехнику. Отметим, что нумерация рисунков здесь продолжает начатую в первых двух частях. Список литературы приведен полностью для всего обзора.
Моделирование на основе искусственного интеллекта с ограничениями, связанными с законами физики
Создание моделей ИИ с ограничениями, обусловленными законами физики (физически ограниченных), было определено как многообещающее решение многих упомянутых выше проблем и, следовательно, стало считаться одним из приоритетных путей. На рисунке 11 представлены различные уровни, на которых модели машинного обучения могут быть ограничены физическими принципами, – от полностью основанных на данных (без ограничений) до полностью основанных на физических моделях (но с обновлениями через машинное обучение). Например, на уровнях три и четыре физические ограничения могут вводиться соответственно в небольшой степени или строго. Это иллюстрирует рисунок 12 на примере нейронной сети.
Рис. 11. Различные уровни применения ограничений, обусловленных законами физики, в моделях машинного обучения
Рис. 12. Схематическое представление: а – модели машинного обучения, учитывающей физические законы, в которой физические ограничения применяются в незначительной степени (физически информированной модели); б – модели машинного обучения со строгими ограничениями, обусловленными физическими законами (физически ограниченной модели). Примечание к рисунку «б»: функция потерь, основанная на физических законах, встроена в модель и жестко контролирует обучение на каждом шаге в соответствии с физическими ограничениями и не зависит от проверки на выходе, поэтому в конце обучения проверяется только функция потерь, основанная на данных
Также стоит отметить, что последние достижения в области динамических моделей, основанных на данных, показали возможность решения с их помощью сложных физических задач при ограниченном объеме данных измерений [173 и др.].
Таким образом, степень, в которой модель должна быть ограничена физическими законами, будет зависеть от нескольких факторов, включая объем и качество обучающих данных, сложность моделируемой задачи, риск появления ложных прогнозов и степень признания соответствующих физических законов в геотехническом сообществе.
Недавние работы продемонстрировали применимость нейронных сетей, обучаемых с учетом физических законов (физически информированных) для решения ключевых геотехнических задач, таких как трехмерное обобщение теории консолидации Терцаги [174], прогнозирование несущей способности буровых свай [175], оценка фильтрации через противофильтрационные завесы [176] и др. Эти работы сообщают о точности в пределах ±5% по сравнению с эталонными численными решениями проверенных моделей при многократном ускорении расчетов.
Моделирование с использованием разных уровней достоверности (многоуровневое)
Основная идея многоуровневого моделирования заключается в использовании:
1) наборов данных с низкими уровнями достоверности, таких как упрощенные аналитические зависимости или численные модели, которым может до некоторой степени не хватать точности, но которые позволяют сформировать большие обучающие выборки при минимальных вычислительных затратах;
2) наборов данных с высокими уровнями достоверности, таких как результаты полевых и/или лабораторных измерений, обладающих наибольшей точностью, но недостаточных для обучения ИИ из-за их, как правило, ограниченных объемов и высокой стоимости получения (см. таблицу).
Таблица. Примеры уровней точности для геотехники
Рис. 13. Схема упрощенного примера последовательного моделирования с разными уровнями точности/достоверности (двухэтапного)
Хотя на рисунке 13 для наглядности представлен всего лишь двухэтапный процесс, в современных методах многоуровневого моделирования часто используются более сложные взаимодействия. Распространены следующие способы усовершенствования:
1) совместное обучение (когда две модели или более обучаются параллельно, обмениваясь информацией о своих предсказаниях, чтобы улучшить свою обобщающую способность и общую эффективность) или иерархическое обучение на остаточных ошибках/поправках (когда модель высокой точности рекурсивно обучается на корректировках выходных данных модели низкой точности, постепенно повышая точность через иерархическую последовательность коррекцировок) [177 и др.];
2) методы байесовского слияния данных (с последовательным обновлением вероятностных оценок о параметрах модели по мере поступления новых данных на основе теоремы Байеса), учитывающие неопределенность моделей низкой и высокой точности при формировании комбинированного предсказания [178 и др.];
3) глубокие нейросети (архитектура глубокого обучения) для многоуровневого моделирования, которые одновременно для всех уровней достоверности обучаются преобразованиям выходных данных модели низкой точности в высокоточные предсказания в рамках одной сети [179 и др.];
4) итеративные петли обратной связи, когда этапы обучения проходятся пошагово с многократными повторениями и обратной связью на каждом этапе, для повышения согласованности моделей и калибровки границ неопределенности [180 и др.].
Эти передовые подходы обеспечивают более надежную способность моделей к обобщению и количественную оценку уверенности в предсказаниях при решении сложных геотехнических задач. Направления дальнейшего развития этой области могут включать:
Недавние достижения в области геотехники включают:
Извлечение знаний
Извлечение знаний на основе данных откроет большие перспективы для трансформации геотехники. Двумя наиболее распространенными методами в этой сфере являются динамическое моделирование на основе данных [185] и машинное обучение с учетом физических закономерностей (физически информированное). Например, Чжан с коллегами [186] недавно продемонстрировали способность физически информированного машинного обучения самостоятельно извлекать закономерности, соответствующие теории консолидации Терцаги, непосредственно на основе данных, полученных при испытаниях на консолидацию. На рисунке 14 представлена схема процесса обратного моделирования с помощью физически информированной нейронной сети, где сначала на основе данных извлекается управляющее уравнение в частных производных (описывающее поведение процесса) а затем оно решается для определения неизвестных параметров (в данном случае коэффициентов консолидации). Этот процесс является итеративным и использует физически информированную функцию потерь, что позволяет минимизировать ошибку предсказания во всей исследуемой пространственно-временной области.
Рис. 14. Пример извлечения закономерностей, соответствующих теории консолидации Терцаги, на основе данных с использованием физически информированных нейронных сетей [186]
По мере расширения доступа к геотехническим данным будут открываться все новые возможности извлечения новых представлений, принципов и механических закономерностей из сложных геотехнических процессов, которые в настоящее время описываются только эмпирическими методами.
Создание цифровых двойников
Согласованная интеграция цифровых моделей с информацией о рабочих процессах и поведении физических систем позволяет создавать цифровые копии реальных объектов в реальном времени (цифровых двойников) для возможности моделирования и прогнозирования разных сценариев. Цифровой двойник постоянно обновляется, сохраняя актуальность, на основе данных, получаемых от физических датчиков, что позволяет проводить диагностику состояния объекта и его виртуальный контроль. Алгоритмы машинного обучения обеспечивают автономные обновления и прогнозы, делая создание цифровых двойников важнейшим подходом для будущей роботизации и автоматизации работ на строительных площадках. В геотехнике это направление будет развиваться в сторону интегрированных цифровых двойников, объединяющих модели грунтовых оснований, фундаментов, инженерных сетей и сооружений, что позволит формировать целостное понимание взаимодействий и взаимозависимостей в общей системе (рис. 15).
Рис. 15. Схема работы интегрированной системы подземных двойников
В последнее время начинается работа по внедрению в практику цифровых двойников для подземных и геотехнических систем. Связанные с этим исследования в области гражданской инфраструктуры (например, создание цифрового двойника железнодорожного моста, снабженного системой мониторинга, на основе статистического метода конечных элементов [3]) демонстрируют возможность использования методов интеграции данных и физических знаний с учетом неопределенностей также и в геотехнике. Так, Латиф с соавторами [171] осуществили потоковую передачу эксплуатационных данных тоннелепроходческого комплекса цифровому двойнику на базе машинного обучения для прогнозирования характеристик и визуализации проходки тоннеля в реальном времени. Аподжи с коллегами [187] представили концепцию уровней принятия решений с использованием искусственного интеллекта для будущих механизированных тоннелепроходческих работ на основе анализа больших данных. Чжао с соавторами [188] исследовали, как функции цифровых двойников могут поддерживать процессы строительства, обеспечения безопасности и управления жизненным циклом тоннелей.
Человеко-машинное взаимодействие с использованием больших языковых моделей
Большие языковые модели (например, GPT-4) обладают значительным потенциалом для развития взаимодействия человека с алгоритмами ИИ в геотехнике. Развив подходы, заложенные в более ранних моделях обработки естественного языка, они способны извлекать из текстов более глубокие знания и открывают новые возможности для сотрудничества специалистов с искусственным интеллектом. Интерфейсы, основанные на больших языковых моделях, обещают сделать применение таких систем более интуитивным и динамичным (например, рис. 16).
Рис. 16. Концептуальная схема интерфейса на основе большой языковой модели для взаимодействия между человеком и системой искусственного интеллекта
Однако универсальные (для широкого спектра задач) большие языковые модели часто имеют затруднения при ответах на специализированные геотехнические запросы, выходящие за рамки данных, использованных на этапе предварительного обучения. Это ограничение можно преодолеть с помощью малозатратной донастройки модели или генерации текста с помощью расширенного поиска и извлечения информации (Retrieval-Augmented Generation, RAG) из специализированного корпуса/набора текстов, сформированного и периодически обновляемого группой специалистов.
Первые исследования в этом направлении показали, что большая языковая модель GPT-4 способна отвечать на вопросы учебного уровня по геотехнике с точностью около 70% и составлять проекты технических заданий на инженерно-геологические изыскания [189]. Кумар [172] продемонстрировал достоверную интерпретацию геотехнических данных с использованием тщательно разработанных запросов, а Сюй с коллегами [190] представили GeoLLM – специализированную большую языковую модель, дообученную для интеллектуальной автоматизации геотехнического проектирования. В недавних исследованиях также рассматривается применение методов на основе больших языковых моделей, например генерации текста с применением расширенного поиска (RAG) и обучения на небольшом числе примеров, для решения различных задач геотехнического проектирования, включая планирование организации работ на строительной площадке [191], геологическое моделирование [192] и проектирование фундаментов [193]. Эти работы подтверждают практический потенциал больших языковых моделей, в то же время подчеркивая необходимость управления проблемами, связанными с качеством запросов и с возможными «галлюцинациями» модели.
Генеративное моделирование (моделирование с генерацией данных)
Генеративный искусственный интеллект, основанный на генеративно-состязательных сетях [194] и получивший дальнейшее развитие с помощью генеративных моделей на основе диффузии (диффузионных) [195], открывает для геотехники три основные возможности. Во-первых, он может генерировать реалистичные синтетические наборы данных, что способствует улучшению многоуровневого моделирования и численных расчетов.
Во-вторых, генеративный ИИ способен автоматизированно осуществлять процессы проектирования с учетом ограничений, позволяя быстро исследовать и оценивать результаты геотехнического планирования, сокращать итерационные циклы и находить новые решения.
В-третьих, обучаясь на исторических и специфичных для конкретной строительной площадки данных, генеративные модели могут предсказывать потенциальные сценарии разрушений/отказов и обеспечивать информацией разработку проактивных стратегий снижения рисков.
В совокупности эти возможности открывают путь к еще более инновационной геотехнической практике, более быстрому и безопасному выполнению работ в отрасли.
Среди недавних адаптаций для геотехнической отрасли – генеративно-состязательная нейросеть SchemaGAN [196], которая создает правдоподобные геотехнические модели подповерхностной среды на основе разреженных данных статического зондирования конусом (CPT) и превосходит по достоверности результаты применения метода интерполяции, основанного на кригинге.
Чжоу и Ши [181] при построении двумерных разрезов применили многомасштабную генеративно-состязательную нейросеть для объединения данных изысканий различной степени достоверности, что позволило значительно снизить среднеквадратическую ошибку по сравнению с классическими методами инверсии.
Для задач анализа временнЫх рядов данных Ге с соавторами [197] представили RGAN-LS – рекуррентную генеративно-состязательную нейросеть, которая увеличивает объем ограниченных данных по смещениям и повышает точность прогнозирования движения оползней в «слепых» тестах (с заранее неизвестными исходными данными или ответами) на величину вплоть до 18%.
Обучение моделей преобразования данных (операторов) и графовые модели
Для решения задач вычислительной механики недавно были адаптированы фреймворки нейронных операторов, то есть платформы для обучения нейронных моделей преобразования данных, такие как Wavelet Neural Operator (нейронный оператор с использованием вейвлет-преобразований) и Physics-Informed Geometry-Aware Neural Operator (нейронный оператор с учетом физических законов и геометрических параметров). Они обеспечили ускорение вычислений, не связанное с размером или детализацией сетки дискретизации пространства, в 50–100 раз по сравнению с методом конечных элементов и в то же время позволили сохранить согласованность с физическими законами [198, 199].
Одновременный прогресс в разработке вычислительных моделей (симуляторов) на основе графовых нейронных сетей позволяет эффективно рассчитывать поведение гранулярных потоков на уровне отдельных частиц. Так, Цзян с соавторами [200] показали, что такие симуляторы способны точно прогнозировать динамику разрушения гранулярных тел и эффективно оптимизировать параметры метода дискретных элементов. При одном из более поздних исследований дифференцируемая суррогатная (замещающая) модель на основе нейросети воспроизвела динамику сползания слагавшего склон многослойного грунтового массива в 145 раз быстрее по сравнению с методом материальной точки, при этом поддерживая возможность обратного определения параметров модели [201].
Эти подходы, основанные на обучении моделей преобразования данных (операторов) и на графовых моделях (графовых симуляторах), открывают путь к созданию многомасштабных дифференцируемых вычислительных моделей геомеханических систем в реальном времени.
В данной статье описан потенциал внедрения искусственного интеллекта в геотехнику, обусловленного необходимостью решения трудных задач, возникающих при сложных взаимодействиях инженерных сооружнений, грунтов, подземных вод и других элементов окружающей среды. Освещены недавние достижения в популярных направлениях применения ИИ в геотехнике, включая интеллектуальные инженерные изыскания, моделирование поведения грунтов и оптимизацию процессов геотехнического проектирования. Также продемонстрировано, как технологии искусственного интеллекта уже способствуют созданию более точных прогнозных моделей и упрощению рабочих процессов. С помощью приведенных примеров наглядно показано, что ИИ способен приносить ощутимую пользу отрасли уже сегодня.
Однако выявлено несколько характерных для геотехники ключевых проблем, которые надо решить, чтобы полностью реализовать потенциал использования в ней искусственного интеллекта. Важнейшей проблемой остается нехватка данных, которая может препятствовать машинному обучению моделей из-за сложных взаимодействий в любом геотехническом проекте. Сложность корректного применения ИИ в геотехнике также связана с объяснимостью моделей, их универсальностью (адаптацией к разным условиям) и учетом факторов неопределенности. Критически важно объединить технологии искусственного интеллекта с традиционными геотехническими моделями, а также создать эталонные тесты и критерии оценки моделей, чтобы обеспечить согласованность моделей ИИ с существующими геотехническими знаниями, преодолеть возможные несоответствия и повысить доверие геотехнического сообщества к такой интеграции.
И наконец, в статье рассмотрены приоритетные направления развития технологий искусственного интеллекта в геотехнике, включая человеко-машинное взаимодействие с использованием больших языковых моделей, моделирование с разными уровнями достоверности, извлечение знаний, создание цифровых двойников, генеративные модели, обучение моделей преобразования данных (операторов), графовые модели (графовые симуляторы).
Для достижения прогресса в этой области в соответствии с существующими геотехническими принципами, по мнению авторов, необходим междисциплинарный подход, предполагающий сотрудничество между исследователями в области ИИ и геотехниками. Этические аспекты, в частности вопросы необъективности и подотчетности, говорят о важности ответственного использования искусственного интеллекта в рамках правового поля.
—
Данная работа в первоначальном виде была представлена на Первом симпозиуме по применению искусственного интеллекта в геотехнике, проведенном в мае 2023 года в городе Глазго (Великобритания). Это мероприятие было организовано с финансовой поддержкой гранта Alan Turing Development Award (гранта британского Национального института имени Алана Тьюринга по развитию анализа данных и искусственного интеллекта) при софинансировании со стороны Фонда ускорения внедрения результатов исследований Научного совета по инженерным и физическим наукам Великобритании (EPSRC Impact Acceleration Account) при Университете Глазго.