Поддержка данных, в которых представлены стандартные отклонения целевой функции для некоторых точек

Обычно при построении суррогатной модели предполагается, что пользователь предоставляет только множество точек и значений целевой функции в этих точках. Используя такую обучающую выборку, строится искомая суррогатная модель. Однако, в некоторых случаях пользователь так же может предоставить для части точек из обучающей выборки возможные отклонения целевой функции от своего истинного значения. Такие отклонения часто вызваны особенностями постановки эксперимента: мы можем иметь доступ только к зашумленным значениям функции или численный алгоритм решения задачи может давать заданную погрешность.

Этот пример демонстрирует использование частично доступных стандартных отклонений для решения модельной задачи. Мы сравниваем суррогатные модели, построенные с использованием и без использования информации о стандартных отклонениях для целевой функции.

Постановка задачи и ее решение

Мы рассматриваем одномерный модельный пример. Целевая функция представлена на рисунке ниже

Отметим, что в данном примере нам доступны только сильно зашумленные значения целевой функции.

Для построения суррогатной модели нам нужно обучающая выборка, которую можно было бы подать на вход GT Approx. Истинная функция сильно зашумлена, поэтом желательно провести предобработку данных перед тем, как подавать выбору на вход модулю GT Approx. Мы используем следующий алгоритм для предобработки данных в этом примере:

  • Модуль GT DoE используется для того, чтобы сгенерировать точки обучающей выборки
  • В каждой такой точек мы вычисляем значение целевой функции несколько раз.
  • Затем по полученным значениям оцениваем среднее значение и стандартные отклонения с помощью стандартных процедур, используемых в инженерной практике.
  • Так как мы рассматриваем случай, когда для части точек мы не знаем значения стандартных отклонений, то, чтобы сделать демонстрацию наглядней, для случайных точек из выборки мы не используем эти значения.

Теперь мы готовы к построению суррогатных моделей с и без использования стандартных отклонений, доступных для части точек выборки. Запускаем GT Approx в двух режимах: первой строим модель, которая использует только точки и значения функции в этих точках, при построении второй модели используем точки, значения функции в этих точках и стандартные отклонения для некоторых точек. Теперь сравним полученные модели.

Наиболее широко используемый способ сравнения качества суррогатных моделей — применение независимой тестовой выборки, которая состоит из новых точек, не использовавшихся при построении моделей, и значений целевой функции в этих точках. Мы используем этот метод. 

Результаты

  • Использование стандартных отклонений при построении суррогатной модели позволяет снизить значение RRMS (Относительную среднеквадратичную ошибку) с 0.3650 до 0.2127 примерно на 40%.

Рисунок ниже демонстрирует аппроксимации, полученные с использованием двух построенных суррогатных моделей.

На рисунке выше так же показаны полученные оценки неопределенности моделей. Видно, что более точные оценки неопределенности мы получаем при использовании стандартных отклонений для целевой функции. Таким образом, в ряде случаев использование  стандартных отклонений для целевой функции в некоторых точках выборки позволяет улучшить качество построенной суррогатной модели.

Контактная информация

location_on  117246, Москва, Научный проезд, д. 17, 15 этаж

phone  +7 (495) 669-68-15

mail_outline  info@datadvance.net

Связаться navigate_next Дистрибьюторы navigate_next