Планирование научного эксперимента. Ю.И.Нечаев

3. Интеллектуальные технологии в области планирования эксперимента и моделирования

 

Основным средством и инструментом современных научных исследований является моделирование. Модели сложных объектов и явлений часто оказываются интегрированными, включающими в себя содержательно-описательную и формально-математическую составляющие. Концептуальный подход к решению проблемы моделирования, основанный на общности и логической определенности процессов научного отражения и исследования сформулирован в работе [ ]. Компонентами этих процессов являются предметная область и ее модель, спецификация объекта и задача его исследования, собственно модель объекта и алгоритмы реализации задачи. 

Разработанная схема процесса исследования в рамках модели предметной области приводит к следующей структуре процесса моделирования и решения задачи их анализа. Реальный объект и задача его исследования описываются в виде спецификации в контексте семантического уровня модели предметной области. По этой спецификации аппарат семантического уровня формирует семантическую модель объекта, которая переводится в спецификацию в контексте формального уровня модели предметной области. Далее аппарат формального уровня разрабатывает формальную модель объекта. Аналогичная схема используется для формирования алгоритмической модели объекта. Сначала формальная модель с помощью подсхемы переформулирования переводится в спецификацию в контексте алгоритмического уровня модели предметной области, а затем аппарат алгоритмического уровня формирует алгоритмическую модель объекта. 

В задачах автоматизации научного эксперимента находят применение ИС, обеспечивающие решение различных прикладных задач. Одна из таких систем связана с проблемой планирования эксперимента и позволяет давать полезные советы по принятию решений на неформализованных этапах процесса экспериментального исследования:

  • идентификация объекта исследования (выбор факторов и градаций, экспериментальной единицы, указание источников неоднородностей) и выбор модели (модель регрессионного анализа, дисперсионная модель, линейная модель, модель с взаимодействием и т.д.);

  • выбор критерия оптимальности плана (ортогональность, обеспечивающая независимость оценок параметров модели, D-оптимальность, связанная с минимумом эллипсоида рассеяния оценок параметров и др.) и процедуры рандомизации, определяющей характер размещения единиц в ячейках плана и последовательность реализации опытов во времени;

  • выбор схемы эксперимента (факторный и блочный план, планирование с полным перебором вариантов либо с сокращением перебора - латинский квадрат, латинский куб и др.), числа повторных опытов в ячейках плана и характера их распределения (равномерное, неравномерное ). 

Ядром системы является набор функциональных блоков, работающих со знаниями, хранящимися в семантической сети. В вершинах сети располагаются продукции и фреймы, концентрируется информация из внешней среды и выполняются различные операции. Программа работает в виде последовательной активации вершин сети, каждая из которых содержит списки ссылок на другие вершины. Выбор из списка альтернатив обеспечивает активизацию одной из вершин вслед за текущей. 

Базу знаний ИС составляют различные типы знаний по планированию эксперимента. К первому типу относятся знания, имеющие описательный характер, С помощью этих знаний представляют понятийные знания и описывают конкретные факторы, экспериментальные единицы, источники неоднородностей и планы экспериментов. Второй тип знаний - это логические правила (правила продукций), обеспечивающие принятие решений на основе анализ посылок. 

Рассмотрим работу таких правил. 

ЕСЛИ  опыты проводятся на неоднородных экспериментальных единицах
И  источники неоднородностей можно группировать в подмножества-блоки,
ТО рекомендуются блочные рандомизированные планы

ЕСЛИ  число факторов равно двум
И имеется один блок-фактор (источник неоднородности), 
И все факторы имеют одно и то же число уровней, равное пяти,
И экспериментатор обладает ресурсами для полного перебора всех вариантов, 
И данные эксперимента представлены линейной моделью без взаимодействий, 
ТО рекомендуется план эксперимента на основе 5х5 латинского квадрата с сокращением числа опытов в 5 раз по сравнению с полным перебором

На экране дисплея изображается предлагаемый план эксперимента:

  Фактор В
b1 b2 b3 b4 b5
Фактор А a1 c1 c2 c3 c4 c5
a2 c3 c4 c5 c1 c2
a3 c2 c3 c4 c5 c1
a4 c4 c5 c1 c2 c3
a5 c5 c1 c2 c3 c4

  Уровни блок-фактора c (c1, c2, c3, c4, c5) расположены по схеме латинского квадрата, когда каждый элемент встречается только один раз в строке и один раз в столбце. 

К знаниям третьего типа относится выбор наиболее перспективного пути решения задачи. Такие знания получаются в результате компьютерного моделирования различных ситуаций при принятии решений о выборе плана эксперимента с учетом экономических, статистических и информационных требований. 

Важной частью реализации механизма вывода является стек активных вершин, в котором содержится список номеров вершин, ожидающих очереди активизирования. База данных системы содержит базы, используемые в процессе вывода, и вспомогательные базы, включающие в себя каталог планов эксперимента, библиографическую информационную систему и каталог теорем. 

Система обеспечивает помощь в обучении, состоящую из helpon line тезауруса, словаря и учебника. Тезаурус содержит терминологию по планированию эксперимента, толковый словарь стандартизирует терминологию во время диалога, перед началом которого в память загружается программа, управляющая доступом к словарю. Программа для генерации планов эксперимента хранится на диске в отдельных файлах и вызывается по мере необходимости. 

Для оперативного использования пакетов прикладных программ в научных исследования в качестве надстройки к пакету специального программного обеспечения применяются компактные ИС. Основными функциями таких систем являются идентификация задач (определение целей, ресурсов и ограничений) исходя из потребностей пользователя, свойств данных и возможностей пакета. Описанная в работе [ ] малая ИС с удобной организацией диалога предназначена для выбора процедур статистического анализа. Система имеет три основных режима работы:

  • ввод знаний - создание базы знаний или накопление сведений по статистике, используемых при работе с пакетом (здесь в диалоговом режиме в процессе ответов на вопросы, связанные с решением конкретной задачи, формируется элемент базы знаний, содержащей возможные решения);

  • вывод знаний - режим обучения или получения рекомендаций по применению статистического критерия или метода (работая в режиме "вопрос - ответ" система на основе данных, полученных от пользователя, выдает соответствующие рекомендации);

  • использование знаний при работе с пакетом (в этом случае система на основе введенных данных конструирует план решения задачи и запускает необходимые процедуры пакета). 

Во втором режиме на экран выдаются рекомендации по применению метода и соответствующее обоснование, а в третьем - запускается сама процедура. Структура базы знаний ИС в области регрессионного анализа описывается следующим образом. При ее выборе рассматривался предикат вида 

Р(VРj , РПk), 

где VPj - вектор параметров, описывающий характеристики проблемной ситуации; РПk - идентификатор рекомендуемой процедуры (в случае правильного ее выбора предикат принимает истинное значение). Регрессионный анализ данных предусматривает этапы выбора целей Сi, оценки свойств данных Di и исследования свойств модели Мi. Выбор необходимого метода может зависеть от процедур, использующихся на предыдущих шагах Пi. В результате рассмотренный предикат принимает вид 

Р(С1,:,СNc,D1,:,DND,М1,:,МNM,П1,:,ПNP,РПk). 

Здесь NC, ND, , - количество возможных целей, свойств данных и модели и число процедур, которые могут оказать влияние при анализе альтернатив и выборе нужной процедуры. 

Сокращение исходного объема пространства решений достигается за счет использования системы продукций, представленной для элемента базы знаний в виде таблицы, строками которой являются предикаты описанного вида. 

Расширение функциональных возможностей ИС ведется авторами в направлении ее использования для выработки стратегии статистического анализа при создании оригинального эконометрического проекта. 

Решение задач моделирования обеспечивает ИС, описанная в работе [ ]. Система относится к классу расчетно-логических и позволяет решать задачи, связанные с изучением динамики сложных объектов с блочно-модульной структурой. Система настраивается на произвольную предметную область. При этом реальный динамический объект и задача его исследования описываются в виде спецификации в контексте предметного уровня модели рассматриваемой области знаний. По этой спецификации аппарат предметного уровня формирует прикладную модель объекта, которая переводится в спецификацию в контексте формального уровня модели предметной области. После этого аппарат формального уровня формирует модель объекта. По аналогичной схеме строится алгоритмическая модель объекта, представляющая собой набор прикладных программ. Система включает в себя функциональные подсистемы:

  • формирования трехуровневой модели предметной области (используется для описания предметного, формального и алгоритмического уровней модели предметной области);

  • описания технического объекта и постановки задачи в виде спецификации в контексте предметного уровня рассматриваемой модели;

  • формирования алгоритмической модели динамического объекта (по описанию, данному пользователем);

  • решателя, организующего вычисления по соответствующей алгоритмической модели объекта;

  • отображения результатов расчетов в виде графиков для просмотра и интерпретации результатов;

  • обработки ошибок (осуществляет контроль ошибок);

  • подсказки (help-on-line), позволяющей получать информацию для эффективной работы с системой. 

Инструментальная среда САТУРН для разработки и эксплуатации прикладных инструментальных систем в области математического моделирования и вычислительного эксперимента описана в работе [ ]. Система представляет собой перспективную форму организации программного обеспечения вычислительного типа (пакеты знаний). Это смешанный интегрированный программный комплекс, объединяющий в себе возможности пакетов прикладных программ высокого уровня и ИС. 

В отличие от традиционных ИС, пакеты знаний обеспечивают выполнение большого числа вычислений. Рассматриваемый пакет включает в себя совокупность алгоритмических, схемных и технологических знаний о проблемной области и соответствующих средств их обработки. Алгоритмические и схемные знания носят формализованный характер и являются основными для развитых пакетов программ. Технологические знания являются экспертными. Алгоритмические знания в соответствии с модульным принципом представляются совокупностью процедур на базовых языках программирования. Эти знания обеспечивают решение отдельных задач и оформляются в виде библиотек подпрограмм. Схемные знания определяют функциональную архитектуру предметной области, которая характеризуется такими понятиями, как проблема, подпроблема, задачи, методы, алгоритмы, а также совокупностью понятий атрибутов перечисленных действий (параметры предметной области). Этапы (базовые операции) имеют содержательный смысл и выполняют преобразование значений одних параметров (входящие параметры) в значения других параметров (выходные параметры) операции. Построение схемы предметной области в виде множества базисных операций и параметров и представление алгоритма ее решения составляют основную цель декомпозиции проблемы в виде структурного анализа алгоритмов предметной области и их атрибутов. 

В рамках принятого формализма модель динамического объекта относится к числу специфических параметров предметной области - динамических параметров, являющихся операциями. Каждой подпроблеме соответствует множество операций, композицией которых реализуется необходимый алгоритм метода решения требуемой задачи. Наряду с традиционными для пакетов программ алгоритмическими и схемными знаниями технологические знания обеспечивают высококвалифицированные консультации и выполняют роль обучающей системы. Множество таких рекомендаций образуют проблемно-ориентированную технологию решения задачи с помощью пакета знаний. 

Система STAR(M) [ ] направлена на ассистирование научным исследованиям. Она является элементом интеллектуального процесса, включает специалистов разной квалификации и поддерживает знаниями взаимодействие специалистов между собой. ИС настраивается на конкретные условия применения (область науки) и совершенствуется (развивается) в процессе эксплуатации. Стимулирование действительности осуществляется путем непрямых воздействий (наглядность методологии, интеллектуальная контекстная информация, стимулирование мышления, специальные психологические приемы). С точки зрения представляемых системой знаний специалисты могут быть упорядочены по старшинству. В основу показателей качества системы положено понятие "источника" исследовательских ситуаций. В качестве источников выступают конкретные публикации результатов оригинальных научных исследований, что обеспечивает не только высокий уровень информации, но и ответственность (открытость для проверки). Показателями качества являются полнота покрытия множества исследовательских ситуаций, полнота логической схемы и указания направлений обсуждения заключительных разделов публикаций, использование лучших решений по логике, выразительности представления результатов исследований и др. 

Широкие перспективы поддержания научных исследований открывают возможности многоагентных систем. Используемые как персональные помощники научных работников и программистов интеллектуальные агенты автономно функционируют в сети, ассистируют исследователям в работе с электронной почтой, собирают и комбинируют знания, решают различные задачи. 

Практический интерес при решении исследовательских задач представляет инструментальная система автоматизации комплексного моделирования, описанная в работе [ ]. 

Методологический базис этой системы предусматривает:

  • алгоритмический подход совместно с концепцией визуализации знания как основу глобального формализма представления знаний, принятого в системе;

  • технологию множественного моделирования как средство снижения интеллектуального порога, необходимого для общения пользователя с компьютером. 

Реализация механизмов визуализации знаний осуществлена с помощью алгоритмических сетей, представляющих собой конечный граф, дугам (переменным) которого сопоставлены явления, характеризующие объект, а вершинам (операторам) - функциональные отношения, связывающие эти явления. Для обеспечения работы системы предложен специальный язык алгоритмических сетей, синтаксис которого достаточно прост и удобен при описании моделей с альтернативным поведением. Операции над используемыми сетями реализованы с помощью алгебры алгоритмических сетей. Визуализация объекта моделирования достигается путем формирования структуры визуализированного образа и подбора соответствующих функциональных отношений. 

При практическом применении системы можно рассматривать тексты с формулировкой постановки задачи; метод "раскрутки", состоящий в постепенном выстраивании визуализированного образа с учетом новых знаний в описании объекта; привлечение априорных знаний о структуре подобных объектов, а также использование ранее созданной формальной модели. 

Для успешного освоения технологии построения алгоритмических сетей полезным оказывается применение технологии множественного моделирования [ ]. Эта технология предполагает создание модельных баз для различных предметных областей на основе конструирования формально-логических моделей. Результаты моделирования представляются в удобной табличной и графической формах, а процесс взаимодействия с компьютером обеспечивается дружественным интерфейсом с элементами когнитивной графики.

 

 

Все курсы