Моделирование экосистем
Предыдущая На главную Вверх

[На главную]
[Вверх]
 

Наш Блог
Мониторинг УЗВ

 

Математическое моделирование замкнутых систем

Нам иногда приходят письма с вопросами про то как можно математически моделировать замкнутые системы?
Большинство рыбоводов даже не знает, что такое системный анализ. Это важно для проектирования и создания замкнутых биологических систем. Очень удобно применять математическое моделирование к установкам замкнутого водоснабжения, для выращивания рыбы.

Например не возможно разработать серийное производство замкнутых экосистем, как например Аквамир.

Нами разработана компьютерная, математическая модель экологической системы, основанной на теории стохастических автоматов (вероятностный автомат), авторегуляции и термодинамики. Успешное применение такой концепции моделирования замкнутых экосистем привело к созданию замкнутых аквариумов (Аквамир). Для жизнедеятельности которых требуется внешний источник энергии - свет и комнатная температура.
Универсальность подхода данной модели, дает возможность ее применения не только к моделированию пресноводных, но и к морским системам.

Мы все таки не теряем надежды, что нам когда-нибудь поручат спроектировать замкнутую систему или хотя бы разработать концепцию системы для исследования дальнего космоса человеком.

Но мы отвлеклись от темы. Небольшая лекция про моделирование биологических замкнутых систем.

Использовались материалы следующих книг:
1. Математическое моделирование, Пучкин, Москва, 1989.
2. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика, Усков, Москва, 2004.
3. Статья С.Короткий про нейронные сети.

Введение

Начатья бы хотел с высказывания Мартина Сандера (Техническое оснащение аквариума, 2002 г.)
Наше общество технократическое. Общество особенно критически настроено против химии  и еще более против генной биологии. В современном обществе наиболее остро проводятся дискуссии по следующим темам: "Химия отравляет окружающий мир", "Техника разрушает естественный круговорот" и "Биологические вторжения манипулируют природой". Но стандарт жизни нашего общества достиг уровня, который может поддерживаться только через предельные усилия в вышеназванных трех областях знаний. На деле техника, химия и биология все больше сливаются друг с другом и создают условия для высокого качества жизни все большего количества людей на меньшем пространстве.

Зеленым шрифтом ниже выделены понятия слов из Большой Российской энциклопедии.

Существует три основных метода моделирования экосистем:

  1. Стохастический метод черного ящика (применения классической теории систем). Предполагается, что на детерминированные связи внутри системы

    Детерминированный автомат,
    математическая модель системы, состояния которой меняются в дискретные моменты времени, причём каждое состояние системы полностью определяется предыдущим состоянием и входным сигналом. Д. а. формально описывается в виде функции f (si, aj) = ak, где si - входной сигнал, а aj - предыдущее состояние. Типичный пример Д. а. - цифровая вычислительная машина, в которой состояние всех регистров и ячеек определяется их предыдущим состоянием и входными сигналами. Д. а. являются естественной формой описания логической структуры дискретных вычислительных устройств. Переход к недетерминированным автоматам возможен как путём введения вероятностей смены состоянии , так и посредством свободного выбора следующего состояния.

    повсеместно накладываются стохастические явления. Большую роль здесь принадлежит оценке экспериментальных данных о состоянии системы.

  2. Детерминистический имитационный метод (использование классических методов для изучения экосистем). Динамика каждого процесса изучается с помощью экспериментов, которым отвечают дифференциальные уравнения, входящие в одну общую модель системы. Модельные эксперименты для проверки различных теоретических предположений относительно экзогенных явлений

    Экзогенные процессы обусловлены главным образом воздействием внешних сил: энергией солнечной радиации, силой тяжести и т.п. греч.Exo - снаружи + Genes - рождающий, рожденный

     и эндогенных изменений состояния системы

    (от эндо... и ...ген), внутреннего происхождения, действующий внутри чего-либо, объясняемый внутренними причинами; возникающий вследствие внутренних причин

     выполняются с помощью компьютера.

  3. Кибернетический метод (подход к экосистеме как к самооптимизирующейся системе).

    Кибернетика биологическая,
    биокибернетика, научное направление, связанное с проникновением идей, методов и технических средств кибернетики в биологию. Зарождение и развитие К. б. связаны с эволюцией представления об обратной связи в живой системе и попытками моделирования особенностей ее строения и функционирования (П. К. Анохин, Н. А. Бернштейн и др.). Эффективность математического и системного подходов к исследованию живого показали и многие работы в области общей биологии (ДЖ. Холдейн, Э. С. Бауэр, Р. Фишер, И. И. Шмальгаузен и др.). Процесс "кибернетизации" биологии осуществляется как в теоретической, так и в прикладной областях. Основная теоретическая задача К. б. - изучение общих закономерностей управления, а также хранения, переработки и передачи информации в живых системах.

    При исследовании экологических процессов и систем, характеризующихся взаимосвязью детерминированных и стохастических процессов, используются соответствующим образом модифицированные методы, разработанные и апробированные в теоретической и прикладной кибернетике. Изменения в состоянии системы воспроизводятся на ЭВМ.

Еще одна тенденция связана с использованием законов термодинамики необратимых процессов и применения этой теории для изучения экосистем.

В модели Краснобородько эти методы объединены для моделирования замкнутых биологических систем. Ведь не секрет, что на стыки нескольких дисциплин вероятность прорыва в науки очень велика.

Теория систем и экосистемы

Изучение сложных взаимосвязей между различными элементами объективной реальности привело к возникновению общей теории, получившей название теории систем.

Теория систем применяется на этапе обобщения для исследования законов динамики различных систем и абстрактного выделения из реальных систем отдельных характеристик, являющихся общими для всех или хотя бы для одного класса систем. Это стимулировало интерес к кибернетическим системам, которые поддаются управлению, т.е. целенаправленному воздействию. Вместе с тем повысился интерес к математическим моделям, которые можно использовать для получения дополнительной информации о реальных системах. Все методы, предусматриваемые таким подходом, были объединены под общим названием системный анализ.

Основные этапы системного анализа:

Основные этапы системного анализа

1. Специалист исследует реальную замкнутую систему.

2. При проведении исследования реальной действительности благодаря индуктивной (как правило, статистической)

Индукция, 1) лог., или наведение, такой процесс мышления, посредством которого мы, опираясь мысленно на принцип единообразия природы, выводим из единичных (а иногда и общих) оснований положение всегда более общее, чем эти основания; например, подмечая какой-либо признак в нескольких объектах, отсюда заключаем о присутствии его во всех объектах того же рода.

Дедукция - форма умозаключения от общего к частному и единичному, характеризующаяся тем, что новое знание о предмете или группе однородных предметов выводится на основании:
- знания класса, к которому принадлежат исследуемые предметы; и
- общего правила, действующего в пределах данного класса предметов.
лат.Deductio - выведение

и дедуктивной (теоретической) абстракции приводят к идеализации системы, определяемой как вербальная модель. Конкретная форма модели обычно обусловлена результатом объединения теоретических концепций с экспериментальными (эмпирическими) данными. При этом любая вербальная модель базируется на более или менее развитой теории моделируемой системы.

3. Вербальная модель формализуется посредством математических методов, в результате чего мы получаем математическую модель. Формализованная теория позволяет выполнить описание большинства явлений на основе лишь конечного, небольшого количества фундаментальных закономерностей. Модель обеспечивает обозримость объекта путем сокращения его избыточности и, следовательно, является звеном между теоретическим и эмпирическим познанием. Модели используются для замены реальных процессов и систем, однако их поведение должно быть сравнимо с поведением реальных процессов. Отсюда вытекает, что любая модель является компромиссом между теорией и экспериментом. Вычислительный алгоритм модели, реализуемый на компьютере, делает возможным имитацию явлений с помощью модели. Полученные в результате имитации данные можно использовать для сравнения с результатами наблюдений, а также с имеющейся информацией о поведении реальных систем.

Отношения между основными переменными состояния данной модели обычно не согласуются полностью с отношениями между переменными состояния реальной системы. Таким образом действительность искажается (погрешностью оценки отношений). сравнение модели и объекта с целью оценки погрешности дает возможность улучшить согласование модели с реальной системой. Такое испытание позволяет улучшить вербальную и (или) математическую модель или же расширить наши знания о реальной системе. Эта процедура может выполняться многократно. По завершении испытания математической модели ее можно применять для изучения других состояний той же системы и даже иных систем. Такой подход называется прогнозированием. Использование моделей с целью увеличения наших теоретических и экспериментальных знаний называется анализом модели.

В основе системного анализа лежит абстрагирование, позволяющее выявить главные свойства математической модели. Оно означает предельное упрощение реальности, рассматриваемой под определенным углом зрения. Модель никогда не идентична реальности, а скорее всего является продуктом нашего собственного воображения.

Создание и практическое использование моделей является главным проблемами в теории систем и системного анализа при подходе к проблемам замкнутых экосистем, где необходимо уделять внимание следующему: модель должна строиться на основе гибкой гипотезы с тем, чтобы информацию можно было извлекать даже из ошибок. Модель основанная на гибкой гипотезе, способствует поступательному движению в перед, даже если в данный момент времени не имеется математического решения. Такой подход получил название гипотетико-дедуктивной методологии.

Эта методология отличается от ранее возникшей более описательной научной методологии главным образом тем, что она допускает существование неточностей и риска ошибочной интерпретации результатов. Любая модель, позволяющая лучше понять суть проблемы, играет не мене важную роль, чем факты и наблюдения.

Системы и виды систем

Система — это часть объективной реальности, ограниченная рядом условий, Она состоит из более мелких единиц — элементов (отдельностей), связанных между собой различными отношениями (связями). Все, что находится за пределами системы, называется окружающей средой. Система и окружающая среда разделены оболочкой — границей системы. Например, все популяции в аквариуме, связанные друг с другом, а также с «сопутствующими» факторами (например, свет, кислород), составляют одну экосистему, в то время как стекло аквариума будет являться для этой системы окружающей средой. Граница системы проходит по стеклу и водной поверхности.

Выделение (кибернетической) системы из окружающей среды

Определение границ системы носит условный характер и строится на ряде предположений. Один и тот же элемент может быть частью системы или окружающей среды в зависимости от того, в каком аспекте он рассматривается. Однако это не значит, что мы не располагаем критериями, которые позволяют относить элементы к системе или окружающей ее среде. Поскольку связи между элементами системы представляют собой важную характеристику, граница системы обычно проводится таким образом, чтобы большая часть взаимосвязей, в особенности обратных связей, находилась внутри системы и лишь некоторые из них выходили за ее пределы. Можно выделить два вида наиболее важных связей: прямую и обратную.

Отношения (связи) между элементами системы

Экосистемы относятся к разряду систем, именуемых сложными, и имеют следующие характеристики.

1. Сложность: количество и разнообразие видов связей между элементами системы, а также между системой и окружающей средой, очень велико.
2. Целостность: система имеет свойства, которые становятся явными только в результате взаимодействия ее отдельных элементов.
3. Многомерная устойчивость: нелинейные и нестационарные системы могут иметь несколько устойчивых областей, число которых определяется количеством особых точек системы.
4. Управляемость: система может переходить из одного состояния в другое в течение определенного промежутка времени. Система называется управляемой, если на нее можно оказывать целенаправленное воздействие.
5. Наблюдаемость: информацию о предыдущем состоянии системы можно получить исходя из ее нынешнего состояния.
6. Буферность и способность к сохранению: перевод от одного состояния к другому в результате вмешательства каких-то факторов не носит взрывной характер, а характеризуется постепенным развитием.
7. Обработка информации и ее хранение: экосистемы могут преобразовывать получаемую информацию в соответствии со своей спецификой. Они также способны соединять эту информацию с другими данными, хранящимися в самой системе, с тем чтобы выдать новую информацию.
8. Качественные различия между элементами системы.
9. Структуры в экосистемах характеризуются физическими условиями (например, делением пространства, световыми и энергетическими условиями, химическими условиями, которые складываются из количественного распределения органических и неорганических веществ, биологическими условиями (например, трофические уровни, экологический спектр и разнообразие видов) и временной структурой (например, биологической сукцессией, эволюцией системы).

Сукцессия - последовательная смена экосистем, преемственно возникающих на определенном участке земной поверхности. Обычно сукцессия происходит под влиянием процессов внутреннего развития сообществ, их взаимодействия с окружающей средой. Длительность сукцессии составляет от десятков до миллионов лет.
лат.Succesio - преемственность

10. Функции экосистемы обусловлены характером циркуляции вещества и энергии, взаимодействием элементов, входящих в систему, а также взаимосвязью между экосистемой и окружающей средой. Между взаимодействующими популяциями на различных трофических уровнях имеются особые экологические функции (например, соперничество, отношения хищник — жертва и др.), В целом системы имеют следующие переменные:

Характеристика системы с помощью входных и возмущающих переменных, а также переменных состояния

Входные переменные х1, через которые осуществляется воздействие окружающей среды на систему (например, биологические, химические, метеорологические условия, географическое местоположение экосистемы и т, д.).

Выходные переменные у1, характеризующие реакцию системы на воздействие окружающей среды.

Переменные состояния u1, характеризующие способность системы к сохранению и осуществлению обратной связи, а также ее реакцию на влияние случайных факторов.

В экосистемах на эти три переменные обычно накладываются возмущающие переменные d1.

Действие этих переменных в пространстве и времени обычно описывается при помощи детерминированных или стохастических функций в зависимости от того, можно ли связать определенное значение или вероятностное распределение возможных значений зависимых переменных с каждым значением независимых переменных.

Обычно системы считаются изолированными, открытыми или замкнутыми. В замкнутых системах не происходит обмена энергией, веществом и информацией с окружающей средой, и в большинстве случаев они представляют собой идеализацию реальной действительности. Имея дело с естественными системами, в Лучшем случае можно говорить о замкнутости лишь в отношении вещества. Например, Аквамир с точки зрения обмена веществ может быть замкнутым, но с точки зрения энергии не замкнутым, т.к. получает последнюю из вне в виде света.

Управление в экологических системах

Любой процесс управления заранее предполагает существование управляемых объектов и системы, управляющей этими объектами. В этом смысле управление означает целенаправленное воздействие управляющей системы на один или несколько управляемых элементов. Регулирование — это процесс управления с обратной связью (частный случай управления), в котором ведется непрерывное измерение управляемой переменной и ее сравнение с заданной переменной. Цель управления формализуется посредством целевой функции или целевого функционала, причем целью в первом случае служат фиксированные величины, а во втором — переменные. Выражение экстремальное управление используется в тех случаях, когда речь идет о минимуме или максимуме целевого функционала по управляющим переменным. Если же речь идет лишь об одной управляющей переменной, то получение минимума или максимума целевой функции определяется как оптимальное управление. При наличии нескольких управляющих переменных между различными целями управления может существовать лишь компромиссное решение. Все процессы управления как в технологических, так и нетехнологических системах (а значит, и в экосистемах) носят информативный характер.

Процесс управления предполагает наличие управляющего элемента и управляемой системы (управляемого элемента). Управляющий элемент производит сбор и обработку информации, получаемой из окружающей среды или из самой системы, и оказывает необходимое воздействие на управляемую систему. Свойства любой управляемой системы зависят от ряда факторов, таких как параметры системы, структура системы, возмущения, алгоритмы управления и т. д.

В экологических процессах и системах трудно провести линию раздела между управляющей и управляемой системами, поскольку, как правило, участвующие процессы ввиду их сложности физически неразделимы. И если иногда подобная дифференциация проводится, несмотря на существующие трудности, то она выполняется в виде умозрительного эксперимента,
чтобы тем самым подкрепить наши собственные доводы и сделать возможным использование кибернетических методов, первоначально предназначавшихся для изучения систем с независимой физической материализацией управляющей и управляемой систем.

В экологических системах различают три группы управления:

Управление в экологических системах

1) естественное внутреннее управление (саморегуляция или самооптимизация);
2) естественное внешнее управление через возмущающие переменные окружающей среды;
3) внешнее управление, предполагающее воздействие человека на экосистему и охрану окружающей среды.

Информационное содержание экосистемы тесно связано с управлением. Вся информация о процессах, проходящих в подсистемах, а также данные о качественном составе и состоянии отдельных частей системы и окружающей среды, служат информационными источниками для управления системой. Например, температура играет информативную роль для биологического блока модели, поскольку она дает информацию о важных характеристиках окружающей среды и управления интенсивностью различных процессов. Потоки энергии и массы в экосистемах служат для переноса информации. Некоторые определяют информацию как совокупность механизмов с обратной связью, где каждый отдельный перенос энергии и массы вызывает встречный поток информации.

В результате экспериментов с Phragmites, проведенных в отстойниках, куда не могли проникнуть рыбы, состав популяций высших растений, перифитона, зоопланктона и других животных организмов изменился до неузнаваемости. Информация о подобном изменении окружающей среды существенно сказалась даже на тех популяциях, которые не были непосредственно связаны с данным процессом. Аналогичную картину можно получить с помощью модельной имитации. Например, при экспериментировании с моделью AQUAMOD-3 обмен (диффузия) между гиполимнионом и осадками является чисто физической переменной, которая строго запрограммирована в модели. Однако интенсивность обмена чутко реагирует на изменение скорости роста фитопланктона, возникающее из-за переменного освещения в эпилимнионе.

Кебернетическая идеализация экологической системы на примере фитопланктонной подсистемы

На рисунке схематически представлена концепция саморегуляции, целевой функции, управляющего элемента и управляемой системы в экосистеме. Целевая функция Q характеризует генетически фиксированную способность организмов к выживанию. Управляющий элемент является «мозгом», действующим на двух уровнях. Информация обрабатывается при помощи возмущающих переменных и подсистем, сопоставляется с целевой функцией и затем передается в виде сигнала w. Этот сигнал определяет, какая активность микроорганизмов является наиболее оптимальной для данного отрезка времени, Данный уровень получил название оптимизатора — термин, заимствованный из технической кибернетики. Управляемая система располагает рядом возможностей для реализации сигнала w. Одна из них связана с выбором соответствующих значений параметров. Этот уровень определяется как управляющий элемент (контроллер), так как он оказывает влияние на управляемую систему сигналом w*.

Иерархическая структура экосистем

Введение понятия «иерархия» в биологии будет играть такую же роль, как введение концепции обратной связи. Это в особенности относится к системам хищник — жертва, где существование иерархической структуры давно считается общепризнанным фактом.

Иерархическую организацию экосистемы можно рассматривать под тремя
различными углами зрения.

Иерархия биологической организации считается классической характеристикой биологических систем: различные уровни организации (экосистема, сообщество, популяция, особь, надклеточный уровень физиологических процессов, клеточный и подклеточный уровни) являются типичными примерами организационной иерархии. Координация в этом случае направлена от
верхнего организационного слоя к параллельным единицам нижележащего слоя. Например, физиологические процессы, происходящие в особи, координированы друг с другом.

Трофическая иерархия — классический экологический термин, который по смыслу согласуется с термином «эшелон»,
применительно к общим системам:

Иерархическая структура экосистем

на рисунке а) показана схема многоуровневой системы. Информационные связи в ней действуют в обоих направлениях. Информация поступает из нижних эшелонов в верхние в ходе процесса. И именно сверху осуществляется координация параллельных единиц на нижнем уровне.

Иерархия управления. На рисунке б) процессы прямого управления, адаптации и выбора разделены. В экологии прямое управление означает непосредственное, всегда фиксированное воздействие переменной на процесс (например, влияние экзогенных возмущающих переменных в соответствии с фиксированным уравнением ). Адаптация — это такое явление, при котором действующие параметры меняются в соответствии с поступающей информацией. Под выбором понимается отбор нескольких возможных путей реализации (например, из-за присутствия в системе нескольких различных видов) путем изменения структуры системы посредством включения или выключения отдельных связей. Этот процесс получил название самоорганизации системы. В тех случаях, когда генетический код настолько сильно меняется, что это служит началом биологической эволюции, применяется термин самоэволюция. Целевая функция, или стратегия системы и ее элементов, также подвергается изменению в ходе этого процесса.

Кибернетическая классификация моделей экосистем

В прикладной кибернетике основой для классификации систем служат различные виды управления. Это связано с разнообразными техническими реализациями управления. При рассмотрении экосистем природа самих систем остается неизменной, в то время как наши представления и модели меняются. Тем не менее подобная классификация применима к этим моделям в соответствии с теми видами управления, которым мы отдаем предпочтение.

 

На рисунке показано разделение между классами тех моделей экосистем, которые характеризуются самым высоким типом управления. Иерархические модели вводятся здесь как новый класс моделей.

В процессе развития экологии пресноводных водоемов модели различных процессов или подсистем претерпели многократные изменения. К примеру, .........................................

Модели бывают:

1. Гидрохимические.
2. Термодинамического равновесия.
3. Поглощение пищи, выделение и автолиз.
4. Модели первичной продукции: Классические модели фотосинтеза, роста и потерь популяции. Модели перефитона, бентосных водорослей и макрофитов.
5. Модели вторичной продукции. Вторичные продуценты, это все животные.
6. Модели баланса.

..........................................

Основы теории нейронных сетей

Под искусственными нейронными системами подразумевается вычислительные структуры, состоящие из большого числа однотипных элементов, каждый из которых выполняет относительно простые функции. Такой принцип построения был заимствован у нервной системы живых организмов.

В последние десятилетия в мире бурно развивается новая прикладная область математики, специализирующаяся на искусственных нейронных сетях (НС). Актуальность исследований в этом направлении подтверждается массой различных применений НС. Это автоматизация процессов распознавания образов, адаптивное управление, аппроксимация функционалов, прогнозирование, создание экспертных систем, организация ассоциативной памяти и многие другие приложения. С помощью НС можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту и конечно управлять сложными замкнутыми системами.

Модели НС могут быть программного и аппаратного исполнения. В дальнейшем речь пойдет в основном о первом типе.

Несмотря на существенные различия, отдельные типы НС обладают несколькими общими чертами.

Искусственный нейрон

Рис.1 Искусственный нейрон

Во-первых, основу каждой НС составляют относительно простые, в большинстве случаев – однотипные, элементы (ячейки), имитирующие работу нейронов мозга. Далее под нейроном будет подразумеваться искусственный нейрон, то есть ячейка НС. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов – однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон – выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов. Общий вид нейрона приведен на рисунке 1. Каждый синапс характеризуется величиной синаптической связи или ее весом wi, который по физическому смыслу эквивалентен электрической проводимости.

Текущее состояние нейрона определяется, как взвешенная сумма его входов:

Текущее состояние нейрона определяется, как взвешенная сумма его входов                                                                                                                                                  (1)

Выход нейрона есть функция его состояния:

y = f(s)                                                                                                                                                                 (2)

функция единичного скач­ка; б) линейный порог (гис­те­ре­зис); в) сигмоид – гипербо­ли­ческий тангенс; г) сигмоид – фор­мула (3)

Рис.2 а) функция единичного скач­ка; б) линейный порог (гис­те­ре­зис); в) сигмоид – гипербо­ли­ческий тангенс; г) сигмоид – фор­мула (3)

Нелинейная функция f называется активационной и может иметь различный вид, как показано на рисунке 2. Одной из наиболее распространеных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида)[2]:

логистическая функция или сигмоид                                                                (3)

При уменьшении a сигмоид становится более пологим, в пределе при a=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении a сигмоид приближается по внешнему виду к функции единичного скачка с порогом T в точке x=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем.

Одно из ценных свойств сигмоидной функции – простое выражение для ее производной                                                                                                                  (4)

Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон.

Однослойный перцептрон

Рис.3 Однослойный перцептрон

Возвращаясь к общим чертам, присущим всем НС, отметим, во-вторых, принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

В качестве примера простейшей НС рассмотрим трехней­ронный перцептрон (рис.3), то есть такую сеть, нейроны которой имеют активационную функцию в виде единичного скачка* . На n входов поступают некие сигналы, проходящие по синапсам на 3 нейрона, образующие единственный слой этой НС и выдающие три выходных сигнала:

НС и выдающие три выходных сигнала j=1...3                                                   (5)

Очевидно, что все весовые коэффициенты синапсов одного слоя нейронов можно свести в матрицу W, в которой каждый элемент wij задает величину i-ой синаптической связи j-ого нейрона. Таким образом, процесс, происходящий в НС, может быть записан в матричной форме:

Y=F(XW)                                                                                                                                                             (6)

где X и Y – соответственно входной и выходной сигнальные векторы, F( V) – активационная функция, применяемая поэлементно к компонентам вектора V.

Теоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется НС. Чем сложнее НС, тем масштабнее задачи, подвластные ей.

Выбор структуры НС осуществляется в соответствии с особенностями и сложностью задачи. Для решения некоторых отдельных типов задач уже существуют оптимальные, на сегодняшний день, конфигурации, описанные, например, в [2],[3],[4] и других изданиях, перечисленных в конце статьи. Если же задача не может быть сведена ни к одному из известных типов, разработчику приходится решать сложную проблему синтеза новой конфигурации. При этом он руководствуется несколькими основополагающими принципами: возможности сети возрастают с увеличением числа ячеек сети, плотности связей между ними и числом выделенных слоев (влияние числа слоев на способность сети выполнять классификацию плоских образов показано на рис.4 из [5]); введение обратных связей наряду с увеличением возможностей сети поднимает вопрос о динамической устойчивости сети; сложность алгоритмов функционирования сети (в том числе, например, введение нескольких типов синапсов – возбуждающих, тромозящих и др.) также способствует усилению мощи НС. Вопрос о необходимых и достаточных свойствах сети для решения того или иного рода задач представляет собой целое направление нейрокомпьютерной науки. Так как проблема синтеза НС сильно зависит от решаемой задачи, дать общие подробные рекомендации затруднительно. В большинстве случаев оптимальный вариант получается на основе интуитивного подбора.

Очевидно, что процесс функционирования НС, то есть сущность действий, которые она способна выполнять, зависит от величин синаптических связей, поэтому, задавшись определенной структурой НС, отвечающей какой-либо задаче, разработчик сети должен найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными).

Этот этап называется обучением НС, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации. На этапе обучения кроме параметра качества подбора весов важную роль играет время обучения. Как правило, эти два параметра связаны обратной зависимостью и их приходится выбирать на основе компромисса.

Обучение НС может вестись с учителем или без него. В первом случае сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей. Во втором случае выходы НС формируются самостоятельно, а веса изменяются по алгоритму, учитывающему только входные и производные от них сигналы.

Существует великое множество различных алгоритмов обучения, которые однако делятся на два больших класса: детерминистские и стохастические. В первом из них подстройка весов представляет собой жесткую последовательность действий, во втором – она производится на основе действий, подчиняющихся некоторому случайному процессу.

Развивая дальше вопрос о возможной классификации НС, важно отметить существование бинарных и аналоговых сетей. Первые из них оперируют с двоичными сигналами, и выход каждого нейрона может принимать только два значения: логический ноль ("заторможенное" состояние) и логическая единица ("возбужденное" состояние). К этому классу сетей относится и рассмотренный выше перцептрон, так как выходы его нейронов, формируемые функцией единичного скачка, равны либо 0, либо 1. В аналоговых сетях выходные значения нейронов спо­соб­ны принимать непрерывные значения, что могло бы иметь место после замены активационной функции нейронов перцептрона на сигмоид.

Еще одна классификация делит НС на синхронные и асинхронные[3]. В первом случае в каждый момент времени свое состояние меняет лишь один нейрон. Во втором – состояние меняется сразу у целой группы нейронов, как правило, у всего слоя. Алгоритмически ход времени в НС задается итерационным выполнением однотипных действий над нейронами. Далее будут рассматриваться только синхронные НС.

Двухслойный перцептрон

Рис.4 Двухслойный перцептрон

Сети также можно классифицировать по числу слоев. На рисунке 4 представлен двухслойный перцептрон, полученный из перцептрона с рисунка 3 путем добавления второго слоя, состоящего из двух нейронов. Здесь уместно отметить важную роль нелинейности активационной функции, так как, если бы она не обладала данным свойством или не входила в алгоритм работы каждого нейрона, результат функционирования любой p-слойной НС с весовыми матрицами W(i), i=1,2,...p для каждого слоя i сводился бы к перемножению входного вектора сигналов X на матрицу

W(S)=W(1)×W(2) ×...×W(p)                                                                                                                                                                                                         (7)

то есть фактически такая p-слойная НС эквивалентна однослойной НС с весовой матрицей единственного слоя W(S):

Y=XW(S)                                                                                                                                                                                                                                             (8)

Продолжая разговор о нелинейности, можно отметить, что она иногда вводится и в синаптические связи. Большинство известных на сегодняшний день НС используют для нахождения взвешенной суммы входов нейрона формулу (1), однако в некоторых приложениях НС полезно ввести другую запись, например:

                                                                                                                                                (9)

или даже

                                                                                                                         (10)

Вопрос в том, чтобы разработчик НС четко понимал, для чего он это делает, какими ценными свойствами он тем самым дополнительно наделяет нейрон, и каких лишает. Введение такого рода нелинейности, вообще говоря, увеличивает вычислительную мощь сети, то есть позволяет из меньшего числа нейронов с "нелинейными" синапсами сконструировать НС, выполняющую работу обычной НС с большим числом стандартных нейронов и более сложной конфигурации[4].

Многообразие существующих структур НС позволяет отыскать и другие критерии для их классификации, но они выходят за рамки данной статьи.

Теперь рассмотрим один нюанс, преднамеренно опущенный ранее. Из рисунка функции единичного скачка видно, что пороговое значение T, в общем случае, может принимать произвольное значение. Более того, оно должно принимать некое произвольное, неизвестное заранее значение, которое подбирается на стадии обучения вместе с весовыми коэффициентами. То же самое относится и к центральной точке сигмоидной зависимости, которая может сдвигаться вправо или влево по оси X, а также и ко всем другим активационным функциям. Это, однако, не отражено в формуле (1), которая должна была бы выглядеть так:

                                                                                                                                           (11)

Дело в том, что такое смещение обычно вводится путем добавления к слою нейронов еще одного входа, возбуждающего дополнительный синапс каждого из нейронов, значение которого всегда равняется 1. Присвоим этому входу номер 0. Тогда

                                                                                                                                                   (12)

где w0 = –T, x0 = 1.

Очевидно, что различие формул (1) и (12) состоит лишь в способе нумерации входов.

Однонейронный перцептрон

Рис.5 Однонейронный перцептрон

Из всех активационных функций, изображенных на рисунке 2, одна выделяется особо. Это гиперболический тангенс, зависимость которого симметрична относительно оси X и лежит в диапазоне [-1,1]. Забегая вперед, скажем, что выбор области возможных значений выходов нейронов во многом зависит от конкретного типа НС и является вопросом реализации, так как манипуляции с ней влияют на различные показатели эффективности сети, зачастую не изменяя общую логику ее работы. Пример, иллюстрирующий данный аспект, будет представлен после перехода от общего описания к конкретным типам НС.

Какие задачи может решать НС? Грубо говоря, работа всех сетей сводится к классификации (обоб­щению) входных сигналов, принадлежащих n-мерному гипер­про­странству, по некоторому числу классов. С матема­ти­ческой точ­ки зрения это происходит путем разбиения гипер­про­стран­ства ги­пер­плоскостями (запись для случая однослой­ного пер­цеп­тро­на)

,  k=1...m                                                                                                                                (13)

Таблица 1

x1       x2

0

1

0

A

B

1

B

A

Каждая полученная область является областью определения отдельного класса. Число таких классов для одной НС перцептронного типа не превышает 2m, где m – число выходов сети. Однако не все из них могут быть разделимы данной НС.

Например, однослойный перцептрон, состоящий из одного нейрона с дву­мя входами, представленный на рисунке 5, не способен разделить плос­кость (двумерное гиперпространоство) на две полуплоскости так, чтобы осу­ще­ствить классификацию входных сигналов по классам A и B (см. таблицу 1).

Уравнение сети для этого случая

                                                                                                                                     (14)

является уравнением прямой (одномерной гиперплоскости), которая ни при каких условиях не может разделить плоскость так, чтобы точки из множества входных сигналов, принадлежащие разным классам, оказались по разные стороны от прямой (см. рисунок 6).

Если присмотреться к таблице 1, можно заметить, что данное разбиение на классы реали­зу­ет логическую функцию исключающего ИЛИ для входных сигналов. Невозможность реализа­ции однослойным перцептроном этой функции получила название проблемы исключающего ИЛИ.

Визуальное представление работы нейронной сети

Рис.6 Визуальное представление работы НС с рисунка 5

Функции, которые не реализуются однослойной сетью, называ­ют­ся линейно неразделимыми[2]. Решение задач, подпадающих под это ог­ра­ничение, заключается в применении 2-х и более слойных сетей или се­тей с нелинейными синапсами, однако и тогда существует вероят­ность, что корректное разделение некоторых входных сигналов на классы невозможно.

Наконец, мы можем более подробно рассмотреть вопрос обучения НС, для начала – на примере перцептрона с рисунка 3.

Рассмотрим алгоритм обучения с учителем[2][4].

1. Проинициализировать элементы весовой матрицы (обычно небольшими случайными значениями).

2. Подать на входы один из входных векторов, которые сеть должна научиться различать, и вычислить ее выход.

3. Если выход правильный, перейти на шаг 4.

Иначе вычислить разницу между идеальным и полученным значениями выхода:

Модифицировать веса в соответствии с формулой:

где t и t+1 – номера соответственно текущей и следующей итераций; n – коэффициент скорости обучения, 0<nЈ1; i – номер входа; j – номер нейрона в слое.

Очевидно, что если YI > Y весовые коэффициенты будут увеличены и тем самым уменьшат ошибку. В противном случае они будут уменьшены, и Y тоже уменьшится, приближаясь к YI.

4. Цикл с шага 2, пока сеть не перестанет ошибаться.

На втором шаге на разных итерациях поочередно в случайном порядке предъявляются все возможные входные вектора. К сожалению, нельзя заранее определить число итераций, которые потребуется выполнить, а в некоторых случаях и гарантировать полный успех.

 

* Иногда перцептроном называют любую НС слоистой структуры, однако здесь и далее под перцептроном понимается только сеть, состоящая из нейронов с активационными функциями единичного скачка (бинарная сеть).

Использование нейронной сети в управлении УЗВ, удобно тем, что не надо придумывать инструкции и алгоритм управления. НС, при обучении, сама все придумает за вас. Поэтому это и называется искусственным интеллектом.

Пока на этом все. Если эта рубрика понравиться нашим читателям, то мы продолжим дальше нашу лекцию.

Следите за новостями.

 

horizontal rule

в начало страницы

Вопросы и предложения относительно того, что представлено на сайте, можно направлять по адресу:

Есть вопросы, звоните: +371 26785118
Copyright © 1997-2017 Vasiliy Krasnoborodko. All rights reserved.
Перепечатка материалов сайта запрещена без письменного согласия владельца

Яндекс цитирования Рейтинг@Mail.ru Top.LV