Концепция применения биоподобных моделей нейронных сетей для управления робототехническими системами
- Подробности
- Обновлено 29 Август 2015
- Автор: Александр Бахшиев
- Просмотров: 10234
Существует множество подходов к созданию автономных робототехнических систем системы управления которых обладают в большей или меньшей степени интеллектуальными свойствами [1,2,3]. Мы предлагаем вариант идти от моделирования систем управления движением на основе бионики. Нервная система появилась как средство активного взаимодействия со средой и эволюционировала вместе с ростом сложности своего объекта управления и требуемых реакций на среду. При этом важно именно то, что объект активно взаимодействует со средой, получая таким образом ответную обратную связь на результат своей деятельности. Мы предлагаем идти в моделировании по пути, в котором мы, не пытаясь сразу решать сложные задачи (такие как, например, обнаружение и распознавание объектов среды, перевода речи и тому подобное), реализовывать нейронные сети, управляющие объектом, взаимодействующим со средой. При этом в основу сенсорной системы можно положить небольшое число датчиков малой размерности.
В рамках предложенного возможно два различных, но взаимно дополняющих друг друга подхода:
1. Заимствование информации о нейронных структурах с известной морфологией и функцией, и построение их моделей, в дальнейшем изучение их функционирования и применение полученных знаний для решения аналогичных задач в управлении техническими системами. Плюсом является априори известная структура сетей. Однако существует мало информации об архитектурах биологических нейронных сетей управления движением. Более-менее на уровне отдельных нейронов известны только низшие уровни, непосредственно взаимодействующие с мышцами. Наиболее надежный способ здесь - моделирование простейших нервных систем.
2. Используя накопленные знания о принципах организации биологических НС разрабатывать требуемые для решения наших задач нейросетевые архитектуры. Далее идет поиск сходства или расхождения в полученных моделях с реальностью и коррекция моделей при необходимости. Плюсом является свобода в выборе архитектуры сетей. Недостатком - опасность перейти от поиска общих концепций построения сетей управления к решению частных задач. А также, как и в п.1, проверка решений "в лоб" на их адекватность биологическим прототипам затруднена, из-за нехватки морфологических данных.
Очевидно, что разумно попытаться совместить оба подхода.
Как говорилось выше, основной идеей является разработка нейросетевой системы управления, воспринимающей информацию от сенсоров и обязательно замкнутой на среду через эффекторы. Решение с помощью нейронной сети только одной частной задачи, например, распознавания образов, в момент перехода от нейросетевого представления к ограниченному набору классов резко сужает большое количество различных котекстов, в которых может использоваться формируемая НС информация к одному контексту, ограниченному набором распознаваемых классов для конкретной решаемой задачи. Общий (тривиальный) вид СУ показан на рисунке 1.
Рисунок 1. Общий вид системы управления.
Более частная схема, которую будем рассматривать дальше показана на рисунке 2. Здесь под обобщением сенсорных данных мы будем понимать процесс запоминания образов в общем (пока) смысле этого слова. Под моторной памятью мы понимаем возможность системы воспроизводить сложные движения, набору которых система была научена ранее. Блок принятия решения намеренно упрощаем до блока рефлекторной деятельности, подразумевая, что рефлексы могут быть достаточно сложны. В наших работах, мы условно ограничиваемся только задачами, которые можно решить с помощью условно-рефлекторной деятельности.
Рисунок 2. Описание СУ в терминах памяти и рефлексов
На рисунке 2 сенсоры и эффекторы не взаимодействуют друг с другом явно. Однако на практике они принципиально не всегда разделимы. Мышечное волокно, являющееся эффектором с точки зрения СУ снабжено набором сенсоров, определяющих длину мышцы и развиваемое усилие. Аналогично двигатели робота обычно оснащены как минимум датчиками положения. Это сенсоры, хотя с точки зрения управления они прямо не участвуют в процессе, к примеру, восприятия образов. Аналогично, в работе зрительной системы млекопитающих, важнейшую роль играет мышечный аппарат глаза, хотя работа этих эффекторов сама по себе обычно не учитывается в моделях анализа зрительной информации. В технике в качестве слабой аналогии можно привести поворотную (PTZ) камеру.
Исходя из этого более правильно будет нарисовать иную схему (рисунок 3). Введем понятие внутренних сенсоров и эффекторов, которые обеспечивают поддержку основной функции и не могут быть исключены из ее модели. Тогда все связи в схеме становятся двунаправленными. Это имеет принципиальное значение, речь о котором пойдет далее.
Рисунок 3. Уточненная схема СУ в терминах памяти и рефлексов
В дальнейшем мы будем говорить про правую часть схемы, отвечающую за выполнение нашим абстрактным объектом определенных движений, т.е. влияния на среду. В наших работах мы более подробно раскрываем блок моторной памяти с рисунка 3 через многоуровневую неоднородную нейронную сеть (НС). На рисунке 4 частично представлены уровни иерархии предлагаемой модели.
Рисунок 4. Структурная схема уровней нейросетевой системы управления
Здесь:
y(s) - данные с датчиков о текущем положении объекта управления;
u(rcn) - управляющее воздействие на объект;
y(rcn) - выходные данные регулятора описанные ниже;
y(a) - вектор выходных значений афферентных нейронов, соответствующий информации с датчиков о текущем положении объекта управления;
y(m) - вектор активности мотонейронов, предоставляющий информацию о текущем целевом положении объекта управления;
u(pcn1) - вектор управляющих воздействий на регулятор, активирующий необходимые мотонейроны для перехода в новое положение;
y(pcn1) - вектор текущего положения элемента исполнительной системы робота из множества заранее обученных возможных положений;
u(pcn2) - вектор желаемого положения элемента исполнительной системы робота из множества заранее обученных положений;
y(pcn2) - вектор текущего согласованного положения всех элементов робота из множества заранее обученных согласованных положений;
u(tcn) - вектор желаемого согласованного положения;
y(tcn) - вектор описывающий текущую выполняемую роботом траекторию движения;
u(top) - вектор задания желаемой траектории движения из множества заранее обученных траекторий.
Уровень регулятора предоставляет информацию о текущем положении объекта управления (например, звена манипулятора) и обеспечивает переход в заданное положение. Модель регулятора (regulatory control network – RCN) была представлена ранее в работах [4,5]. При этом мы подразумеваем, что с точки зрения системы управления имеется конечный набор возможных положений, их число определяется структурой НС регулятора.
В работе [6] представлено описание нейронной сети позиционирования (position control network – PCN), обеспечивающей согласованное позиционирование элементов исполнительной системы робота. Эта нейронная сеть представлена на схеме дважды. Сеть PCN1 обеспечивает возможность запоминания и воспроизведения (через управление регулятором) конкретных положений отдельного элемента управляющей системы робота. Сеть PCN2 объединяет набор сетей PCN1 для обеспечения собственно согласованного управления всей исполнительной системой. При этом PCN2 в свою очередь предоставляет возможность запоминать и воспроизводить конечное множество совместных положений всех элементов РТС.
Следующим этапом предполагается разработка нейронной сети управления движением по траектории (trajectory control network – TCN), что позволит на последующих уровнях управления, моделировать в свою очередь все более сложные траектории (введя, по аналогии с PCN - дополнительные уровни: TCN1, TCN2, и т.п.), а затем, абстрагируясь еще больше и добавив информацию от сенсоров (левая часть схемы рисунка 2), моделировать реакцию робототехнической системы подобно простым условным рефлексам, а затем и все более сложным рефлексам, получаемым как комбинация простых.
В зависимости от применяемых эффекторов можно исключить из модели на рисунке 4 уровень регулятора, например, в тех случаях, когда движитель имеет собственный регулятор. В этом случае уровень регулятора вырождается в модуль, преобразующий данные с датчиков в нейросетевое представление, и модуль, преобразующий нейросетевое представление о требуемом положении в управляющее воздействие на регулятор. Это является компромиссным решением. В рамках рассматриваемого подхода желательно использование эффекторов, для которых нейросетевое представление управления будет более естественным.
1. 1. J. L. McKinstry, G. M. Edelman и J. L. Krichmar, A cerebellar model for predictive motor control tested in a brain-based device, т. 103 # 9, PNAS, February 28, 2006, pp. 3387-3392
2. Hugo de Garis, Chen Shuo, Ben Goertzel, Lian Ruiting. A world survey of artificial brain projects, Part I: Large-scale brain simulations. - Neurocomputing 74 (2010), p. 3–29.
3. Бахшиев А.В., Клочков И.В., Косарева В.Л., Станкевич Л.А. Нейроморфные средства систем управления роботами // «Экстремальная робототехника», труды международной научно-технической конференции. – Санкт-Петербург: изд-во «Политехника-сервис», 2014, с. 281-286.
4. А. В. Бахшиев. Перспективы применения моделей биологических нейронных структур в системах управления движением // Информационно-измерительные и управляющие системы: - №9, 2011. с. 71-80.
5. А.В. Бахшиев, Л.А. Станкевич – Применение модели импульсной нейронной сети со структурной адаптацией в задачах управления движением //XVI Всероссийская научно-техническая конференция “Нейроинформатика-2014”: Сборник научных трудов. В 3-х частях. Ч. 2. М.: НИЯУ МИФИ, 2014.
6. А.В. Бахшиев, Ф.В. Гунделах. Исследование биоподобной модели нейронной сети для управления движением робототехнических систем // Робототехника и искусственный интеллект: материалы VI Всероссийской научно-технической конференции с международным участием (г. Железногорск, 13 декабря 2014 г.) / под науч. ред. В.А. Углева; Сиб. федер. ун-т. – Красноярск : Центр информации, ЦНИ «Монография», 2014. – с. 164-169.