Каким образом, мозг из 2 картинок, делает 3Д карту мира?

Все, что связано с техническим зрением, распознаванием речи, управлением движением и т.д.
VictorArt
Posts: 454
Joined: Thu Aug 05, 2004 8:45 pm
Location: Russia
Contact:

Post by VictorArt » Tue Sep 28, 2004 10:36 am

Я просто привёл пример состояния разработок в данной области. ГОСНИИАС - не самая последняя контора в данной области.

Есть ещё наработки по стереозрению в Питере, в ЦНИИ РТК - насколько я помню, их система успешно определяет дальность до предметов на расстоянии метров 10-ти.
Мозг нужен всем - улитке, кошке, собаке и конечно роботам.

Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Tue Sep 28, 2004 11:19 am

VictorArt Вт Сен 28, 2004 10:36 am
<...Есть ещё наработки по стереозрению в Питере, в ЦНИИ РТК - насколько я помню, их система успешно определяет дальность до предметов на расстоянии метров 10-ти...>

Спасибо, но речь ведь не об этом.
PS ========================

VictorArt
Posts: 454
Joined: Thu Aug 05, 2004 8:45 pm
Location: Russia
Contact:

Post by VictorArt » Tue Sep 28, 2004 11:23 am

А о чём? Вроде вопрос был о "Каким образом, мозг из 2 картинок, делает 3Д карту мира? " В указанных разработках как раз и делается 3Д-картинка.
Мозг нужен всем - улитке, кошке, собаке и конечно роботам.

Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Tue Sep 28, 2004 11:28 am

VictorArtи Вт Сен 28, 2004 11:23 am
<...вопрос был о "Каким образом, мозг из 2 картинок, делает 3Д карту мира?"...>

Вопрос был о мозге, а не об этих жалких симуляциях.
Дальномер в этом случае позволяет снять множество достаточно второстепенных проблем и оставить собственно работу со зрительным пространством.
PS ========================

Inex
Posts: 1897
Joined: Mon Jan 05, 2004 10:33 am
Location: Санкт-Петербург

Post by Inex » Tue Sep 28, 2004 11:53 am

VictorArt wrote:Я просто привёл пример состояния разработок в данной области.
Угу, а я знаю еще лучше решение: ходит мужик в спецовке со штангенциркулем и производит измерения... Тоже ведь строит модель :wink:
Такое построение модели - это не "данная область". Спасибо, конечно, за пример, но ведь речь (как мне показалось) не об этом. Изначально вопрос был поставлен: 1. о мозге, 2. об изображениях.
Эти системы к мозгу имеют очень отдаленное отношение; более того, они используют неизобразительную информацию. Подчеркиваю еще раз: эти системы крайне ограничены. Они не смогут, например, восстановить 3D информацию о сцене по фотографии... более того, они будут абсолютно уверенно считать, что фотография, лежащая на столе, абсолютно плоская :)
Человек же это сделает вполне свободно... Кстати, от активных методов определения расстояний в крупных корпорациях постепенно начинают отказываться, переходя от аппаратных решений к программным
Да и делать робота, который бы ходил и все подсвечивал, как-то задумчиво...
VictorArt wrote: ГОСНИИАС - не самая последняя контора в данной области.
Честно скажу, ничье достоинство принизить не хотел. Бесспорно, люди занимаются полезным делом, создают хорошие системы. Но это не есть решение поставленной в топике проблемы.
"Кто знает, тот делает, кто не знает, тот учит"

VictorArt
Posts: 454
Joined: Thu Aug 05, 2004 8:45 pm
Location: Russia
Contact:

Post by VictorArt » Tue Sep 28, 2004 2:23 pm

Вообще-то речь шла о ДВУХ картинках :) - это Вы уже сами надомысливали о плоских фотографиях :)
Хотя в целом, я согласен - пока ещё нет адекватной технологии описания окружающей реальности, имея только две видеокамеры на входе.
Мы у себя делали опыты с ЦМ - робот с двумя видеокамерами намного точнее позиционировался в пространстве. Правда никаких 3Д-моделей у него в "голове" при этом не возникало :)
С другой стороны, одноглазые пираты вполне прекрасно себя чувствовали и умудрялись выживать в условиях жесточайшей конкуренции.
Мозг нужен всем - улитке, кошке, собаке и конечно роботам.

SDI
Posts: 459
Joined: Mon Jun 21, 2004 5:06 pm

Post by SDI » Tue Sep 28, 2004 3:12 pm

VictorArt wrote:Хотя в целом, я согласен - пока ещё нет адекватной технологии описания окружающей реальности, имея только две видеокамеры на входе.
Комбинатор недавно давал ссылку на последнюю разработку Микрософт в этом направлении:
http://www.cnews.ru/newtop/index.shtml? ... /30/160718
Если ты считаешь что все понял, значит тебе плохо объяснили...

Inex
Posts: 1897
Joined: Mon Jan 05, 2004 10:33 am
Location: Санкт-Петербург

Post by Inex » Tue Sep 28, 2004 3:29 pm

VictorArt wrote:Вообще-то речь шла о ДВУХ картинках :) - это Вы уже сами надомысливали о плоских фотографиях :)
Я специально привел максимально утрированный пример, чтобы не углубляться в вопрос о стереодиспаратности. Ведь и две камеры не слишком помогут для восстановления 3D организации сцены, особенно, если изображения не ректифицированы. Но даже для ректифицированных изображений (крайне сомнительно, чтобы они получались с помощью глаз) проблема определения стереодиспаратности решена пока что весьма криво. Методы, основанные на площадях (грубо говоря, корреляционные), дают значения диспаратности для каждой точки. Не говоря уже о больших шумах, назвать 3D описанием получающееся с их помощью представление ну очень затруднительно. Методы, использующие чамферный матчинг контуров, хотя и являются более робастными и более точными, зато измеряют стереодиспаратность лишь для небольшого числа точек. Восстанавление же на этой основе поверхностей в 3D наталкивается на существенные трудности. Структурные методы дают самый осмысленный, но и наименее точный и подробный результат.
Так что о восстановлении 3D формы объектов по стереодиспаратности без использования априорных сведений речи идти не может. И это несмотря на то, что задача стереозрения является наиболее простой из всех в данном направлении. Интересно задаться вопросом: почему же это так?
ИМХО, достаточно очевидно, что это так просто вследствие некорректной постановки задачи: на основе ТОЛЬКО механизма стереозрения нельзя восстановить 3D описание сцены. Это очень мощный, но вспомогательный механизм. И именно это я и хотел продемонстрировать примером с одиночной фотографией.
VictorArt wrote:Хотя в целом, я согласен - пока ещё нет адекватной технологии описания окружающей реальности, имея только две видеокамеры на входе.
И не будет, если использовать каждый метод по-отдельности: когда есть две камеры, ищем стереодиспаратность, когда есть возможность менять фокусное расстояние камеры, ищем глубину из данных о дефокусировке...
Нужно не развивать каждое направление по-отдельности (они и так уже развиты весьма сильно, но ни один из них не дает адекватного результата... просто потому, что не способен его дать), а искать возможность синтеза из различных методов единой системы.
Мы у себя делали опыты с ЦМ - робот с двумя видеокамерами намного точнее позиционировался в пространстве.
Было бы странно, если бы было наоборот :)
Правда никаких 3Д-моделей у него в "голове" при этом не возникало :)
Вот-вот.
С другой стороны, одноглазые пираты вполне прекрасно себя чувствовали и умудрялись выживать в условиях жесточайшей конкуренции.
:lol:
"Кто знает, тот делает, кто не знает, тот учит"

FA
Posts: 22
Joined: Mon Jun 14, 2004 1:02 pm

Post by FA » Mon Oct 11, 2004 10:05 am

С другой стороны, одноглазые пираты вполне прекрасно себя чувствовали и умудрялись выживать в условиях жесточайшей конкуренции.
======================
Это говорит о том, что входные картинки (1,2,3...)...
являются лишь спусковым механизмом
генерации модели внешнего мира

Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Mon Oct 11, 2004 2:24 pm

FA Пн Окт 11, 2004 10:05 am
<...Это говорит о том, что входные картинки (1,2,3...)... являются лишь спусковым механизмом генерации модели внешнего мира...>

Само-собою, не без этого.
PS ========================

domestic
Posts: 1
Joined: Tue Oct 12, 2004 2:08 pm

Post by domestic » Tue Oct 12, 2004 2:17 pm

<Каким образом, мозг из 2 картинок, делает 3Д карту мира?
Давайте каким то образом постараемся найти эти алгоритмы>
1. Угло- (дально-)мер мышц поворота глазных яблок. Кстати, мне совершенно непонятно, почему среди восприятий (чувств) человека называют лишь пять, а шестым называют уже кто во что горазд, типа – третьего глаза и пр. Игнорируя кинетические (движения тела и его частей) и статические (положения тела и взаимного расположения частей тела) восприятия. И те, и другие играют свою роль в процессах мышления наравне с первыми пятью.
2. В принципе, картинка, которая образуется у нас в мозгу в момент наблюдения, является неким собирательным образом всех имеющихся наблюдений, каким-либо образом связанных с наблюдаемой в данный момент действительностью, вызываемых из запасников памяти массой "перекрестных ссылок". Реально наблюдаемое эта картинка отражает со значительной натяжкой и в значительной степени (если не полностью) реальность отражения наблюдаемого зависит от физического и эмоционального состояния наблюдателя.
Дело в том, что задумываться о том, как мы думаем, как мы видим и пр. мы начинаем тогда, когда у нас имеется в наличии огромный багаж образов, полученных неосмысленно.
Когда мы наблюдаем, к примеру, яблоко, у нас уже есть в нашей памяти опыт видения такого же и другого яблока, и круглых предметов, в разных ракурсах, при разном освещении и пр. пр. пр. Образы из памяти как бы "нанизываются" один на другой. При достаточной внимательности к своим наблюдениям, можно заметить, что образов всплывает множество, но для возникающей картинки отбираются лишь те, которые максимально приближены к наблюдаемому и достраиваются необходимыми (не противоречащими) для полноты видения. На этом основывается, например, то, как любящий, тоскующий в разлуке со своим "предметом", образ которого постоянно в его мыслях, может лишь по какой-то незначительной линии сходства достроить любимый образ на "материале" любого встречного. И, в результате, "видит" любимого то здесь, то там, а приглядится – "обознатушки-перепрятушки" :) . По этому же принципу происходят видения чертей, ангелов и пр., но здесь уже принимают участие фантазийные собирательные образы, занимающие порой в коллекции образов реальных равное место.
Относительно 1-го, то достаточно носящему очки сменить их на имеющие несколько иное расстояние между центрами линз, как он, отчетливо в очках видя, станет спотыкаться на неровной и даже ровной поверхности, не умея правильно определить расстояние от глаз до пола. Но со временем вновь приобретённый опыт перестроит настройку его угло-дальномера. И теперь уже при смене очков на правильные, вновь начнет спотыкаться. Картинка та же – угол поворота глазных яблок другой, отличный от прошлого опыта.
Еще очень интересно понаблюдать, как меняется восприятие предметов в перспективе и находящихся рядом. Существует некая граница переключения с одного восприятия на другое. Мне случалось наблюдать это на автобусной остановке. Шаг в сторону из границ остановки и включается перспективная поправка, шаг "в зону" – переход к "безперспективному" :) видению. Интересно было бы сравнить, насколько это зависит от личности наблюдателя.
<и реализовать их в виде ПО?>
Тут я пас.
с уважением domestic

Inex
Posts: 1897
Joined: Mon Jan 05, 2004 10:33 am
Location: Санкт-Петербург

Post by Inex » Tue Oct 12, 2004 2:42 pm

domestic wrote:1. Угло- (дально-)мер мышц поворота глазных яблок.
Это дает в лучшем случае только информацию о расстоянии до поверхности нулевой диспаратности, но никак не 3Д карту сцены.
2. В принципе, картинка, которая образуется у нас в мозгу в момент наблюдения, является неким собирательным образом всех имеющихся наблюдений, каким-либо образом связанных с наблюдаемой в данный момент действительностью, вызываемых из запасников памяти массой "перекрестных ссылок"...
Когда мы наблюдаем, к примеру, яблоко, у нас уже есть в нашей памяти опыт видения такого же и другого яблока, и круглых предметов, в разных ракурсах, при разном освещении и пр. пр. пр.
Восстановление 3Д формы осуществляется на более ранних этапах, чем распознавание. Влияние долговременной памяти и высокоуровневой информации на восстановление формы может осуществляться с помощью эффекта адаптивного резонанса, но он помогает только в сложных случаях, когда присутствует неоднозначность. Когда такой неоднозначности нет, мозг предпочитает одностороннюю обработку информации из-за существенно большей скорости... очевидно, это было важно в ходе эволюции, чтобы тебя не съели.
"Кто знает, тот делает, кто не знает, тот учит"

Skynet
Posts: 244
Joined: Fri Sep 10, 2004 10:37 am
Location: близ Санкт-Петербурга

Post by Skynet » Tue Oct 12, 2004 9:32 pm

domestic wrote:<Каким образом, мозг из 2 картинок, делает 3Д карту мира?
Давайте каким то образом постараемся найти эти алгоритмы>
1. Угло- (дально-)мер мышц поворота глазных яблок. Кстати, мне совершенно непонятно, почему среди восприятий (чувств) человека называют лишь пять, а шестым называют уже кто во что горазд, типа – третьего глаза и пр. Игнорируя кинетические (движения тела и его частей) и статические (положения тела и взаимного расположения частей тела) восприятия. И те, и другие играют свою роль в процессах мышления наравне с первыми пятью.
По этой причине, как считают биологи, у сов, кошек, приматов и пр. животных-охотников и тех, кому нужен дальномер для передвижения, прицеливания глаза расположены на одной плоскости.
domestic wrote:2. В принципе, картинка, которая образуется у нас в мозгу в момент наблюдения, является неким собирательным образом всех имеющихся наблюдений, каким-либо образом связанных с наблюдаемой в данный момент действительностью, вызываемых из запасников памяти массой "перекрестных ссылок". Реально наблюдаемое эта картинка отражает со значительной натяжкой и в значительной степени (если не полностью) реальность отражения наблюдаемого зависит от физического и эмоционального состояния наблюдателя.
Дело в том, что задумываться о том, как мы думаем, как мы видим и пр. мы начинаем тогда, когда у нас имеется в наличии огромный багаж образов, полученных неосмысленно.
Когда мы наблюдаем, к примеру, яблоко, у нас уже есть в нашей памяти опыт видения такого же и другого яблока, и круглых предметов, в разных ракурсах, при разном освещении и пр. пр. пр. Образы из памяти как бы "нанизываются" один на другой. При достаточной внимательности к своим наблюдениям, можно заметить, что образов всплывает множество, но для возникающей картинки отбираются лишь те, которые максимально приближены к наблюдаемому и достраиваются необходимыми (не противоречащими) для полноты видения.
ТА-ДА!!! :)
domestic wrote: По этому же принципу происходят видения чертей, ангелов и пр., но здесь уже принимают участие фантазийные собирательные образы, занимающие порой в коллекции образов реальных равное место.
Ну там еще "фильтр" между разными "логиками" глючит и сознание интерпретирует абсолютно всю память.
domestic wrote:Относительно 1-го, то достаточно носящему очки сменить их на имеющие несколько иное расстояние между центрами линз, как он, отчетливо в очках видя, станет спотыкаться на неровной и даже ровной поверхности, не умея правильно определить расстояние от глаз до пола. Но со временем вновь приобретённый опыт перестроит настройку его угло-дальномера. И теперь уже при смене очков на правильные, вновь начнет спотыкаться. Картинка та же – угол поворота глазных яблок другой, отличный от прошлого опыта.
Еще очень интересно понаблюдать, как меняется восприятие предметов в перспективе и находящихся рядом. Существует некая граница переключения с одного восприятия на другое. Мне случалось наблюдать это на автобусной остановке. Шаг в сторону из границ остановки и включается перспективная поправка, шаг "в зону" – переход к "безперспективному" :) видению. Интересно было бы сравнить, насколько это зависит от личности наблюдателя.
Приятно встретить практика :wink: .

All

Наводящая мысль: Если посмотреть на рисунок, изображающий предмет в изометрии, то предмет будет воспринят, как 3-х мерный, хотя это плоскость.
Поэтому, на мой взгляд, скомпилировав :wink: все вышесказанное, выдвигаю гипотезу об обычном геометрическом моделировании:

есть рост человека(точнее расстояние от ног до глаз), длина ног, рук.
чувство осязания.

Вначале человек(точнее подсознание) формирует пропорцию, используя эти данные(например, размер кисти руки такой-то, ее длина такая, вблизи у нее размер большой, на полном удалении меньше -> расстояние, удаление).
И потом пропорционально(по найденным раннее зависимостям) пересчитывается весь окружающий мир.
Чистейшая геометрия! И можно справиться и одноглазому человеку :wink: .

Теперь про оба глаза. Для более точного просчета расстояния: второй алгоритм - сравнение размеров предмета и расстояния до него одним и вторым глазом(включается теорема треугольников, где одна сторона - расстояние между центрами зрачков, а две другие - расчетное расстояние до предмета от каждого глаза)

Логично предположить, что эти расстояния должны совпасть.

УРА! :D :D :D
Истина не в споре, а где-то рядом

D-r Jasper
Posts: 10
Joined: Sat Dec 09, 2006 12:05 am
Location: RF

Post by D-r Jasper » Thu Dec 14, 2006 3:22 pm

далек я от мысли что мозг сам по себе в своей натуре рождает три_Д карту. помнит хоть кто из участников в каком классе он узнал о трехмерности мира? вот то то и оно :) а как же до этого в детстве отрочестве обходились тем что видели и ориентировались как оказывается в трехмерном мире не подозревая что он такой? не правда ли глупость какая то (?) что из мира детства энской мерности мы попадаем в трехмерность. вот эту ширму трехмерной модели откинуть и начать потихоньку соображать что видим на самом то деле нечто вроде проекции хорошо различимой поверхности на плохо различимую плоскость :wink:

Locked

Who is online

Users browsing this forum: No registered users and 0 guests