Развлечения с ЕЯ

Форум для предварительного обсуждения тем.
Прежде чем организовать обсуждение в отдельном форуме, полезно убедиться, что четко понимаешь о чем говоришь.
Locked
Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Fri Aug 25, 2006 3:33 pm

Бугульдей Пт Авг 25, 2006 7:25 pm
<...Что-то я Вашему профессионалу не верю ни на грош...>

Многие профи так и считали и считают до сих пор, так как в рамках лингвистики ничто иное и невозможно: правила, исключения из правил, исключения из исключений и т.д. - до бесконечности. И оправдение в лучшем случае одно - посмотреть, чего можно при таких ограничениях добиться. Наука, одним словом
PS ========================

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Fri Aug 25, 2006 3:44 pm

Современная лингвистика в основном формальна. Но это нельзя сказать о языке. Лингвистика описывает только поверхность языка, причём не описывает всяких авангардистов и иже. Наука же ещё заберётся вглубь языка -- с развитием ИИ -- найдёт некую мета-форму, т.е. способ работать с формами... Но это уже будет небо и земля по ср. с традиционным пониманием "формальности" -- не фиксированная форма, но гибкая... Если последнее, то всё наблюдаемое в поднебесной формально.
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Fri Aug 25, 2006 3:56 pm

Бугульдей Пт Авг 25, 2006 7:44 pm
<...Современная лингвистика в основном формальна. Но это нельзя сказать о языке...>

Лингвистика работает с текстами, а не смыслом, с ними связанным
PS ========================

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Fri Aug 25, 2006 3:59 pm

Да. Поэтому она меня и не интересует, как я уже писал однажды в этой ветке...
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Slava
Posts: 2082
Joined: Tue Apr 20, 2004 9:20 am
Location: Moskow

Post by Slava » Fri Aug 25, 2006 4:23 pm

Бугульдей Пт Авг 25, 2006 7:59 pm
<...Да. Поэтому она меня и не интересует...>

Я тут с переездом из-за ремонта совсем голову потерял.
PS ========================

Иван FXS
Posts: 2002
Joined: Thu Jan 15, 2004 11:20 am
Location: Москва - Нижний Новгород
Contact:

Post by Иван FXS » Fri Aug 25, 2006 4:47 pm

NO: "Можно чем-нибудь реально пользоваться из всего этого лингво-процессинга? Right here right now."

--- все Search Engines - Google и иже с ним - являются именно лингво-процессорами. Весьма, впрочем, узко заточенными ...

NO: "А не так, что прочитывают горы мукулатуры неизвестно про что, чтобы набраться шаблонов, чтобы потом ими декодировать этот нужный текст."

--- а по-моему - именно "прочитывают горы мукулатуры". Вот Вы прикиньте напальцах, сколько мегабайт Вы прочитали здесь, на aicommunity ... А зачем, спрашивается? ;-)
________________________

Бугульдей: "... терминология -- это мусор, тем более такая нечёткая и несформировавшаяся, как "онтологии" и "семантика" ..."

--- видно, что философиев Вы не проходили. Приведите, пожалуйста, примеры терминов более определенных - по-вашему - чем "онтологии" и "семантика"?

Бугульдей: "... Это симулякры -- копии того, чего нет.

--- приведите, пожалуйста, примеры не-симулякров."

Бугульдей: "Если у Вас есть что-то по существу вопроса, пишите ..."

--- я страшно извиняюсь, не могли бы Вы повторить (повторение - мать учения!) в чем состоит "существо вопроса"?

Бугульдей: "...разные энциклопедии и словари делают то же, что и Ваши карты"

--- спасибо, что Вы это поняли. Только - обратите внимание - мои карты создаются автоматически. Вы умеете это - писать "автоматические энциклопедии"?

Бугульдей: "...потому как ум и мозг -- существенно более хорошая карта, особо в сочетании с энциклопедиями и литературой."

--- коронный аргумент! Зачем вообще заниматься ИИ, если есть "ум и мозг"?

ADIOS: "... minimal assumption that the corpus at hand contains partially overlapping strings at multiple levels of organization."

--- интересно, что они понимают под "partially overlapping strings at multiple levels of organization"?
__________________

NO: "... почти все что я от такой системы смогу получить, я могу получить и в Гугле."

--- ну да, Гугл - это лингво-процессор. Только весьма узко заточенный. Кстати, не пробовали спросить у него, у Гугла: "как он сам это использует, для себя"?

NO: "... ЕЯ не является неформальным и изучать его нужно по соответствующим учебникам, не по текстам."

--- НОРАМИТИВНЫЙ СТРОЙ языка, конечно, является формальным. И изучать его "нужно" по учебникам. Точно также, как "нужно по учебникам изучать" химию, физику и математику.

Бугульдей: "... мировую литературу, которая и формирует язык"

--- кстати, мировая литература-то как раз - есть нечто промежутчное (в обсуждаемом отношении) между учебниками и языковой практикой.

Каков, интересно, объем - в байтах - ВСЕЙ мировой литературы? А объем текстов всех газет за год (без тиража, естественно)? А объем (за год) всех е-мэйлов, реплик в чатах и постов в форумах и прочихе-группах? Каков, интересно, объем в байтах всех СМС, посылаемых за год китайцами?

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Sat Aug 26, 2006 11:40 am

Иван: Ну хорошо. Вот Вы всё "семантика", "семантика". А где, собственно, в Ваших проектах семантика? Что-то я в том, что Вы на форуме писали, описания таковой (в Вашем понимании) не увидел. По Вашим сайтам прошёлся -- нашёл только нечто вроде http://semanticat.com/a/ai.htm:
ai
shoujo* yori aoshi nagase* iijima* lao otsuka* shu kurosawa shonen kusabi* atividade*
Где она у Вас, семантика-то, раз Вам так это слово полюбилось?
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Sat Aug 26, 2006 4:33 pm

Slava wrote:Интересно еще при этом, а что [авторы той обзорной статьи по автом. извлечению знаний] сами во всем этом понимают.
Копнул. Сурьёзные ганцы. Работают с кучей заказчиков и исследовательских лабораторий в больших корпорациях. Участвуют в стандартизации представлений знаний. Делают онтологии бизнес-концептов, планов, действий, процессов. Сотрудничают с Cycorp -- и работают по внедрению своих бизнес-онтологий в центральную базу CYC.

Также пытаются с плюралистическими воззрениями работать: "Enterprise Modelling... different viewpoints on the same artifact, or different opinions of a single concept" (см. "knowledgesystems.html") -- куча проектов на эту тему.

Причём сказано, что куски своего рисёча по автоматич. выявлению знаний из текста они Cycorpу сплавляли (детали неизвестны).
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Sat Aug 26, 2006 5:31 pm

Вот ещё линки по "ontology learning" (ещё один популярный общепринятный кейворд для этого).

гугл - ontology learning

random paper (contains a dozen of web references to misc. projects)
http://tcc.itc.it/projects/ontotext/rep ... oposal.pdf

какой-то обзор области OL (так себе)
http://www.dcs.bbk.ac.uk/webDyn/webDynP ... ayenko.pdf

ещё обзор (2003)
http://ontoweb.org/Members/ruben/Deliverable%201.5

опенсоурс проект "kaon text-to-onto"
http://kaon.semanticweb.org/
http://sourceforge.net/projects/texttoonto -- kaon text-to-onto -- на жабе написан
статья о каоне --
http://www.aifb.uni-karlsruhe.de/WBS/ss ... arning.pdf

***

unrelated:

огромный список проектов по онтологиям --
http://www.cs.utexas.edu/users/mfkb/related.html
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Иван FXS
Posts: 2002
Joined: Thu Jan 15, 2004 11:20 am
Location: Москва - Нижний Новгород
Contact:

Post by Иван FXS » Sat Aug 26, 2006 8:19 pm

Эк Вас прёт-то, в самом деле! Вы внезапно прозрели и осознали, что на Западе много исследователей, проектов и результатов?

Вопрос, по отношению к которому большинство участников данного сообщества настойчиво прячут голову в песок: что вообще такое "русскоязычный ИИ", есть ли в нем хоть какой-то смысл и хоть какие-то перспективы - у него?
_____________________________

Что касается "ai", - ну да, у этого слова есть сильные семантические значени (извините за тавтологию), и кроме "artificial intelligence".

Обратите внимание: http://www.google.com/search?q=ai&lr=
- ну да, на первом месте - Artificial Intelligence, только это - фильм! (Он же - и на 3-м месте.)

А на втором (и четвертом) месте - Amnesty International.

Кстати, есть еще и такая значение аббревиатуры AI: Artificial Insemination! ;-)
_____________________________

Что касается "описания семантики в моем понимании" - никогда не ставил перед собой такой задачи. Меня вполне устраивает ОБЩЕПРИНЯТОЕ значение этого термина, согласно которому семантическое есть "имеющее отношение к значениям (знаков или слов)".

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Sat Aug 26, 2006 10:18 pm

* мне лично без разницы, русский или английский. а поскольку по работе с английским намного больше наработок, то зачем париться. смысли перспективы русского меня совершенно не волнуют - меня волнуют перспективы компьютеров.

* "на Западе много" -- если Вы думаете, что я всё подряд скидываю, то ошибка. Бо копаю text2онтологии конверсию.

* Мой вопрос не о том, как Вы понимаете, а скорее "где в Ваших проектах семантика?"

* скачал вышеупомянутый kaon text2onto, туп беспредельно, но для начала хорошо. Гонял его на документе "javac.html" из документации по ява компилятору. Ещё скачаю gate, поиграю. kaon text2onto умеет с помощью gate ЕЯ обрабатывать, так вот надо ему gate для этого. Встроенный kaonовский ЕЯ-процессор может и сильно хуже гейтовского... проверим.
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

NO
Posts: 1815
Joined: Fri Jan 30, 2004 7:43 pm
Contact:

Post by NO » Sun Aug 27, 2006 3:48 am

Посмотрите на текст глазами компьютера.
Допустим у нас есть текст "abc ab abcd". Можно и петабайт взять, но суть не меняется.
Изучили его, нашли что после "a" всегда идет "b". Можно теперь сказать что букв "a" ровно 3 штуки, а на вопрос пользователя "cd?" дать ему ссылку на соответствующий фрагмент.
А что делать если пользователь спросит "ad?" или еще хуже "af?".

По тексту можно получить информацию о тексте. А как взглянуть сквозь него и увидеть реальность, которую текст описывает?

Кстати этот текст был про футбол, кто-нибудь догадался?

Солеваров
Posts: 3782
Joined: Wed Jan 07, 2004 5:46 am
Location: Москва

Post by Солеваров » Sun Aug 27, 2006 6:24 am

Иван FXS wrote: Вопрос, по отношению к которому большинство участников данного сообщества настойчиво прячут голову в песок: что вообще такое "русскоязычный ИИ", есть ли в нем хоть какой-то смысл и хоть какие-то перспективы - у него?
- http://www.raai.org/ давайте хоть на русскоязычные семинары ходить :wink: последний четверг каждого месяца.
Для того чтобы добраться до источника - надо плыть против течения. Verba at nula.

Бугульдей
Posts: 172
Joined: Sun Aug 13, 2006 2:29 am
Location: Цыган
Contact:

Post by Бугульдей » Sun Aug 27, 2006 1:44 pm

NO:

1. Никаких проблем во всём этом я не вижу.

2. Никакой реальности нет, и увидеть её нельзя. Есть лишь взаимодействия и их результаты.

3. Не любой текст содержит материал по онтологии. Если у нас есть лес деревьев синтакс. разбора, мы можем увидеть фразы вроде "apple is a fruit", "apple is green" и добавить концепты "apple" и "green" и связи между ними. Ключевой момент здесь -- глагол "is", которого в Вашем тексте "abc ab abcd" нет. Если Вы скажете, какие свойства Вашего текста соответствуют этому "is", то можно выявить онтологию и Вашего текста. Таких признаков, как "is", довольно много. Многие синтаксические отношения и глаголы являются такими признаками.

4. "А как взглянуть сквозь него и увидеть реальность, которую текст описывает?" Чтобы это сделать, нужно построить модель мира (реальности), содержащюю в себе подмодели восприятия, действия, причинности, результатов действий, проверки результатов и корректировки моделей и действий.

5. Вы имеете в виду, какая связь между литералом A и концептом "футбол". Связь может быть литеральной (когда A="футбол"), логической (когда верно {A is in the domain of "футбол"}) или метафорической (когда свойства и структура модели, содержащей А, частично совпадают со свойствами и структурой модели, содержащей "футбол". Последняя -- это паттерны, образы, огромный перебор. Скажем, новые смыслы текстов Б.Гребенщикова могут всплывать через десятилетия после прослушивания (пограничный случай метафор).
Меня прот, меня прот, потому как гололёт, потому как снег идёт, меня проот
Голубая Луна - Голубая!

Фоб
Posts: 62
Joined: Fri Aug 18, 2006 6:30 am

Post by Фоб » Sun Aug 27, 2006 1:55 pm

Солеваров wrote:http://www.raai.org/ давайте хоть на русскоязычные семинары ходить :wink: последний четверг каждого месяца.
Верно мыслите, товарищ :)
На Вальцева 18/05/2006 я ходил. Очень познавательно. И вопросы можно задавать.
Бывают ещё лекции http://www.scm.aintell.ru/ (в данный момент почему-то недоступна, может апдейтят чего). Тоже весьма любопытно. Дискуссии порой разгораются - заслушаешься.
Впрочем, специалисты по ИИ там в основном люди возраста достаточно приклонного, и явно нехватает молодой крови, свежего взгляда.

Locked

Who is online

Users browsing this forum: No registered users and 2 guests