Комментарий ДС к тексту supremuma “О выявлении простейших причинно-следственных зависимостей”

 

 

О смысле функции логического следования (импликации) и ее связи с условной вероятностью.

 

1.Импликация.

 

Словесное описание функции логического следования (импликации) выглядит как “ЕСЛИ, X ТО Y”, или “ИЗ X СЛЕДУЕТ Y”. При этом X называют посылкой (условием), а Y – следствием (заключением). Пример высказывания с использованием импликации может выглядеть так: “ЕСЛИ фамилия оканчивается на “-ов”, ТО она принадлежит мужчине”. Здесь X принимает значение истина (1) если фамилия оканчивается на “-ов” и ложь (0) – если она не оканчивается на “-ов”. Y принимает значение истина, если фамилия принадлежит мужчине, и ложь, если женщине. Построим т.н. таблицу истинности для функции логического следования:

 

X

Y

X®Y

0

0

1

0

1

1

1

0

0

1

1

1

 

В первых двух столбцах таблицы приведены все возможные комбинации значений аргументов, а в последнем – значения функции логического следования (обозначается X®Y) при этих аргументах. Таким образом, данная таблица полностью отражает смысл этой функции. Рассмотрим таблицу построчно, подставляя в наш пример высказывания различные фамилии :

 

1.                      X=0, Y=0.  ЕСЛИ фамилия звучит как “Иванова”, ТО она принадлежит женщине.  Это высказывание истинно (X®Y=1), не смотря на то, что и посылка (фамилия не оканчивается на “-ов” т.е. X=0) и следствие (фамилия не принадлежит мужчине, т.е. Y=0) ложны.

2.                      X=0, Y=1 ЕСЛИ фамилия звучит как “Сергеев”, ТО она принадлежит мужчине. Это высказывание истинно, не смотря на то, что посылка (фамилия не оканчивается на “-ов” т.е. X=0) ложна, а  следствие (фамилия принадлежит мужчине, т.е. Y=1) истинно.

3.                      X=1, Y=0 ЕСЛИ фамилия звучит как “Иванов”, ТО она принадлежит женщине. Это высказывание ложно.

4.                      X=1, Y=1 ЕСЛИ фамилия звучит как “Иванов”, ТО она принадлежит мужчине. Это высказывание истинно.

 

Рассмотренный пример с фамилиями очень удачно описывает импликацию, в отличие от примеров типа: “ЕСЛИ 23 без остатка делится на 4, то число 2 - простое” (посылка ложна, следствие  истинно, высказывание истинно), которыми изобилует литература. Хотя формально это высказывание истинно, оно больше похоже на известную поговорку: “в огороде бузина, в Киеве - дядька”. Сам смысл импликации заключается в определении наличия причинно-следственной связи между X и Y. Так зачем же подставлять в формулу аргументы  между котороми этой связи заведомо нет?

Наш пример имеет еще одно достоинство, так как позволяет наглядно порассуждать об особенностях отношений между посылкой (X) и следствием (Y). Разбор второй и четвертой строк таблицы показывает, что истинность X является лишь ДОСТАТОЧНЫМ условием для истинности Y. Иными словами, фамилию можно считать мужской если она оканчивается на “-ов”, но НЕ ТОЛЬКО в этом случае. Окончание фамилии на “-ов” не является НЕОБХОДИМЫМ условием для того чтобы считать ее мужской. Ведь существует еще масса чисто мужских фамилий не оканчивающихся на “-ов”.  Чтобы подчеркнуть эту деталь в отношениях посылки и следствия переформулируем словесное описание функции логического следования (импликации):

 

Для того чтобы Y было истинным, достаточно, чтобы истинным было X.

Или

X достаточно для Y

 

Возвращаясь к нашему примеру можно сказать: “Для того, чтобы считать фамилию мужской ДОСТАТОЧНО чтобы она оканчивалась на “-ов””. Или: “Окончания фамилии на “-ов” достаточно, чтобы считать, что она принадлежит мужчине”.

Сам термин “достаточное условие”, невольно заставляет вспомнить и о необходимости. В рассмотренном примере мы выяснили, что окончание фамилии на “-ов”, не является необходимым условием для того, чтобы считать, что фамилия мужская. Возьмем другой пример.

Пусть мы имеем электрическую цепь состоящую из источника питания, выключателя и лампочки.

 

 


Здесь, в отличие от первого примера, замыкание выключателя (посылка X) абсолютно необходимо для того чтобы загорелась лампочка (следствие Y). Но достаточно ли? Пофантазировав, можно представить ситуацию, когда источник питания может быть как исправен, так и не исправен. В этом случае замыкание выключателя хотя и является необходимым условием для зажигания лампочки, но явно не достаточным. Введем новую логическую функцию X¬Y дополняющую функцию логического следования. Словесное выражение этой функции будет выглядеть так:

 

Для того чтобы Y было истинным, необходимо, чтобы истинным было X.

Или

X необходимо для Y

 

Ниже приведена таблица истинности функции X¬Y

 

X

Y

X¬Y

0

0

1

0

1

0

1

0

1

1

1

1

 

Глядя на эту таблицу, можно заметить что X¬Y ложна лишь при ложной посылке и истинном следствии. Это значит, что такая комбинация аргументов недопустима. Действительно, если X необходимо для Y, то не может быть ситуации, когда Y истинно, а X – ложно. Иными словами, лампочка не может гореть при разомкнутом выключателе. Третья строка таблицы соответствует случаю когда не исправен источник питания.

Итак, мы имеем две логических функции, характеризующих достаточность или необходимость посылки для следствия: X достаточно для Y (X®Y) и X необходимо для Y (X¬Y). На самом деле, особой нужды во введении нового обозначения для функции необходимости нет. Можно заметить, что формулу X®Y можно прочитать так сказать задом-наперед. Все зависит от того, что мы считаем  условием, а что заключением. Для формулы X®Y справедливы оба утверждения: X достаточно для Y и Y необходимо для X. Например “Окончания фамилии на “-ов” достаточно, чтобы считать, что она принадлежит мужчине” и “Принадлежность фамилии мужчине необходима для того чтобы фамилия оканчивалась на “-ов””. В литературе по логике нет специальной функции обозначающей необходимость, хотя само понятие присутствует. Там все зависит от того, что мы считаем условием, а что следствием. Иными словами читаем ли мы формулу справа на лево или наоборот. Здесь эта функция (X¬Y) введена для удобства. Таким образом, мы можем полагать, что условие у нас всегда слева, а заключение – справа. К тому же, в логике функции X®Y и X¬Y называют взаимно обратными, что и подчеркивается таким обозначением

 Что будет если X необходимо и достаточно для Y, например, если в случае с электрической цепью источник питания заведомо исправен? Мы получим известную логическую функцию эквивалентности (X«Y). Таблица истинности для нее такова:

 

X

Y

X«Y

0

0

1

0

1

0

1

0

0

1

1

1

 

В литературе по логике при описании этой функции говорят, что она принимает значение истина когда значения аргументов равны между собой. Мы, понятно, вложим в нее несколько иной смысл. Будем говорить, что X необходимо и достаточно для Y и наооборот. Характерно, что последний столбец таблицы истинности этой функции может быть образован построчным применением функции логического И, к соответствующим столбцам таблиц истинности функций X®Y и X¬Y. Т.е. именно “необходимо И достаточно”.

 

 

2.Условные вероятности.

 

Пусть проведена серия испытаний в ходе которых могли произойти или не произойти события X, Y. Вероятность наступления события Y при условии, что событие X произошло p(Y|X)= p(X^Y)/p(X) называется условной вероятностью наступления Y при X.

Уже само это определение наводит на мысли о некотором сходстве импликации и условной вероятности. Действительно, и там и там присутствует некоторое условие и заключение.  Пусть вероятность p(Y|X)=1. В этом случае в любом из испытаний мы можем встретить следующие значения X и Y:

X=0, Y=0;

X=0, Y=1;

X=1, Y=1;

Но никогда не встретим комбинации X=1, Y=0 т.к в этом случае p(X^Y) < p(X) и, следовательно p(Y|X) < 1, что противоречит первоначальному условию p(Y|X)=1. Очевидно, что если p(Y|X)=1, то на всем протяжении статистического материала функция X®Y имеет значение истина. В введенных нами терминах можно сказать X достаточно для Y.

Легко видеть, что то же самое справедливо и для необходимости. Если p(X|Y)=1, то на всем протяжении статистического материала функция X¬Y имеет значение истина и можно сказать, что X необходимо для Y.

Таким образом, условная вероятность p(Y|X) характеризует степень достаточности X для Y. Иными словами, если p(Y|X) равно, к примеру, 0.53, то можно сказать, что в 53% случаев наступление события X влечет за собой наступление Y.

Мы видим, что функции X®Y и X¬Y, если характеризовать ими некий набор данных, используя альтернативные суждени типа “истинна на всем наборе” (1) и “истинна не на всем наборе” (0),  являются по существу предельными случаями условных вероятностей. Может возникнуть возражение, что высказывание “ X®Y  истинна не на всем наборе” не тождественно p(Y|X)=0. Это действительно так. Но представим себя в роли исследователя имеющего гипотезу, что X и Y связаны отношением X®Y. Мы раз за разом получаем все новые результаты испытаний. Что скажет нам результат X=0 и Y=0? Он никак не подтверждает и не опровергает нашей гипотезы. Так как X=0 то дальнейшие рассуждения о том влечет ли X за собой Y бессмысленны, ведь X не реализовалось. То же самое относится к результату X=0 и Y=1. Эти результаты не противоречат нашей гипотезе, но никак ее не подтверждают и не опровергают. Подтверждает гипотезу результат X=1, Y=1, а опровергает - X=1, Y=0. Если немного переделать таблицу истинности импликации, учитывая, что мы имеем дело не просто с высказываниями X и Y, а с целым набором испытаний в которых X и Y могут реализоваться или нет, то получим следующее:

X

Y

XÞY

0

0

0

1

1

0

0

1

1

1

 

Здесь “–” означает, что данная комбинация аргументов не противоречит гипотезе X®Y. Теперь, если мы воспользуемся этой таблицей как фильтром для анализа набора данных испытаний и будем подсчитывать количества случаев где XÞY имеет, в соответсвии с таблицей значение 0 или 1 (обозначим эти количества N и M соответственно), отбрасывая случаи когда она имеет значение “–”, то

 

p(Y|X)=M/(N+M)

 

 

3. О выявлении простейших причинно-следственных зависимостей в докладе supremum'а.

 

В предыдуших разделах настоящей заметки показано глубокое сходство импликации и условной вероятности. Поэтому введение дополнительных требований для утверждения наличия причинно-следственной связи между событиями X и Y:

- Событие Y должно быть редким P(Y) << 1

- Число наблюдаемых реализаций события X должно быть велико

выглядит неоправданным. Фактически условные вероятности p(Y|X) и p(X|Y) полностью характеризуют эту связь.

Относительно случаев приведенных в докладе (серии наблюдений №2 и №4) хочется заметить следующее: если какое-то событие происходит почти всегда или почти никогда, то имеет смысл вообще исключить его из рассмотрения в связи с другими событиями. Говоря: ЕСЛИ завтра будет солнечно, ТО мы поедем за город, мы не дополняем это высказывание условиями типа ЕСЛИ до завтра земля сохранит атмосферу… или ЕСЛИ сегодня на нас не упадет астероид