IPB

Добро пожаловать, гость ( Вход | Регистрация )

> Правила раздела

Публикующим:
     1. Задачу можно опубликовать двумя способами:
          - создав для нее отдельную тему с информативным названием;
          - добавив задачу в готовый сборник (например «Бескрылки», «Мини-задачи», «Вопросы ЧГК») или создав свой (например, «Загадки от /для Светы»).
     2. Если вы публикуете задачу, решение которой не знаете, напишите об этом. По умолчанию считается, что вам известен правильный ответ и вы готовы проверять других игроков.
Решающим:
     1. В темах запрещается писать ответы и подсказки, если возможность открытого обсуждения не оговорена отдельно (в случае открытого обсуждения для текста следует использовать цвет фона или белый, оставляя другим игрокам возможность самостоятельного решения).
     2. Правильность решения можно проверить, написав личное сообщение автору.

15 Страниц V « < 12 13 14 15 >  
Ответить в эту темуОткрыть новую тему
> Парадокс двух конвертов, теория вероятностей
Рейтинг  5
snav
18.8.2015, 22:12
Сообщение #261


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



0, это не совсем так. В ситуации, когда точные значения вероятностей неизвестны, теория принятия решений разрешает заменять неизвестные вероятности их субъективным оценками. Под субъективными вероятностями понимают меру внутренней уверенности лица, принимающего решение, в наступлении того или иного события. При этом на практике часто пользуются эвристическим правилом Лапласа, которое гласит, что в условиях полной неопределенности события можно считать равновероятными.

Если наши субъективные вероятности будут сильно отличаться от статистических вероятностей, это приведет лишь к тому, что наши теоретические выводы не совпадут с эмпирическими данными, однако даже в этом случае мы не должны приходить к противоречию в самих наших теоретических выводах. Между тем, в парадоксе мы как раз приходим к противоречию.

Так вот, наша первая ошибка состоит в том, что в своих рассуждениях мы незаметно вышли за пределы аксиоматики теории вероятностей. Если бы мы ограничились предположением, что при некоторой конкретной сумме в первом конверте вероятности большей и меньшей суммы во втором конверте равны, в этом не было бы ничего противоречивого. Но мы предположили большее: мы предположили, что указанные вероятности равны при всех значениях сумм в первом конверте, а это уже невозможно ни при каком законе распределения. Другими словами, первая ошибка состоит в том, что не существует закона распределения, который бы удовлетворял нашему предположению.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
ars
19.8.2015, 11:06
Сообщение #262


Новичок
*

Группа: Пользователи Braingames
Сообщений: 19
Регистрация: 13.9.2007
Пользователь №: 3 361



А кто-нибудь может пояснить корректность этой формулировки (из сообщ. № 9)?
QUOTE
"Вероятность того, что в другом конверте больше денег, в два раза меньше, чем вероятность того, что в другом конверте меньше денег"
Если быть точным, то меня интересует не соотношение этих вероятностей, а правомочность использования понятия "вероятность" в этом случае.

Дело в том, что мы говорим о событии уже свершившемся (сколько денег изначально положили в конверты) и от нашего действия/бездействия не зависит сколько денег там окажется. К этому моменту ситуация детерминирована (просто нам это неизвестно). Это не одно и то же с ситуацией, когда деньги во второй конверт кладутся после принятия нами решения - по-моему, имеет смыл считать вероятности и матожидания только в этом случае.

Это чем-то напоминает следующую ситуацию:
прошел футбольный матч, результата мы не знаем (знаем только, что ничьей не было), и нам предлагают сделать ставку на одну из команд. Мы ставим на одну из них. И тут нам говорят, что поменяв ставку, мы можем получить с вероятностью 2/3 в 10 раз меньше или с вероятностью 1/3 в 10 раз больше. Но нам безбожно врут! =) Событие уже свершилось, поэтому исход смены выбора известен организатору заранее. И нас попросту вводят в заблуждение, используя эти значения вероятностей (на самом деле вероятности 1 и 0).

Другое дело было бы, если б команды играли, после принятия нами решения о смене ставки. И вот тут кажущаяся симметричность задачи пропадает - гарантированный выигрыш не равновыгоден вероятному его увеличению/уменьшению.


--------------------
Нас никому не сбить с пути - нам пофигу куда идти!
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
19.8.2015, 15:25
Сообщение #263


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



ars, вероятность события не является абсолютной инвариантной величиной. Значение вероятности может быть разным для разных людей, в зависимости от объема данных, которым они располагают. Вероятность - это просто численная мера возможности появления события с точки зрения конкретного индивида. Так, организаторы игры точно знают суммы в конвертах, поэтому для них вероятности исходов равны 0 и 1. Но с точки зрения игрока возможны оба исхода с вероятностями 1/3 и 2/3.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
20.8.2015, 7:17
Сообщение #264


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



ars, вспомните, как вероятности с точки зрения игрока меняются в парадоксе Монти Холла
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
ars
20.8.2015, 9:33
Сообщение #265


Новичок
*

Группа: Пользователи Braingames
Сообщений: 19
Регистрация: 13.9.2007
Пользователь №: 3 361



Если snav не против, то восстановлю:
QUOTE
ars: При замене в формулировке сообщ.№9 10^n на 2^n парадокс пропадает.

QUOTE
snav: если вместо степеней 10 использовать степени 2, то чтобы сохранить парадокс нужно использовать другие вероятности


А зачем сохранять парадокс? Мы же стараемся от него избавиться вроде? smile.gif
Может быть как раз тут и кроется решение: в соотношении вероятностей и распределения денег по конвертам?


--------------------
Нас никому не сбить с пути - нам пофигу куда идти!
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
ars
20.8.2015, 9:47
Сообщение #266


Новичок
*

Группа: Пользователи Braingames
Сообщений: 19
Регистрация: 13.9.2007
Пользователь №: 3 361



Тогда, отвечая на вопрос, поставленный в первом сообщении: "где ошибка в рассуждениях?" - можно сказать, что в "интуитивной симметрии задачи".
По первоначальному условию мы равновероятно увеличиваем/уменьшаем выигрыш в 2 раза, хотя для сохранения симметрии должны тогда и выполнить условие сохранения отношений вероятностей 1:2.
В общем получается зависимость: вероятность увеличения выигрыша в n раз должна быть в n раз меньше вероятности уменьшения выигрыша в n раз. Только в этом случае вопрос выбора действительно становится равнозначным (матожидания равны).


--------------------
Нас никому не сбить с пути - нам пофигу куда идти!
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
0
20.8.2015, 18:34
Сообщение #267


Охгдеж
****

Группа: Пользователи Braingames
Сообщений: 1 331
Регистрация: 26.3.2009
Пользователь №: 13 618



QUOTE(snav @ 18.8.2015, 22:12) *
0, это не совсем так. В ситуации, когда точные значения вероятностей неизвестны, теория принятия решений разрешает заменять неизвестные вероятности их субъективным оценками. Под субъективными вероятностями понимают меру внутренней уверенности лица, принимающего решение, в наступлении того или иного события. При этом на практике часто пользуются эвристическим правилом Лапласа, которое гласит, что в условиях полной неопределенности события можно считать равновероятными.


Ужас какой. Искать объяснение парадоксов в гуманитарных "науках".
Мера внутренней уверенности в чем измеряется? Ну и как все знают крокодила либо встретишь либо нет так что вероятность 1/2.

На самом деле то что вероятность проигрыша и выигрыша равны оправдывается не выходя за рамки теории вероятности. Игрок выбирает случайным образом один конверт из предложенных двух так что вероятность что он выберет меньший равна 1/2. Вот только нас интересует не сам факта выигрыша а сумма. И чтобы ее узнать надо для начала открыть конверт. И как только конверт открыт мы уже находимся в другом пространстве возможностей и ответ на вопрос какова вероятность выигрыша становится нетривиальным.
И тот кто утверждает что 1/2 не прав. Правильный ответ "Неизвестно. Это зависит от начального распределения". Можете пользоваться чем угодно на практике и даже использовать степень уверенности в победе игромана перед выдачей ему кредита, но к математике это отношения не имеет.

QUOTE(snav @ 18.8.2015, 22:12) *
Так вот, наша первая ошибка состоит в том, что в своих рассуждениях мы незаметно вышли за пределы аксиоматики теории вероятностей.

Да. Вышли тогда когда решили игнорировать факт который не смогли интерпретировать.

QUOTE(snav @ 18.8.2015, 22:12) *
Если бы мы ограничились предположением, что при некоторой конкретной сумме в первом конверте вероятности большей и меньшей суммы во втором конверте равны, в этом не было бы ничего противоречивого. Но мы предположили большее: мы предположили, что указанные вероятности равны при всех значениях сумм в первом конверте, а это уже невозможно ни при каком законе распределения. Другими словами, первая ошибка состоит в том, что не существует закона распределения, который бы удовлетворял нашему предположению.

А если бы существовал то что?! Ваше предположение осталось бы предположением таким же безосновательным как и сейчас. Разница только в том что если бы оно существовало то сформулировали бы другой парадокс с заданным распределением, в котором равенство вероятностей обосновывается не сомнительными теориями, а выводится из распределения. И вообщем-то это и было сделано, только с равенством не вышло вышло с другим отношением, но приводящему к тому же результату.


Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
21.8.2015, 16:37
Сообщение #268


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



QUOTE(snav @ 15.8.2015, 7:48) *
Существуют также варианты парадокса с конечным математическим ожиданием, но там используется другой критерий принятия решения. То есть в общем случае, парадокс двух конвертов не связан с бесконечностью матожиданий, как иногда ошибочно считают.

Кстати, можно подробнее про варианты парадокса с конечным матожиданием? Я так понимаю, речь идёт о критериях выбора типа максимина?
Если честно, мне не кажется очевидным вывод, что в общем случае парадокс не связан с бесконечным матожиданием. Пока не вижу, что здесь уместно говорить об общем случае.
Что же касается классической задачи, то, на мой взгляд, очевидно, что парадокс заключен именно в бесконечности матожиданий. Это косвенно подтверждается и тем, что все варианты задачи с конечным матожиданием (где критерием выбора, по-прежнему, является максимизация матожидания), которые были рассмотрены, не содержат парадокса. Я бы сказал, что задача парадоксальна ровно настолько, насколько парадоксально само понятие бесконечности.

Сообщение было отредактировано Breghnev: 21.8.2015, 16:37
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
21.8.2015, 20:07
Сообщение #269


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



QUOTE(Breghnev @ 21.8.2015, 16:37) *
Кстати, можно подробнее про варианты парадокса с конечным матожиданием? Я так понимаю, речь идёт о критериях выбора типа максимина?

Да, именно о них.
https://www.braingames.ru/forum/index.php?s...indpost&p=55153

QUOTE(Breghnev @ 21.8.2015, 16:37) *
Что же касается классической задачи, то, на мой взгляд, очевидно, что парадокс заключен именно в бесконечности матожиданий.

Смотря что вы подразумеваете под словами "парадокс заключен в бесконечности матожиданий". Если вы имеете в виду, что "для риск-нейтрального игрока (т.е. игрока, который принимает решение исходя из критерия ожидаемой ценности) при известном законе распределения противоречие возникает только в случае бесконечного матожидания" - да, это так. Но даже в этом случае первопричиной противоречия все-таки является не бесконечность матожидания, а допущенная нами ошибка в рассуждениях.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
22.8.2015, 18:06
Сообщение #270


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



QUOTE(snav @ 21.8.2015, 20:07) *
Но даже в этом случае первопричиной противоречия все-таки является не бесконечность матожидания, а допущенная нами ошибка в рассуждениях.

Можете ещё раз её сформулировать?
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
22.8.2015, 22:32
Сообщение #271


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



Попробую, но заранее прошу прощения за корявое изложение и возможные неточности. В виду большого объема материала, разбил его на несколько сообщений.

Напомню, мы сейчас рассматриваем задачу для одного испытания с законом распределения, указанным в сообщении #9. Содержимое конвертов я буду рассматривать как случайные величины X и Y. Фактические (наблюдаемые) значения случайных величин X и Y буду обозначать строчными буквами x и y соответственно.
Чтобы не повторяться, условимся считать доказанным, что при заданном распределении M(Y|X=x) > x для любого возможного значения x.

Для начала дадим более четкую формулировку условия парадокса.

Постановка задачи
Вам показали два конверта X и Y и сказали, что в обоих конвертах находятся деньги, причём количество денег в конвертах подчиняется закону распределения, указанному в сообщении #9. Это всё, что вам известно. Вам разрешено взять любой из этих конвертов и оставить себе все деньги, которые вы в нём найдете. Вы наугад взяли конверт X. Но прежде чем вы его откроете, ваш спонсор предоставляет вам право изменить ваше первоначальное решение и поменять конверт. Как вам лучше поступить: оставить себе конверт X или согласиться на обмен и взять конверт Y? Игра проводится только один раз.

Парадоксальные рассуждения
Вы можете рассуждать двумя способами:
1-й способ. Моя информация о содержимом конвертов идентична, поэтому по соображениям симметрии выбор конверта безразличен.
2-й способ. Пусть конверт X содержит x долларов. Для любого возможного х условное математическое ожидание конверта Y будет больше x. Следовательно, если я открою конверт X и увижу его содержимое, то, руководствуясь принципом максимизации математического ожидания выигрыша, я предпочту обмен. Этот вывод не зависит от значения x и справедлив для любого x. Таким образом, мне заранее известно, что, узнав значение X, я предпочту взять конверт Y. Поэтому в открывании конверта X нет необходимости и я должен предпочесть конверт Y, даже не зная X.


1-е пояснение по условию
Прежде чем приступить к непосредственному решению парадокса, давайте сначала разберемся с одним вопросом, который здесь неоднократно звучал: на каком основании мы говорим о предпочтительности конверта с бОльшим математическим ожиданием. Это действительно важный вопрос. И чтобы на него ответить, нам придется сделать небольшой экскурс в теорию принятия решений (ТПР).

Итак, по условию задачи игра проводится только один раз. В такой ситуации ни одна из стратегий поведения не может гарантировать нам получение большей суммы денег, т.е. при любом выборе мы можем как выиграть, так и проиграть. Апеллировать к математической статистике здесь бесполезно. Максимум, что мы можем сделать — это постараться принять наиболее рациональное решение исходя из имеющейся у нас информации. Решением подобных задач как раз и занимается ТПР.

С точки зрения ТПР задача о двух конвертах классифицируется как выбор в условиях риска и неопределенности. Под «риском» в ТПР понимается ситуация, когда точные результаты возможных вариантов действий заранее не известны, но имеется информация о вероятностях возможных исходов при каждом варианте действия. Если же вероятности исходов тоже неизвестны, говорят о выборе в условиях неопределенности.

Когда мы решаем задачи с заранее предсказуемым исходом, критерием принятия решения является получаемый результат (выигрыш/проигрыш). Однако в условиях риска и неопределенности сравнивать варианты действия по их будущему результату невозможно, поскольку результат нам еще не известен. Тем не менее, это не означает, что все варианты выбора равнозначны для человека, принимающего решение. Для того чтобы упорядочить варианты выбора по степени их желательности, ТПР применяет отношения предпочтения. Различают отношения предпочтения трех видов:
— строгое предпочтение (вариант А строго предпочтительнее варианта B);
— нестрогое предпочтение (вариант А не хуже варианта B);
— безразличие (А ~ B).

Отношения предпочтения должны удовлетворять некоторым естественным требованиям, например свойству транзитивности (если A > B и B > C, то A > C) и свойству рефлексивности (A ~ A).

Обратите внимание, что отношения предпочтения не содержат в себе никакой количественной оценки. Например, строгое предпочтение лишь утверждает, что вариант А более предпочтителен, чем вариант B, но ничего не говорит о том, на сколько один вариант предпочтительнее другого.

Еще одним важным обстоятельством, на которое стоит обратить внимание, является то, что отношения предпочтения зависят от конкретного индивида. То решение, которое является предпочтительным для одного человека, может оказаться неприемлемым для другого. Это связано с тем, что разные люди по-разному относятся к рискованному выбору и своей готовности пойти на риск. В ТПР условно выделяют три типа людей: «склонный к риску», «не склонный к риску» и «нейтральный к риску». Нейтральным к риску называется человек, который безразличен к выбору между получением фиксированной денежной суммы и получением возможного рискового дохода, математическое ожидание которого равно данной фиксированной сумме. Например, пусть стоит выбор между гарантированным получением 100 долларов и участием в игре, по итогам которой можно с равной вероятностью выиграть 200 долларов или не выиграть ничего. Не склонный к риску человек выберет 1-й вариант, склонный к риску — 2-й вариант, а для риск-нейтрального игрока оба варианта будут одинаково привлекательны.

Считается, что в реальной жизни большинство людей не склонны к риску. Однако в задаче о двух конвертах рассматривается вымышленный персонаж, который нейтрален в отношении риска. Для такого персонажа сравнительная предпочтительность альтернатив определяется критерием ожидаемой ценности. Суть этого критерия такова: в условиях риска, когда есть несколько возможных вариантов действия, более предпочтительным является тот вариант, при котором величина ожидаемой ценности результата (математического ожидания выигрыша) будет максимальна. Другими словами, нейтральное отношение к риску можно считать неявно подразумеваемой частью условия задачи, и все рассуждения выполняются с точки зрения риск-нейтрального игрока.

2-е пояснение по условию
Еще один момент условия, который мне бы хотелось уточнить, это бесконечность математических ожиданий. Как мы уже говорили выше, безусловные математические ожидания M(X) и M(Y) в нашем распределении равны бесконечности. В связи с этим у многих людей возникает соблазн «списать» парадокс на бесконечное количество денег в конвертах. Признаться, я и сам одно время так думал. Однако это неверно.

Хотя математические ожидания M(X) и M(Y) бесконечны, тем не менее, сами случайные величины X и Y принимают в игре некоторые конкретные значения x и y. Эти значения являются обычными натуральными числами, поэтому конверты в любом случае будут содержать вполне определенные (конечные) суммы денег. Иногда ошибочно думают, что числа x и y могут быть бесконечно большими. Это не так. В традиционной математике (которой мы все пользуемся) нет такого понятия «бесконечно большое число», так же как нет понятия «конечное число». Числа, какими бы большими они ни были, всегда остаются нормальными числами, с которыми можно выполнять все обычные математические действия. Бесконечными бывают множества чисел. Например, множество натуральных чисел бесконечно, но любой элемент этого множества все равно остается обычным числом. Что же касается бесконечности математических ожиданий M(X) и M(Y), то это лишь формальный термин, под которым подразумевается расходимость ряда.

Таким образом, при любом значении x мы делаем выбор между двумя конкретными суммами. Поэтому бесконечность M(X) и M(Y) никоим образом не нарушает корректность наших рассуждений.

Продолжение в следующем сообщении...
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
22.8.2015, 22:43
Сообщение #272


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



Предполагаемое решение парадокса
Наиболее известное и, пожалуй, единственное удовлетворительное решения данного варианта парадокса было предложено Чалмерсом в 2002 году. Спустя два года к аналогичному выводу пришли Дитрих и Лист.

Для того чтобы уяснить суть их решения, сформулируем еще раз коротко цепочку наших умозаключений:
1) До открывания конверта выбор безразличен (этот вывод основывается на принципе симметрии).
2) После открывания конверта обмен является строго предпочтительным, независимо от того какая сумма находится в открытом конверте (этот вывод следует из принципа максимизации ожидаемой ценности).
3) Так как предпочтительность обмена в случае вскрытия конверта известна заранее, то открывать конверт нет необходимости и следует предпочесть обмен, даже не открывая конверт.
4) Получаем противоречие с пунктом 1.

Рассуждения выглядят безупречными. Мы знаем, что принцип максимизации ожидаемой ценности справедлив только для риск-нейтрального игрока, но принцип симметрии является общим фундаментальным принципом, который должен работать во всех случаях, независимо от отношения игрока к риску. Поэтому принцип симметрии должен сохранять силу и для риск-нейтрального игрока тоже. Почему же тогда два указанных принципа приводят нас к несовместным выводам?

Ответ состоит в том, что помимо двух упомянутых принципов мы неявно используем в своих рассуждениях еще одно дополнительное предположение, которое Чалмерс назвал "unrestricted dominance pinciple", а Дитрих и Лист - "event-wise dominance principle". Я буду называть его эвентуальным принципом доминирования. Суть этого подразумеваемого принципа в следующем. Допустим, имеются две альтернативы A и B, а также полная группа несовместных событий E. Тогда если A предпочтительнее B при условии наступления любого события из множества E, то A предпочтительнее B безусловно.

Эвентуальный принцип доминирования в соединении с фактом 2 вступает в конфликт с фактом 1. Действительно, рассмотрим события: X=1, X=2, X=4 и так далее. Предпочтительность обмена конвертов в случае знания значения X означает не что иное, как предпочтительность конверта Y при условии наступления любого из указанных событий. Это обстоятельство является достаточным основанием для применения эвентуального принципа доминирования. Используя последний, мы приходим к выводу о безусловной предпочтительности конверта Y над конвертом X, но это противоречит априорной симметрии конвертов. В то же время, без применения эвентуального принципа доминирования противоречие между фактами 1 и 2 не возникает.

Эвентуальный принцип доминирования выглядит очень правдоподобно. Тем не менее, вышеупомянутые авторы сходятся во мнении, что он ложен.

Причина интуитивной привлекательности данного принципа кроется в том, что в некоторых частных случаях доминантные рассуждения успешно работают. Так, в теории принятия решений известен и широко применяется стандартный принцип доминирования, который гласит, что альтернатива А предпочтительнее альтернативы B, если при любом варианте развития ситуации альтернатива А дает лучший результат, чем альтернатива B. Можно видеть, что эвентуальный принцип доминирования фактически вмещает стандартный принцип в качестве частного случая и пытается распространить его действие на более широкие исходные условия.

Чтобы проиллюстрировать различие между стандартным и эвентуальным принципами, рассмотрим их на примере парадокса двух конвертов. Вариантами развития ситуации в нашем случае являются все возможные пары значений величин X и Y: {1, 2}, {2, 1}, {2, 4}, {4, 2}… (назовем эти пары состояниями конвертов). События — это более крупные группы фактов: каждое событие может включать в себя одно или несколько состояний конвертов. Например, событию X=1 соответствует лишь одно состояние {2, 1}, а событию X=2 — два состояния: {2, 1} и {2, 4}. Мы принимаем решение о предпочтительности обмена при условии наступления события X=2. Однако если бы у нас была более полная информация и мы бы знали, в каком состоянии находятся конверты при этом событии, то в случае состояния {2, 1} мы бы все-таки отказались от обмена. Таким образом, располагая информацией о состоянии конвертов, мы бы при одних состояниях предпочли взять конверт X, а при других — конверт Y, поэтому стандартный принцип доминирования, в отличие от эвентуального, не дает нам оснований для вывода о безусловной предпочтительности обмена.

Вообще, тема доминирования весьма болезненна в теории принятия решений. Даже стандартный принцип, который кажется предельно убедительным и несокрушимым, в определенных ситуациях дает сбой. Это, конечно, не имеет прямого отношения к обсуждаемому вопросу, но поскольку данный факт интересен и познавателен, я позволю себе сделать небольшое отступление и рассмотреть пример, позаимствованный у Джеймса Джойса.

Предположим, вы только что припарковались в захолустном районе. К вам подходит человек и предлагает за 10 долларов «защищать» ваш автомобиль от повреждения. Вы понимаете, что это вымогательство, и слышали, что люди, которые отказываются от «защиты», часто по возвращении находят свое ветровое стекло разбитым. Те кто платят, находят свои автомобили неповрежденными. Вы не можете припарковаться больше нигде, потому что опаздываете на важную встречу. Замена ветрового стекла стоит 400 долларов. Нужно ли вам купить «защиту»?

Стандартный принцип доминирования, говорит, что не нужно. Действительно, представим последствия ваших решений в виде таблицы.

CODE

                        Стекло разбито    Стекло не разбито
Заплатили хулигану          -410 $            -10 $
Не заплатили хулигану       -400 $              0 $


Строки соответствуют вашим действиям, колонки — вариантам развития ситуации. В каждой колонке значение в последней строке больше, чем в предпоследней, поэтому альтернатива «не платить» доминирует альтернативу «заплатить». Конечно, с точки зрения здравого смысла это абсурд. Если вы откажетесь платить, вероятность того, что вам придется ремонтировать автомобиль, резко возрастает, поэтому лучше отдать вымогателю 10 долларов, чтобы не потерять 400. Неувязка происходит из-за того, что ваш выбор оказывает непосредственное влияние на развитие ситуации. В подобных случаях стандартный принцип доминирования не применяется.

Пример с вымогателем дает нам дополнительную возможность убедиться, что доминантные рассуждения, несмотря на их кажущуюся простоту и очевидность, весьма коварны и что интуитивность в этом вопросе не очень надежный союзник.

Чтобы несостоятельность эвентуального принципа доминирования стала еще более наглядна, Дитрих и Лист приводят любопытный пример, в котором показывают, что парадокс двух конвертов может возникать не только с критерием ожидаемой ценности, но и с другими критериями принятия решения. Их пример особенно интересен тем, что на этот раз суммы в конвертах ограниченны и имеют конечные математические ожидания. Таким образом Дитрих и Лист опровергают распространенное заблуждение, будто корень проблемы прячется в бесконечности математических ожиданий или неограниченности возможных выплат.

Подведем итог. Основной причиной, которая приводит к возникновению парадокса двух конвертов в теории принятия решений, является незаконное использование доминантных рассуждений. Несмотря на то, что при определенных условиях доминантные рассуждения могут быть верными, в условиях задачи о двух конвертах они недействительны.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
23.8.2015, 0:30
Сообщение #273


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



Это всё, конечно, интересно. И спасибо за цитирование специалистов в рассматриваемом вопросе. Но всё же мне бы хотелось услышать от вас объяснение в более простой форме и вашими словами.
На сегодняшний день наиболее правдоподобным объяснением для меня является то, что мы неправомерно используем принципы теории вероятностей в рамках этой задачи. Ещё раз "по-простому" опишу то, что происходит.
Наш первоначальный выбор, очевидно, ничего не решает. Нам всё равно, какой конверт выбрать, ведь мы не владеем никакой информацией, дающей предпочтение тому или иному конверту.
При повторном выборе нам выгодно менять конверт всегда, основываясь на том, что "в среднем" мы получим больше, поменяв конверт.
Проблема заключается в том, что нашего "среднего" не существует. И не существует его именно потому, что сумма в конвертах не ограничена. Принципиально важно, что "среднего" нет не только для игрока, но и для ведущего. Потому что если "среднее" существует, пусть даже оно неизвестно игроку, парадокс исчезает.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
23.8.2015, 6:29
Сообщение #274


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



QUOTE(Breghnev @ 23.8.2015, 0:30) *
На сегодняшний день наиболее правдоподобным объяснением для меня является то, что мы неправомерно используем принципы теории вероятностей в рамках этой задачи.

Пардон, мы не нарушили ни одного принципа теории вероятности. Все вероятностные расчеты безупречны. Нарушения лежат в другой области — в области ТПР, которая является самостоятельной дисциплиной по отношению к теории вероятностей (вы не найдете в теории вероятностей ни принципа максимизации ожидаемой ценности, ни отношений предпочтения — всё это чистая ТПР).

Возможно, вы пытаетесь смешивать два принципиально разных парадокса: статистический парадокс (многократные испытания) и парадокс принятия решения (однократное испытание). Это разные задачи с разным решением. Статистический парадокс действительно имеет решение в рамках теории вероятностей. Я рассматривал его ранее.

QUOTE(Breghnev @ 23.8.2015, 0:30) *
При повторном выборе нам выгодно менять конверт всегда, основываясь на том, что "в среднем" мы получим больше, поменяв конверт.

Вот вы пишете "выгодно поменять всегда". Это неверно. Критерием выгодности является фактическое получение большей суммы денег. Если в конверте Y находится больше денег — менять выгодно, если меньше — то менять невыгодно. Однако при однократной игре сделать априорное заключение о выгодности обмена невозможно, так как мы не знаем, где больше денег. По этой причине ТПР говорит не о выгодности обмена, а лишь о его предпочтительности с точки зрения некоего критерия рациональности. Выгода и предпочтительность — не одно и то же. Выгода означает гарантированное получение выигрыша, а предпочтительный вариант может привести как к выигрышу, так и к проигрышу.

Далее, вы говорите "в среднем мы получим больше". Это высказывание из области статистики. Но у нас только одно испытание, и в среднем мы получим ровно столько, сколько по факту лежит во втором конверте. А это значение нам не известно.

QUOTE(Breghnev @ 23.8.2015, 0:30) *
Проблема заключается в том, что нашего "среднего" не существует. И не существует его именно потому, что сумма в конвертах не ограничена.

Здесь вы незаметно перешли от условного матожидания к безусловному, но продолжаете говорить так, словно речь идет об одном и том же.

QUOTE(Breghnev @ 23.8.2015, 0:30) *
Принципиально важно, что "среднего" нет не только для игрока, но и для ведущего. Потому что если "среднее" существует, пусть даже оно неизвестно игроку, парадокс исчезает.

Да, при конечном матожидании парадокс исчезает, и что? Где решение парадокса при бесконечном матожидании?
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
23.8.2015, 17:18
Сообщение #275


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



QUOTE(snav @ 23.8.2015, 6:29) *
Возможно, вы пытаетесь смешивать два принципиально разных парадокса: статистический парадокс (многократные испытания) и парадокс принятия решения (однократное испытание). Это разные задачи с разным решением. Статистический парадокс действительно имеет решение в рамках теории вероятностей. Я рассматривал его ранее.

Допустим, "статистический парадокс" решен. В чем его отличие от парадокса принятия решения? Разве в случае однократного испытания игрок не руководствуется тем же самым критерием максимизации среднего выигрыша?
QUOTE(snav @ 23.8.2015, 6:29) *
Вот вы пишете "выгодно поменять всегда". Это неверно. Критерием выгодности является фактическое получение большей суммы денег. Если в конверте Y находится больше денег — менять выгодно, если меньше — то менять невыгодно. Однако при однократной игре сделать априорное заключение о выгодности обмена невозможно, так как мы не знаем, где больше денег. По этой причине ТПР говорит не о выгодности обмена, а лишь о его предпочтительности с точки зрения некоего критерия рациональности. Выгода и предпочтительность — не одно и то же. Выгода означает гарантированное получение выигрыша, а предпочтительный вариант может привести как к выигрышу, так и к проигрышу.

Разумеется, говоря "выгодно поменять всегда" я имел ввиду именно предпочтительность с точки зрения матожидания выигрыша. Пожалуй, я соглашусь с вами, что использование слова "выгодно" мной здесь не совсем корректно. Но это лишь вопрос терминологии.
QUOTE(snav @ 23.8.2015, 6:29) *
Далее, вы говорите "в среднем мы получим больше". Это высказывание из области статистики. Но у нас только одно испытание, и в среднем мы получим ровно столько, сколько по факту лежит во втором конверте. А это значение нам не известно.

Тогда как в анекдоте: либо выгодно менять, либо нет. 50/50. Так получается?
QUOTE(snav @ 23.8.2015, 6:29) *
Здесь вы незаметно перешли от условного матожидания к безусловному, но продолжаете говорить так, словно речь идет об одном и том же.

Не вижу причины, по которой я не мог сделать этого.
QUOTE(snav @ 23.8.2015, 6:29) *
Да, при конечном матожидании парадокс исчезает, и что? Где решение парадокса при бесконечном матожидании?

Парадокс в том, что матожидание получаемой величины равно бесконечности (а что такое бесконечность?), а сумма в конверте всегда равна конечному числу (а с какой стати? вы уверены в этом?).
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
23.8.2015, 18:18
Сообщение #276


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



QUOTE(Breghnev @ 23.8.2015, 17:18) *
Допустим, "статистический парадокс" решен. В чем его отличие от парадокса принятия решения? Разве в случае однократного испытания игрок не руководствуется тем же самым критерием максимизации среднего выигрыша?

В случае однократной игры игрок руководствуется принципом максимизации математического ожидания выигрыша в одной игре. В случае многократной игры игрок руководствуется принципом максимизации фактического выигрыша в большой серии игр.

QUOTE(Breghnev @ 23.8.2015, 17:18) *
Парадокс в том, что матожидание получаемой величины равно бесконечности (а что такое бесконечность?), а сумма в конверте всегда равна конечному числу (а с какой стати? вы уверены в этом?).

Вообще-то, парадокс совсем в другом. В чем именно - я описал выше...
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
23.8.2015, 22:22
Сообщение #277


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



QUOTE(snav @ 23.8.2015, 18:18) *
В случае однократной игры игрок руководствуется принципом максимизации математического ожидания выигрыша в одной игре. В случае многократной игры игрок руководствуется принципом максимизации фактического выигрыша в большой серии игр.

Чем отличается максимизация матожидания выигрыша в одной игре от случая с серией игр? Если серия игр такова, что все игры независимы друг от друга, и мы не делаем никаких выводов из прошлых игр, то чтобы получить максимум матожидания в серии нам нужно получить максимум в каждой отдельно игре, не так ли?
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
24.8.2015, 5:19
Сообщение #278


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



В серии игр мы максимизируем не матожидание, а фактический выигрыш. Именно это является нашей конечной целью. И хотя в обеих задачах (с одной игрой и с серией игр) наши промежуточные рассуждения апеллируют к возрастанию матожидания, наша аргументация в этих случаях существенно различается. Поэтому различаются и решения парадоксов.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Breghnev
24.8.2015, 8:20
Сообщение #279


Новичок
*

Группа: Пользователи Braingames
Сообщений: 39
Регистрация: 8.5.2008
Из: Йошкар-Ола
Пользователь №: 7 813



QUOTE(snav @ 24.8.2015, 5:19) *
В серии игр мы максимизируем не матожидание, а фактический выигрыш. Именно это является нашей конечной целью. И хотя в обеих задачах (с одной игрой и с серией игр) наши промежуточные рассуждения апеллируют к возрастанию матожидания, наша аргументация в этих случаях существенно различается. Поэтому различаются и решения парадоксов.

Мне это непонятно. Можете привести эти аргументы для обоих случаев? Или дать ссылку на соответствующие сообщения форума.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
snav
25.8.2015, 5:37
Сообщение #280


Kорифей
****

Группа: Модераторы
Сообщений: 4 134
Регистрация: 13.4.2008
Из: Россия
Пользователь №: 7 457



Ok, выше мы рассмотрели парадокс для однократной игры. Теперь рассмотрим ситуацию, когда игра повторяется много раз. В этом случае у нас появляется возможность использовать статистические методы для оценки суммарного выигрыша и опираться на эти расчеты при принятии решения.

Постановка задачи
Вам предлагаются два конверта с деньгами. Вы наугад берете в руки один из конвертов, после чего должны принять решение: оставить этот конверт себе или обменять его на другой конверт. Игра повторяется много раз с разными парами конвертов, причем суммы для каждой пары выбираются с помощью распределения, указанного в сообщении #9. Какой стратегии вам следует придерживаться, чтобы по совокупности всех игр выиграть больше денег?

Парадоксальные рассуждения
Рассмотрим один раунд игры. Пусть X — конверт, который вы держите в руках, Y — другой конверт. Какая бы сумма x ни находилась в конверте X, условное математическое ожидание конверта Y больше x, то есть M(Y|X=x) > x. Это значит, что в случае обмена конверта математическое ожидание вашего выигрыша увеличится, причем этот вывод не зависит от фактического значения x и справедлив для любого x. Следовательно, если ваш спонсор предоставит вам возможность сыграть достаточно много раз и вы будете каждый раз соглашаться на обмен, то в среднем за игру (по итогам всех игр) вы получите больше денег, чем если бы каждый раз сохраняли свой первоначальный выбор. Вам даже не нужно знать, чему равно x в каждой отдельной игре. Достаточно механически менять конверт и ваш суммарный выигрыш возрастет. Естественно, в некоторых раундах обмен будет вам невыгоден и вы что-то потеряете, но зато по сумме всех игр вы все равно окажитесь в плюсе!

Чтобы еще нагляднее продемонстрировать парадоксальность ситуации, представим, что в игре участвуют двое и каждый игрок получает по конверту. Повторив в уме вышеприведенные рассуждения, оба приходят к заключению, что им следует поменяться конвертами друг с другом, ведь за счет этой нехитрой манипуляции суммарный выигрыш каждого (при многократной игре) должен увеличиться. Однако очевидно, что нельзя одновременно увеличить выигрыш обоих. Где ошибка в рассуждениях?

Пояснение по условию
Как мы уже знаем, математические ожидания M(X) и M(Y) равны бесконечности. Возникает вопрос, можем ли мы в таком случае сравнивать суммы в конвертах и, вообще, говорить о выгодности обмена? Иногда можно встретить примерно такое объяснение парадокса: мы меняем один конверт с бесконечным математическим ожиданием на другой конверт с бесконечным математическим ожиданием, поэтому выгодность обмена не определена. На самом деле, когда мы говорим о выгодности обмена, мы должны сравнивать не математические ожидания M(X) и M(Y), а фактические суммы, которые мы получим на руки при разных стратегиях поведения. Другими словами, нас интересует не абстрактное математическое ожидание выигрыша, а реальное количество денег, которое мы унесем с собой.

Перед каждой игрой в конверты закладываются некоторые суммы x и y. По совокупности n игр мы получим n пар чисел: (x1, y1), (x2, y2), ... (xn, yn). Если вы будете каждый раз забирать себе конверт X, ваш суммарный выигрыш составит Sx = x1+x2+...+xn долларов. В случае обмена вы получите Sy = y1+y2+...+yn долларов. Здесь Sx и Sy — это суммы конечного числа слагаемых, каждое из которых является натуральным числом, поэтому с математической точки зрения нет никаких препятствий к тому, чтобы посчитать эти суммы и сравнить их между собой, узнав, выгоден был обмен или нет.

Статистический парадокс утверждает, что при достаточно большом числе игр среднее арифметическое наблюдавшихся значений Y будет больше среднего арифметического наблюдавшихся значений X, т.е. Sy/n > Sx/n, а следовательно, Sy > Sx. Другими словами, при использовании стратегии «всегда соглашаться на обмен» ваш фактический суммарный выигрыш должен быть больше. В наших расчетах нигде не фигурируют значения M(X) и M(Y), поэтому их бесконечность не могла повлиять на корректность полученного вывода. Где же тогда ошибка?

Предполагаемое решение
Исследуем более тщательно аргументы, которые позволили нам прийти к заключению, что Sy/n > Sx/n. В данном случае мы опирались на известное свойство статистической устойчивости среднего значения случайных величин, а именно: "для большого числа независимых случайных величин среднее арифметическое наблюдавшихся значений этих случайных величин приблизительно равно (сходится к) среднему арифметическому их математических ожиданий". В теории вероятностей данное положение носит название закона больших чисел.

Так как в нашем случае M(Y) бесконечно, то говорить о сходимости Sy/n --> M(Y) не приходится. Поэтому наши рассуждения апеллируют к другой сходимости: к сходимости значения Sy/n к среднему арифметическому условных математических ожиданий Sum[M(Y|X=xi) / n]. Действительно, можно привести примеры, когда случайная величина имеет бесконечное безусловное математическое ожидание, но при этом среднее арифметическое ее наблюдаемых значений сходится к среднему арифметическому условных математических ожиданий. Например, представьте, что вам всегда дают в руки конверт X с меньшей суммой. Очевидно, что в такой ситуации вам было бы выгодно менять конверты — при обмене вы бы получили существенно больший выигрыш, причем значение Sy/n было бы в точности равно значению Sum[M(Y|X=xi) / n], то есть закон больших чисел работает и в этом случае.

Однако не все случайные величины подчиняются закону больших чисел, и как раз в нашем случае (в статистическом варианте парадокса) это закон не выполняется (это можно доказать, но я не буду приводить здесь математические выкладки). Поэтому с ростом числа испытаний сумма Sy не будет стабилизироваться около суммы условных матожиданий (как это имело бы место при выполнении закона больших чисел), а будет совершать неограниченные флуктуации в большую или меньшую сторону. Поэтому наше предположение, что с ростом числа испытаний стратегия "всегда брать второй конверт" является более выгодной, неверно. Руководствуясь этой стратегией, мы можем по сумме игр как выиграть, так и проиграть. В этом состоит решение статистического варианта парадокса.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения

15 Страниц V « < 12 13 14 15 >
Ответить в эту темуОткрыть новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0 -

 



- Упрощённая версия Сейчас: 4.12.2020, 14:41