Продолжение статьи Лекса Кравецкого «Контринтуитивная орлянка». Первую часть читайте по ссылке: https://22century.ru/popular-science-publications/orlyanka1.
Это мошенник, джентльмены!
В прошлый раз мы закончили на рассмотрении игр, в которых всё честно.
Ну как честно — в том смысле, что шансы на выигрыш в элементарном акте игры равны, хотя, быть может, именно то, что оные не зависят от ума, сноровки и нравственности игрока, как раз и является нечестным.
Однако давайте всё-таки взглянем, что будет, если один из игроков столь умён, что слегка умеет предсказывать бросок монетки. Поэтому вероятность угадать и, следовательно, выиграть для него чуть-чуть больше одной второй.
Ну или, если угодно, в игре используется слегка несимметричная по массе монетка, которая орлом выпадает чуть чаще, и именно на орла каждый раз ставит особо талантливый игрок.
Матожидание выигрыша в этом случае будет уже не нулевым. В общем случае — для двух возможных исходов — оно рассчитывается по формуле
Где p — вероятность первого исхода, а c1 и c2 — значения исходов.
В данном случае первый исход — это выигрыш в игре первого игрока, а значения исходов — это выигрыш и проигрыш одной и той же суммы. То есть в этой игре матожидание выигрыша первого игрока…
Легко убедиться, что при вероятности выигрыша ½ матожидание будет нулевым, однако что будет, если вероятность отличается от одной второй?
Запишем вот так:
Теперь, если это дело подставить в формулу матожидания, получится:
Давайте предположим, что, вместо того, чтобы ловко угадывать, талантливый игрок просто убедил соперника, что его заслуги перед обществом и самим собой прямо-таки требуют, чтобы при угадывании он получал бы больше, чем терял при неугадывании. Скажем, больше на m. Однако угадывать и не угадывать он теперь будет с равной вероятностью.
Сравнив между собой эти два результата, мы можем заключить, что игра с большей вероятностью угадывания по матожиданию выигрыша тождественна игре с большей суммой выигрыша, если их поставить в соотношение
Например, если талантливый игрок угадывает с частотой 0,6, вместо 0,5, он с тем же успехом мог бы перестать мошенничать, а просто требовать себе в качестве выигрыша не один доллар, а…
Если провести целую серию игр с означенной вероятностью угадывания, например, сто партий, то в плане денег на руках у игроков мы увидим примерно следующее.
Как можно видеть, хотя талантливый игрок на время даже слегка проигрался другому игроку, суровый бонус в вероятности угадывания (или в увеличенном по сравнению с другим игроком выигрыше) всё равно взял своё. И на длинной серии игр возьмёт в подавляющем большинстве случаев.
Так, лишь примерно в 165 играх по 100 бросков монетки из 10 000 этот ловкий парень проиграет.
Если же количество бросков в игре увеличить до 1000, то второму игроку очень повезёт, если он выиграет хотя бы один разик из 10 000.
Играй, давай
Вы можете задаться вопросом: но кто в здравом уме будет играть в такого рода игры? Если выигрыш возможен лишь на серии в несколько партий, а на длинной серии неизбежен проигрыш?
О, тут вы поразитесь, сколько людей на такое соглашается.
Возьмём, например, рулетку. Если ставить на красное или чёрное, то вроде бы вероятность выигрыша — ½. И в случае выигрыша вам возвращают вашу удвоенную ставку…
Однако на рулетке есть бесцветное зеро, которое делает вероятность угадывания меньше, чем ½. И хорошо, если оно там одно — бывает и два.
Всего на рулетке при одном зеро 37 чисел, поэтому вероятность выигрыша
Матожидание выигрыша в партии в рулетку, таким образом,
Где c — величина ставки.
То есть в каждой партии вы в среднем дарите казино одну тридцать седьмую того, что поставили. Такие вот занимательные чаевые.
Сыграем пробную серию партий в виртуальную рулетку со ставкой в один доллар.
В этом эксперименте сначала фишка попёрла, но где-то на двухтысячной партии жизнь виртуального игрока явно покатилась под откос.
«Да, но ведь он же поначалу выигрывал, — сказал бы на это кто-то, — можно ведь было бы вовремя остановиться и уйти».
Действительно, можно. Вот только знать бы, когда.
И более того, кроме того, что невозможно узнать, когда именно надо уйти, есть ещё второй момент: нельзя возвращаться. Никогда.
Потому что данный процесс не «обнуляется» в момент вашего ухода. Уйди этот виртуальный игрок примерно на тысячной партии с выигрышем 50 долларов на руках, если бы он потом пришёл ещё раз, то вполне мог повториться ровно вот этот график. И к десятитысячной игре у него бы уже был суммарный проигрыш в 200 долларов (от той суммы, которая у него была ещё до первой игры).
Причём, замечу, даже если казино не жульничает и крупье не пытается попасть шариком в нужное место во время броска.
Однако наличие локальных выигрышных серий, видимых даже на графике невооружённым глазом, не говоря уже про внутреннее чувство «сегодня мне попёрло», может ввести в заблуждение относительно всего процесса и заставить подумать, будто бы тут главное — вовремя уйти.
О нет, тут главное никогда больше не возвращаться.
В общем, из тысячи достаточно смелых, чтобы сыграть 10 000 партий в рулетку со ставкой доллар за партию в небольшом выигрыше останутся примерно четверо.
Самый счастливый из них выиграет примерно 70 долларов.
Но сколько же в сумме выиграет казино?
Барабанная дробь…
273 430 долларов.
Счастье от ума
Ну хорошо, сейчас я рассматривал мошенничество и везение, однако ведь есть и другие способы побеждать в играх.
Понятно, что намёк на рулетку как бы подводил читателя к тому, чтобы показать наконец-то тот самый «перекошенный колокол», о котором зашла речь в конце прошлой статьи.
— Вот-де оное искривление вызвано как бы тем, что часть игроков жульничает.
— Но постойте, быть может, они просто лучше играют? В ту самую игру, где выгодные сделки заключаются не броском монетки, а вроде как рациональным расчётом, трудолюбием и прочими положительными вещами?
О да, ссылка на мошенничество игроков перечеркнула бы все выводы о том, что наблюдаемое нами распределение строго результат везения. Слепой случайности и всё такое. Если мы предполагаем мошенничество, то почему бы не предположить ещё что-то — например трудолюбие и ценные навыки?
Однако я, внезапно, и не собирался ничего такого предполагать — даже мошенничества. Напротив, этот вариант — мошенничество или сообразительность — я добавил уже потом, после того, как нашёл иной вариант, действительно давший искомое распределение.
Тем не менее, чтобы не было сомнений на тему «а вдруг и этот вариант тоже подходит?!», давайте всё-таки взглянем, как вариант с мошенничеством или, если вам угодно, с умом и талантом, изменил бы расклады в ранее рассмотренной серии попарных игр — ведь, как было показано в предыдущих разделах, оно ещё как может проявляться.
Напомню правила игры. Игроки разбиваются на случайные пары и играют партию в орлянку (теперь уже с неравными вероятностями выиграть) на случайную ставку от 1 до 10.
У всех в начале игры по 10 000 долларов.
Пусть у нас будет 1000 игроков, большинство из которых имеют примерно один и тот же уровень игры, но некоторое их количество всё-таки угадывает лучше.
Я решил это отразить вот такой функцией от порядкового номера игрока — v(n):
Соответственно, для пары игроков вероятность выиграть будет определяться, как
После того, как все сыграли тысячу игр, получается вот такой расклад.
Мы уже видим длинный «хвост», как это обычно имеет место быть на реальной статистике доходов, однако главная часть колокола не перекошена.
Однако вот как в реальности выглядит распределение по доходам или по капиталам. Приблизительно вот так (числа на осях тут условные).
В общем, получилось слегка похоже, но не совсем. Хвост есть, но «основной колокол» не «перекошен».
ОК. Быть может, тогда надо сделать ещё и плохих игроков. Попробуем ещё вот такое распределение «способностей»:
Увы, стало хуже.
Теперь появились два несимметричных «хвоста», а вовсе не искомый перекошенный колокол с «хвостом» справа.
Ну ладно, мы можем предположить, что способности людей распределены в виде аналогичного колокола, что соответствует результатам экспериментов, и использовать вот такое отношение вероятности победы.
Но и так мы не получим искомого распределения: снова левая часть, вместо того, чтобы «сплющиться», наоборот, растягивается.
Ещё мы можем попробовать отрезать от предыдущего варианта левую часть, предположив, что совсем уж тупые просто не догадываются сыграть в эту игру и проиграть в ней деньги умным.
Жаль, но так тоже не срабатывает.
Но почему?
И вот причина
Можно перебрать ещё много вариантов, однако тут всё дело в том, что в данной модели мы, фактически, во всех этих экспериментах стремимся к гистограмме матожидания выигрыша каждого из игроков, умноженного на матожидание ставки.
Оба матожидания — константы для каждого из игроков. Поэтому, с поправкой на некоторый шум, формы этих гистограмм предопределены с самого начала: распределение результатов игр будет по своей форме похоже на распределение способностей.
Если снова взглянуть на желаемое распределение результатов…
…то можно заключить, что первый вариант распределения способностей…
…действительно давал что-то относительно близкое к искомому.
Если же попытаться сознательно подобрать распределение способностей, то можно воспользоваться такими вот соображениями.
Матожидание результата игрока пропорционально отношению его способностей к способностям всех остальных игроков. Поэтому для длинного «хвоста» справа, у небольшой группы игроков должен быть резкий рост способностей по сравнению со всеми остальными.
У остальных же способности должны расти очень плавно, по какой-то очень заковыристой закономерности, чтобы обеспечить искомый смещённый колокол.
Где-то же в самом начале графика должно произойти ещё что-то, чтобы обеспечить спад к полным лузерам — более крутой, чем переход от нормальных игроков к особо талантливым.
Результат, вдобавок, оказывается очень чувствительным к распределению способностей и при малейших отклонениях тут же сильно искажает распределение результатов в сравнении с искомым.
Это наводит на мысль, что реальный процесс, весьма вероятно, не зависит от способностей или умения мошенничать — ведь если такое распределение доходов повторяется десятилетиями и во всех странах мира, то чем обеспечивалась бы столь высокая устойчивость при столь сильной зависимости от распределения способностей?
Да и в левой части распределения в наилучшем из найденных вариантов всё-таки наблюдается слишком очевидный перегиб, который в искомом распределении, базирующемся на реальных распределениях доходов и личных капиталов, почти не заметен невооружённым взглядом.
Однако, ладно. Предположим, что такая гипотеза имеет право на жизнь: то есть, в мире правда вполне может существовать некоторая постоянная доля мегагениев, столь хорошо выигрывающих, что распределение их способностей обеспечивает длинный хвост у распределения результатов, и какое-то, неясно чем вызванное, нетривиальное распределение по способностям среди всех остальных.
Тем более что данное распределение результатов (называемое «логнормальным») часто является следствием наличия в системе более чем одного случайного процесса — вдруг и тут тоже так?
Но не может ли быть у всего этого какого-то более простого объяснения, которое даёт такой же результат без всех этих, не проверенных экспериментально предположений и хитровывернутых, но ненаблюдаемых в исследованиях распределений способностей?
Ведь если есть относительно простые правила игры, которые обеспечивают данное распределение в довольно устойчивом варианте сами собой, и что-то очень похожее на подобные правила наблюдается в реальности, то, весьма вероятно, именно сами правила игры являются причиной наблюдаемых результатов, а всё остальное лишь в незначительной степени их дополняет.
Например, для объяснения результатов «честной» попарной орлянки какие-то особые предположения не понадобились — хватило самих её правил. Не исключено, и тут тоже так.
Можно ли подобрать такие правила?
Лучше быть богатым и здоровым
Способность выигрывать чаще, независимо от обстоятельств, в данном процессе является чем-то вроде «скрытого параметра». Но одновременно с ним есть и «открытый»: та сумма, которая находится сейчас у игрока на руках.
Давайте предположим, что вероятность выигрыша зависит не от неких «умений», а просто от величины капитала на данный момент.
Это ведь вполне логичное предположение: результат игры в орлянку от суммы на руках не зависит, однако при реальных сделках вполне может быть, что более богатый имеет какие-то дополнительные возможности по склонению сделки в свою пользу. Ну там, взятки каким-то госорганам даёт, заводит себе лоббистов в парламенте, мафию подсылает, а то и вообще пользуется негласным имущественным цензом.
Пусть, например, вероятность выигрыша более богатого игрока зависит от разности капиталов двух игроков следующим образом.
Запустим ранее описанную серию игр с такой вероятностью выигрыша для более богатого игрока из каждой пары, сделав ставку в каждой партии для каждой пары случайным числом от 1 до 100.
Как можно видеть, гипотеза об определяющей роли богатства тоже не подтвердилась для искомого распределения: мы получаем примерно то же симметричное колоколообразное распределение, что и раньше, которое просто быстрее «разъезжается» с ростом количества сыгранных партий, чем было при равновероятных выигрышах.
Если мы сделаем ставку постоянной и более высокой — например, 1000 долларов, — то обнаружим, что к тысячной партии колокол вообще исчез и игроки почти равномерно распределены по имеющимся на руках суммам.
То есть, будучи реализованным в реальности, такой процесс не дал бы нам устойчивого распределения искомой формы.
Богатые, быть может, выигрывают чаще, однако нужен ещё какой-то фактор, чтобы объяснить исход.
Зависимая ставка
Ещё одно предположение, которое можно сделать: более богатые могут сыграть на более высокую ставку. Ведь для них та сумма, которую они готовы проиграть, существенно выше, чем у бедных.
Ставку, видимо, определяет тот игрок в каждой паре, у которого меньше денег, и лимитирует её, предположим, одной двадцатой имеющихся у него денег. Однако, предположим, что даже если игрок ушёл в глубокие долги, ставка не может быть меньше одного доллара.
И вот тут мы на некотором этапе игры всё-таки увидим искомое распределение.
Правда, к тысячной партии богатые обирают большинство игроков почти дочиста, а потому распределение становится вырожденным, «сплющивая» свой «искривлённый колокол» где-то поблизости от нуля.
Распределение оказывается неустойчивым, однако на довольно длинном количестве игр оно всё-таки имеет искомую форму.
Более того, в данном эксперименте, наряду с определением ставки по капиталу более бедного игрока из пары, использовался тот же принцип, что и в прошлом разделе: богатый выигрывает чаще.
Однако, если сделать выигрыш равновероятным, независимо от капитала, распределение всё равно сохраняется — только лишь для достижения искомого распределения и для его последующего вырождения требуется большее количество игр: если к тысячной игре, при растущей с капиталом вероятности выигрыша, распределение уже выродилось, то при равновероятном выигрыше на тысячной игре всё ещё наблюдается что-то довольно близкое к искомому.
Иными словами, быть может, богатые правда выигрывают чаще, однако одно только это не даёт искомого распределения, но, с другой стороны, зависимость ставки от текущего капитала беднейшего игрока из пары обеспечивает искомое распределение даже при равной вероятности выигрышей.
Аналогичное можно сказать и про влияние «таланта» или мошенничества.
Небольшая возможная модификация
Отмечу, что рассмотренный тут вариант имеет минимум один почти тождественный ему.
Отличие их лишь в том, что в исходном варианте за один раунд каждая пара играет одну партию, ставка в которой определяется долей беднейшего игрока. В модификации же можно сделать так, что каждый игрок за раунд может сыграть несколько партий с разными игроками — так, чтобы суммарные ставки в них примерно сравнялись с заранее заданной долей от его капитала на начало раунда.
Эта модификация даст точно такое же распределение, правда, процессы в ней будут идти несколько быстрее — то есть быстрее будет расти «хвост» справа и богатые быстрее оберут бедных до состояния нищеты, если ничего с этим не сделать. Но это в основном потому, что модифицированный раунд включает в себя большее количество партий при том же количестве участников, чем немодифицированный.
Однако такой вариант больше похож на наблюдаемое в реальности, поскольку за единицу времени более богатый действительно может поучаствовать в большем количестве сделок с низкими ставками, чем бедный. Например, открыть магазин и обслуживать в нём целую кучу покупателей — в том числе, руками нанятых сотрудников, состоя, таким образом, в сделках и с множеством покупателей, и с множеством нанятых сотрудников.
Но исследование такой модификации несколько сложнее для рассуждений и иллюстраций, поэтому я только упомяну, что такой вариант имеется, и его результаты просто по самому построению правил игры будут аналогичны результатам рассматриваемого тут.
Ну а после того, как я об этом упомянул, можно перейти к рассмотрению следующего важного вопроса.
Обеспечение устойчивости
Как говорилось в позапрошлом разделе, есть одна проблема: это распределение оказывается неустойчивым и вырождается при большом количестве игр.
Если бы в мире всё шло именно так, то финалом сего процесса было бы полное обнищание подавляющего большинства игроков и сверхбогатство небольшой группы людей.
Правда, меня терзают смутные сомнения: ведь в нашем мире местами именно это и наблюдается.
То есть нужна какая-то модификация данного процесса, сохраняющая искомое распределение даже на большом количестве сыгранных партий.
И эта модификация, вообще говоря, весьма распространена в реальности. Это — пособия малоимущим. Именно они спасают особенно неудачливых игроков от полного разорения и не дают «колоколу» коллапсировать.
Введём такие пособия в процесс игры.
Однако, если ввести их в виде некоторой фиксированной суммы на все времена, то это лишь слегка отсрочит вырождение распределения доходов.
Чтобы же добиться устойчивости величина пособия должна зависеть от текущей ситуации, и чтобы её вычислить, предпримем довольно простой манёвр.
Найдём наибольший текущий капитал у некоторой доли игроков, который будет обозначаться, как Q(d), где d — соответствующая доля.
Величину пособия определим, как
Выплачиваться оно будет двум десятым беднейших игроков, что должно сдвинуть их примерно туда, где расположены в данный момент игроки из третьей слева десятой доли (на графике изображены лишь беднейшие 400 из 1000 игроков — иначе будет тяжело разглядеть суть произошедшего).
Оказывается, что этой простейшей модификации хватает, чтобы сохранять устойчивость распределения сколь угодно долго.
Вот результаты после шестисотой игры.
После тысячной.
После трёхтысячной.
Можно видеть, что с ростом количества игр растягивается «хвост» распределения, но сама форма, подобная искомой, сохраняется.
Ну и, наконец, благодаря пособиям, основанным, видимо, на печати денег, явно происходит инфляция. Начав с 10 000 долларов на брата, после трёх тысяч игр мы дошли до того состояния, при котором даже у бедняков капиталы выражаются девятизначными числами.
Впрочем, от инфляции можно избавиться: достаточно лишь, вместо печати новых дензнаков, ввести «налоги», из которых будут выплачиваться пособия.
После каждого раунда со всех игроков будет собираться определённый процент от их текущего капитала, который будет тут же равномерно распределяться между нуждающимися. Определяться этот процент на каждом этапе будет таким образом, чтобы суммарный налог со всех игроков покрывал целиком все выплаченные пособия.
Теперь, как можно видеть, наступила благодать: распределение — ровно то, которое надо, оно устойчиво при увеличении количества сыгранных игр, и нет никакой инфляции.
Я даже попробовал провести десять тысяч игр для десяти тысяч игроков, вместо тысячи для тысячи, и сделать ставку пятой частью от капитала, беднейшего в паре, а не двадцатой. И всё равно всё сошлось.
Сравните с наиболее успешным вариантом сымитировать искомое распределение при помощи таланта или мошенничества.
И с самим искомым — «классическим» логнормальным распределением.
Какая-то подозрительная модель
На всякий случай, я ещё раз опишу суть процесса.
Группа игроков, обладающая абсолютно равным начальным капиталом, разбивается случайным образом на пары, а потом в каждой паре игроки играют одну партию в орлянку.
Орлянка — совершенно честная, а потому выигрыш каждого игрока в паре равновероятен.
Ставка в каждой партии каждой пары определяется определённой долей текущего капитала на руках у беднейшего игрока в этой паре.
После игры беднейшим двум десятым игроков выплачиваются пособия, собранные со всех игроков в виде процента с их текущего капитала таким образом, чтобы покрыть в сумме выплаченные пособия.
После этого игроки заново разбиваются на пары и снова играют в орлянку.
В результате мы получаем логнормальное распределение капиталов — в виде скошенного влево «колокола» с хвостом. Это распределение довольно устойчиво — с поправкой на то, что хвост продолжает удлиняться с ростом количества проведённых игр (впрочем, и в реальном мире происходит аналогичное).
От ума и талантов игроков ничего не зависит.
От капитала зависит только величина ставки.
Но, внезапно, полученное в этой игре распределение повторяет то самое, что в реальности наблюдается в распределении капиталов (и доходов) людей.
Определяющим правилом игры оказывается вполне рациональная и ожидаемая зависимость ставки от капиталов каждого из игроков в каждой паре. С этим правилом удаётся воспроизвести распределение (и заодно наблюдающийся в реальности процесс удлинения «хвоста»), даже при абсолютной равновероятности выигрыша и проигрыша, а без неё никакие завязки вероятности выигрыша на «талант» или на текущий капитал не помогают.
Стабилизировать распределение при этом удаётся при помощи раздачи пособий. Что тоже вполне наблюдается в реальности — равно как и неизбежное обнищание основной массы граждан при отсутствии пособий в той или иной форме.
То есть данное распределение заложено в самих «правилах игры» — в самом способе взаимодействия «игроков».
Причём именно в них, в первую очередь. В правилах.
Талант же игрока, повышающий вероятность выигрыша, или возможность использовать капитал для давления на ситуацию и аналогичного повышения вероятности выигрыша — это лишь дополнения к процессу, которые, возможно, как-то его ускоряют и вносят в него некоторые непринципиальные поправки (и я проверил, это, правда, так), но сами по себе не являются главными факторами, образующими данное распределение.
При абсолютной идентичности игроков в плане их способностей и полным равенством в правах и возможностях, независимо от капитала, мы всё равно пронаблюдали бы ровно такое распределение доходов.
Правила довольно простой и абсолютно случайной игры оказываются важнее всего остального.
Достаточно лишь совершать свободные коммерческие сделки, где равновероятно выиграть или проиграть сумму, которую оба партнёра заранее сочтут приемлемой для проигрыша, и платить пособия особо сильно проигравшим.
И всё. Будет примерно то, что есть сейчас. Везде.
Впрочем, такие правила игры не единственные. Есть у меня ещё один вариант игры, дающий аналогичные результаты. Быть может, хотя бы в нём мы сумеем пронаблюдать определяющую роль талантов?
Дам спойлер: нет.
Но об этом в следующей части.
Источник: