Всего одна задача по теории вероятностей

Одна задача по теории вероятностей

Таня написала в блокноте натуральное 3х-значное число, делящееся на 28. (n) Коля называет по своему усмотрению 6 натуральных 3х-значных чисел. (n1, n2, n3, n4, n5, n6) Какова вероятность, что среди чисел, названных Колей, будет число, загаданное Таней?

Казалось бы, всё просто: поскольку желаемое событие Q есть событие-дизъюнкция простых событий: n1=n, n2=n, n3=n, n4=n, n5=n, n6=n и эти события несовместны, то p(O) равна сумме вероятностей этих простых событий. Вероятность же каждого такого события равна 32/900, т.к. 3х-значных чисел существует 999-100+1=900, а чисел, делящихся на 28, среди 3х-значных - floor(900/28)=32 (где floor – округление до целого в меньшую сторону).
Таким образом, p(Q)=32/900*6=0,213.

Но этот результат неверен, т.к. из него следует, что стоит позволить Коле назвать всего 30 чисел (даже не 32!), то есть в 5 раз больше и вероятность станет >1, то есть он 100%-но отгадает Танино число. Между тем понятно, что если дать Коле возможность отгадать с 32 чисел, то вероятность отгадать в этом случае будет всего 1/32, т.к. 32 числа, будь они хоть написаны подряд или как угодно разбросаны по множеству 3х-значных чисел, 100%-но «зацепят» одно из тех 32 чисел, 3х-значных и делящихся на 28. Но ведь Таня-то загадала какое-то одно из этих чисел, поэтому вероятность угадать с 28 чисел равна 1/32. Вероятность же угадать с меньшего количества чисел – меньше, чем это значение.

Во сколько же раз? Да во столько же раз, во сколько называемое количество чисел меньше 28, ведь именно такова и получается вероятность того, что, называя, как Коля, 6 чисел, мы всё-таки зацепим одно из тех 32 чисел, среди которых находится Танино число.
(тогда как, называя 28 чисел, мы это сделаем с вероятностью 1. Кстати, если нам позволено угадывать с 28 чисел, то, с точки зрения определения вероятности,  это равноценно тому, что нам (и Коле) известно, что Танино число делится на 28. Тогда мы отгадываем с 1-го числа с вероятностью 1/32)
Таким образом, вероятность отгадать с 6 чисел равна 6/32*1/32=0,005859.

Но данный расчёт неверен, и вот почему: легко доказать, что если записать подряд 28 3х-значных чисел, то среди них обязательно найдётся одно число, которое нацело делится на 28.
Множество из 900 3х-значных чисел содержит 32 таких блока.
Отсюда вывод: если дать Коле возможность отгадать с 28 чисел, то вероятность отгадать в этом случае будет всего 1/32, т.к. 28 чисел, будь они хоть написаны подряд или как угодно разбросаны по множеству 3х-значных чисел, 100%-но «зацепят» одно из тех 32 чисел, 3х-значных и делящихся на 28. Но ведь Таня-то загадала какое-то одно из этих чисел, поэтому вероятность угадать с 28 чисел равна 1/32. Вероятность же угадать с меньшего количества чисел – меньше, чем это значение.

Во сколько же раз? Да во столько же раз, во сколько называемое количество чисел меньше 28, ведь именно такова и получается вероятность того, что, называя, как Коля, 6 чисел, мы всё-таки зацепим одно из тех 32 чисел, среди которых находится Танино число.
(тогда как, называя 28 чисел, мы это сделаем с вероятностью 1. Кстати, если нам позволено угадывать с 28 чисел, то, с точки зрения определения вероятности,  это равноценно тому, что нам (и Коле) известно, что Танино число делится на 28. Тогда мы отгадываем с 1-го числа с вероятностью 1/32)
Таким образом, вероятность отгадать с 6 чисел равна 6/28*1/32=0,006696.

**
Решим более общую задачу по отношению к только что решенной. И формулируется она так: пусть имеется множества A и B, являющиеся подмножествами некоторых базовых множеств (которые в простейшем случае совпадают, назовём это единое базовое множество S. Например, это множество 3х-значных чисел.) Далее, известны количества элементов множеств А, B и S, пусть это будут соответственно nA, nB и nS.
Спрашивается, какова вероятность события Q, то есть пересечения множества А с множеством В? Так как множество А может быть построено С(nS,nA) способами (где С(nS,nA) – количество сочетаний из nS по nA), а множество В - С(nS,nB) способами, то общее количество случаев взаимного расположения множеств А и В равно N=С(nS,nA)*С(nS,nB)

Каково же количество случаев взаимного расположения множеств А и В, соответствующих желаемому событию Q? (обозначим эту величину Nq) Для определённости положим, что nA>=nB (что не повредит общности рассуждения, т.к. А и В всегда можно переименовать.)
Пусть мы построили множество А, что можно сделать С(nS,nA) способами. Теперь подсчитаем количество случаев присоединения множества В к данным случаям построения множества A таким, что множества пересекаются. Общее количество построений множества В, как известно,  равно С(nS,nB). Но нам нужно убрать из этого множества те случаи построения В, при которых пересечения его с множеством А не получается ни по одному элементу.

И это будет иметь место, если мы всё множество В расположим в том сегменте S, который не занят множеством А. Сколько же позиций в этом сегменте? Это просто найти: nS-nA. Тогда количество тех случаев построения В, в которых пересечении его с А отсутствует, равно C(nS-nA,nB)
Стало быть, количество случаев построения В, когда пересечение его с множеством А имеется, равно Nq= С(nS,nB) - C(nS-nA,nB).
Следовательно, искомая вероятность
p(Q)=Nq/N= С(nS,nA)* (С(nS,nB) - C(nS-nA,nB))/(С(nS,nA)*С(nS,nB)) = (С(nS,nB) - C(nS-nA,nB))/С(nS,nB) = 1- C(nS-nA,nB)/С(nS,nB)

Отсюда, в частности, следует, что при nS-nA<nB (<= nA+nB>nS) p(Q)=1, т.к. C(nS-nA,nB)=0

**
Решим еще более общую задачу. Формулировка оной отличается от формулировки только что решенной тем, что базовые множествf для множеств А и В – разные, а именно Sa и Sb. (но при этом Sb – подмножество Sa или наоборот. Пусть для определённости 1=ое, тогда nSb<=nSa)
Тогда, понятно, N= С(nSa,nA)*С(nSb,nB)
Тогда, после построения множества А нам следует отбросить из всего множества случаев построения множества А те случаи, которые не могут дать пересечения множеств А и В ни при одном случае построения множества В. Понятно, что для этого надо величину С(nSa,nA), то есть общее количество способов построения множества А, умножить на nsB/nSa, то есть долю количества элементов множества Sb от количества элементов множества Sa. Истолковывается это так, что каждый nsB/nSa-ый случай построения множества А имеет шанс дать пересечения множества А с множеством В, все же остальные случаи – не имеют никаких шансов на это, т.к. не содержат ни одной предполагаемой позиции из множества В.

Однако данное утверждение неверно, и вот почему: вычисляя вероятности, мы имеем дело в 1-ую очередь количеством сочетания, а не количеством элементов во множествах. А отношения 1-ых, понятно, несоразмерны отношениям 2-ых. Поэтому использование пропорций для определения связей между ними – неверно. Но как же будет верно?
Начнём определение Nq с построения меньшего множества, В. И это можно сделать С(nSb,nB)
способами. Теперь нам нужно определить количество случаев построения множества А таких, чтобы обеспечить пересечение множеств А и В. Для этого нам нужно из общего количества случаев построения множества А, равного С(nSa,nA) вычесть количество случаев построения множества А, при которых множества А и В не пересекаются.  И такое получится, если множество А мы будем строить только на тех позициях, в которых множество В в принципе не может появиться. А таких позиций nSa-nSb. Следовательно в С(nSa-nSb,nA) случаях построения множества А пересечение множеств А и В исключено.
Отсюда
Nq= С(nSb,nB)*(С(nSa,nA) - С(nSa-nSb,nA))
Отсюда вероятность желаемого события
p(Q)=Nq/N= С(nSb,nB)*(С(nSa,nA) - С(nSa-nSb,nA))/(С(nSa,nA)*С(nSb,nB)) =
= 1 - С(nSa-nSb,nA)/(С(nSa,nA)

**
Применив данную формулу для исходной задачи, получим:
p(Q)= 1 - С(900-32,6)/(С(900,6) = 0.1957421020
Получили довольно высокий результат, что встревоживает. Поэтому проверим данную формулу на другом случае, при nA=28. Тогда получается:
p(Q)= 1 - С(900-32,28)/(С(900,28) = 0.6428138294
Понятно, что здесь завышение в 20 раз относительно ранее полученного значения вероятности 1/32 = 0.03125
Поэтому ищем дальше изъяны в рассуждениях.

**
И вопросы к рассуждениям есть:
1)почему в формуле
p(Q) = 1 - С(nSa-nSb,nA)/(С(nSa,nA)
стоит nSb вместо nB? Ведь тогда при nSa=nSb=nS из этой формулы получаем
p(Q) = 1 - 0/(С(nSa,nA) =1,
что не согласуется с полученной ранее формулой для этого случая:
p(Q) = 1- C(nS-nA,nB)/С(nS,nB),
которая проверена и сертифицирована.
Отсюда вывод: формула
p(Q) = 1 - С(nSa-nSb,nA)/(С(nSa,nA)
неверна и скорее всего даёт завышенное значение вероятности.

2)почему при выводе формулы
p(Q)= 6/28*1/32=nA*nSb/nSa*nB/nSb=nA*nB/nSa
принято не только то, что
- если записать подряд 28 3х-значных чисел, то среди них обязательно найдётся одно число, которое нацело делится на 28. (что верно),
но и то, что
- если разбить множество всех 3х-значных чисел (которых всего 900) (то есть множество А) на классы (то есть на непересекающиеся подмножества, объединение которых равно исходному множеству) по 28 чисел, то каждый класс будет содержать ровно 1 число из множества В. (что категорически неверно)
Отсюда вывод: формула
p(Q)=nA*nB/nSa
неверна и скорее всего даёт заниженное значение вероятности.

Возьмёмся за проверку вывода по 1-ому вопросу, потребовав nB<nSb, назначив конкретные исходные данные: nSa=4, nA=2, nSb=2, nB=1 и построив таблицу соответствия множеств, в результате чего получим:
p(Q)=6/12 = 2*3/(2*6),
где
2=С(nSb,nB)
6=C(nSa,nA)
3= C(nSa,nA)-C(nSa-nB,nA)

Что и приводит нас к выводу, что верна всё-таки формула
p(Q)= 1 - С(nSa-nB,nA)/(С(nSa,nA)
Что же касается вопроса 2, то он действительно обнаружил неправильную формулу, которую непонятно, как исправить.
Согласно же последней формуле, ответ в исходной задаче получается такой:
p(Q)= 1 - С(900-1,6)/(С(900,6) = 0.00667
Что возвращает нас к значениям 1-ой волны теории. Осталось сделать проверку на 28 числах:
p(Q)= 1 - С(900-1,28)/(С(900,28) = 0.0311,
что чрезвычайно нам знакомо, ибо
1/32=0.03125

Что приводит нас к выводам
1)окончательно правильная формула для расчёта вероятности пересечения множеств такова:
p(Q)= 1 - С(nSa-nB,nA)/(С(nSa,nA)
2)очень хорошее приближение к данному результату даёт формула:
p(Q)=nA/nSa

**
Каковы же в итоге выводы из данных рассуждений?
1)существуют задачи по теории вероятности, которые не имеют сразу генеральных решений в теории.
2)поэтому приходиться ложиться в пласт генерации теории.
3)по ходу генерации теории возникают ситуации, когда кажется, что теория уже готова
4)после этого проверяем данный вариант теории при помощи старых теорем теории. (например, то, что любая вероятность не может быть >1)
5)создаём исправленную версию теории и опять же проверяем её на практике.
6)если последняя проверка прошла успешно, можно начинать спать.


Рецензии