Задача состоит в следующем:
У игрока изначально есть приз размером 1 очко. Есть также последовательность вопросов n штук.
Для каждого вопроса у игрока есть два действия:
Забрать текущий приз и выйти из игры.
Попытаться ответить на вопрос. Если он отвечает правильно, то приз удваивается и игра продолжается, иначе игрок не получает ничего.
Если вопросы закончились, то игрок забирает текущий приз и уходит. Нужно выбрать такую стратегию для игрока, чтобы максимизировать математическое ожидание выигрыша. Для каждого вопроса вероятность правильно ответить на него равномерно распределяется между t и 1. Причем, перед тем как решить ответить или нет, мы заранее узнаем эту вероятность.
Примеры:
n = 1, t = 0.5
Ответ: 1.500
n = 1, t = 0.3
Ответ: 1.357
n = 2, t = 0.6
Ответ: 2.560
Объясните пожалуйста, как получаются подобные ответы к задаче.
P.S. Обновил условие, оказывается задача выглядит немного не так.