IPB

Добро пожаловать, гость ( Вход | Регистрация )

 
Ответить в эту темуОткрыть новую тему
> Гамма-распределение
UNDEFEAT
7.5.2023, 21:37
Сообщение #1


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 847
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



Добрый день всем посвящённым в статистику smile.gif

Я не посвящён, потому был бы очень благодарен, если кто-то мне поможет с решением данной проблемы.
Есть случайная величина, которая описывается гамма-распределением с неизвестными параметрами. Есть выборка значений этой СВ. Задача:
1. Найти матожидание.
2. В некой информативной форме указать характеристическое отклонение от матожидания.
Я могу найти параметры k и theta распределения, откуда я автоматически получаю среднее:
EX = k * theta
И дисперсию:
DX = k * theta * theta
Также я могу получить среднеквадратичное отклонение:
sigma = sqrt(DX)
Но оно совершенно неинформативно, потому что иногда оно больше среднего значения, потому могут получаться записи вида:
10 ± 12
Но гамма-распределение оперирует случайными величинами, которые всегда положительны. Оно несимметрично, потому "среднее отклонение влево" (если так можно выразиться) будет меньше "среднего отклонения вправо". Хотелось бы найти такое р, для которого будет простая формула для двух величин dl и dr таких, что:
1) Вероятность того, что значение СВ лежит на отрезке [EX - dl; EX] равна p.
2) Вероятность того, что значение СВ лежит на отрезке [EX; EX + dr] равна p.

Может кто уже сталкивался с такой проблемой? Моя первая идея была найти p при dr = sigma, а уже отсюда найти dl, но как-то пока не получается biggrin.gif

Сообщение было отредактировано UNDEFEAT: 8.5.2023, 21:24
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
alan
8.5.2023, 20:29
Сообщение #2


zzz...
*****

Группа: Администраторы Braingames
Сообщений: 13 476
Регистрация: 23.2.2009
Из: Симферополь
Пользователь №: 13 114



Я со статистикой имел много дела, но уже давно.
Потому мое неэкспертное мнение:

Мат ожидание любой величины будет обычным средним, независимо от ее распределения. Наиболее точным способом его определить именно взять среднее, а не аппроксимировать данные кривой и потом брать среднее от этой аналитической функции. Во втором случае результат сильно зависит от метода аппроксимации.

С дисперсией сложнее. Дисперсия это характеристика "ширины" распределения по сути, и обычно она считается для определения доверительного интервала. Но вот если величина распределена не по Гаусу то это не лучший способ определить доверительный интервал.
В данном случае для theta > 1 дисперсия обязана быть больше среднего, так что 10 ± 12 абсолютно адекватная штука. Вопрос в том как ее интерпретировать.

Тут главный вопрос - зачем тебе нужно знать матожидание и "характеристическое отклонение от матожидания"?

QUOTE
Хотелось бы найти такое р, для которого будет простая формула для двух величин dl и dr таких, что:
1) Вероятность того, что значение СВ лежит на отрезке [EX - dl; EX] равна p.
2) Вероятность того, что значение СВ лежит на отрезке [EX; EX + dr] равна p.

если только за этим то это можно сделать даже программно, рассчитав интегралы от аналитической функции распределения. вероятность это ж обычный интеграл от функции, никакой мистики, вот и приравняй их, забудь про дисперсию.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
UNDEFEAT
8.5.2023, 21:20
Сообщение #3


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 847
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



QUOTE(alan @ 8.5.2023, 20:29) *
С дисперсией сложнее. Дисперсия это характеристика "ширины" распределения по сути, и обычно она считается для определения доверительного интервала.
...
В данном случае для theta > 1 дисперсия обязана быть больше среднего, так что 10 ± 12 абсолютно адекватная штука. Вопрос в том как ее интерпретировать.


Мне кажется, ты немного путаешь дисперсию, среднеквадратическое отклонение и ширину интервала, в который значения СВ будут попадать с конкретной вероятностью.
Ну и в примере "10 ± 12" второе число - это не дисперсия, а среднеквадратичное отклонение, sigma, корень квадратный из дисперсии.

QUOTE(alan @ 8.5.2023, 20:29) *
Тут главный вопрос - зачем тебе нужно знать матожидание и "характеристическое отклонение от матожидания"?


Чтобы сравнить несколько выборок для разных СВ и выбрать самую подходящую из них. Например, если две будут иметь одинаковое матожидание, то я выберу ту, у которой меньший разброс.

QUOTE(alan @ 8.5.2023, 20:29) *
если только за этим то это можно сделать даже программно, рассчитав интегралы от аналитической функции распределения. вероятность это ж обычный интеграл от функции, никакой мистики, вот и приравняй их, забудь про дисперсию.


Я понимаю, что я могу выбрать любое понравившееся мне р, а потом "подобрать" соответствующий интервал, на котором значения двух описанных выше интегралов будут равны р. Собственно, программно я это всё и делаю.

Но это запасной вариант. Я надеялся на то, что кому-то будет известна простая замкнутая форма для некого удобного значения р smile.gif

Сообщение было отредактировано UNDEFEAT: 8.5.2023, 21:21
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
alan
9.5.2023, 0:00
Сообщение #4


zzz...
*****

Группа: Администраторы Braingames
Сообщений: 13 476
Регистрация: 23.2.2009
Из: Симферополь
Пользователь №: 13 114



QUOTE
Чтобы сравнить несколько выборок для разных СВ и выбрать самую подходящую из них. Например, если две будут иметь одинаковое матожидание, то я выберу ту, у которой меньший разброс.

Не понял о чем тут речь.
У тебя несколько данных разных несовместимых типов и ты хочешь выбрать те которые лучше всего вписываются в теорию?
Обычно решение о том какие данные брать и в какую теорию их вписывать принимаются до получения (ознакомления) с этими данными, иначе результат будет искажен.

QUOTE
Я надеялся на то, что кому-то будет известна простая замкнутая форма для некого удобного значения р

Ок. т.е. тебе нужен человек имевший дело конкретно с гамма распределением. Удачи)
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
UNDEFEAT
9.5.2023, 0:55
Сообщение #5


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 847
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



QUOTE(alan @ 9.5.2023, 0:00) *
Не понял о чем тут речь.
У тебя несколько данных разных несовместимых типов и ты хочешь выбрать те которые лучше всего вписываются в теорию?
Обычно решение о том какие данные брать и в какую теорию их вписывать принимаются до получения


Раз уж ты спросил biggrin.gif
В некой мобильной игре периодически проводится "соревнование": нужно нанести как можно больше урона некому монстру. Для этого ты можешь выбирать разные армии и сколько угодно проводить "репетиции", видя, сколько урона ты наносишь. А потом выбрать лучшую по твоему мнению армию и ударить 5 раз "по-настоящему".
Вот я и репетирую по 10 раз с каждой из нескольких армий. Вопрос, что потом с результатами этих репетиций делать smile.gif

В общем и целом практическая сторона исходного вопроса отпала, так как я численными методами уже могу найти всё, что мне нужно, для любого значения p. Слава богу в python это очень просто.

Сообщение было отредактировано UNDEFEAT: 9.5.2023, 0:53
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
alan
9.5.2023, 9:45
Сообщение #6


zzz...
*****

Группа: Администраторы Braingames
Сообщений: 13 476
Регистрация: 23.2.2009
Из: Симферополь
Пользователь №: 13 114



QUOTE(UNDEFEAT @ 9.5.2023, 0:55) *
Раз уж ты спросил biggrin.gif
В некой мобильной игре периодически проводится "соревнование": нужно нанести как можно больше урона некому монстру. Для этого ты можешь выбирать разные армии и сколько угодно проводить "репетиции", видя, сколько урона ты наносишь. А потом выбрать лучшую по твоему мнению армию и ударить 5 раз "по-настоящему".
Вот я и репетирую по 10 раз с каждой из нескольких армий. Вопрос, что потом с результатами этих репетиций делать smile.gif

В общем и целом практическая сторона исходного вопроса отпала, так как я численными методами уже могу найти всё, что мне нужно, для любого значения p. Слава богу в python это очень просто.


Гм. И просто мат ожидания тебе мало, потому что участников слишком много и без удачи не выиграть?
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
UNDEFEAT
9.5.2023, 11:18
Сообщение #7


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 847
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



QUOTE(alan @ 9.5.2023, 9:45) *
Гм. И просто мат ожидания тебе мало, потому что участников слишком много и без удачи не выиграть?


Я знаю самых сильных игроков и вижу их результаты (если они уже "выступили"), потому иногда мне не нужно максимальное матожидание, а подойдёт что-то с матожиданием поменьше, но более надёжное.
Или наоборот: я вижу, что в среднем я не вытягиваю, и могу надеяться только на удачу, потому возьму разброс побольше. В общем, разные ситуации есть.

Сообщение было отредактировано UNDEFEAT: 9.5.2023, 11:19
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
alan
9.5.2023, 11:40
Сообщение #8


zzz...
*****

Группа: Администраторы Braingames
Сообщений: 13 476
Регистрация: 23.2.2009
Из: Симферополь
Пользователь №: 13 114



QUOTE(UNDEFEAT @ 9.5.2023, 11:18) *
Я знаю самых сильных игроков и вижу их результаты (если они уже "выступили"), потому иногда мне не нужно максимальное матожидание, а подойдёт что-то с матожиданием поменьше, но более надёжное.


Понятно...

Правда не понятно зачем тебе это:
QUOTE
1) Вероятность того, что значение СВ лежит на отрезке [EX - dl; EX] равна p.
2) Вероятность того, что значение СВ лежит на отрезке [EX; EX + dr] равна p.


Вроде как тебе нужна вероятность, что CВ лежит на отрезке [max; inf], где max - результат лучшего игрока. Что по сути "1 - функция распределения".
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
UNDEFEAT
9.5.2023, 12:00
Сообщение #9


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 847
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



QUOTE(alan @ 9.5.2023, 11:40) *
Правда не понятно зачем тебе это:
Вроде как тебе нужна вероятность, что CВ лежит на отрезке [max; inf], где max - результат лучшего игрока. Что по сути "1 - функция распределения".


Это же зависит от ситуации, что мне нужно. Я описал просто некое характеристичное отклонение.
Ну и финальный результат - это сумма урона в пяти попытках.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения

Ответить в эту темуОткрыть новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0 -

 



- Упрощённая версия Сейчас: 16.4.2024, 17:35
Яндекс.Метрика