Analytics Space : Расчет прогнозных коэффициентов суммы ГГРа / Бетов / Депозитов

Для расчета прогнозных коэффициентов можно использовать любую количественную метрику, которую хотим спрогнозировать, на данный момент это сумма ГГРа / Бетов / Депозитов в Евро. В первую очередь строится матрица, где по оси У (вертикальной) отображается месяц регистрации когорты, а по оси Х (горизонтальной) показывается сколько полных месяцев уже просуществовал трафик. В качестве основного значения в примере будет использоваться сумма ГГРа. Таблица из примера строилась в Августе 2023, соответственно если пользователь зарегистрировался в Июле 2023 - тут будет сумма его ГГРа только за Июль 2023 (один месяц жизни). Если Зарегистрировался в Июне 2023, то за Июнь 2023 и Июль 2023 (два месяца жизни) и так далее.

image-20260116-082154.png

Далее по матрице из таблицы 1 рассчитывается накопительная сумма ГГРа за указанное кол-во месяцев. Например, трафик Марта 2021 за 4 месяца наиграл ГГРа на сумму 15826,47377 + 24584,91228+ 6695,791113 + 2664,18347 = 49771,36 Евро.

image-20260115-143310.png

Имея накопительную сумму ГГРа далее рассчитываются значение того, на сколько накопительная сумма за текущее кол-во месяцев больше суммы за предыдущее кол-во месяцев. Например, для трафика Марта 2021 за 4 месяца это: 49771,36 / 47107,18 = 1,06. Для расчета финальных коэффициентов будут использоваться 6 самых свежих значений из каждой колонки месяца жизни (на рисунке ниже показано зелёными “окнами“). Если данных не хватает, можно брать больше 5 значений.

image-20260116-092445.png

После этого по 6 свежим значениям рассчитывается стандартное отклонение и медиана, это нужно для того, чтобы сформировать порог значений, которые будут участвовать в финальном расчете коэффициентов. Минимальный порог отображается в строке ”First” (Формула: Median - STDDEV), все когорты, у которых значения множителя из таблицы 3 ниже этого порота, не будут участвовать в дальнейших расчетах (в пределах месяца жизни). Максимальный порог отображается в строке ”Second” (Формула: Median + STDDEV), все когорты, у которых значения множителя из таблицы 3 выше этого порота, не будут участвовать в дальнейших расчетах (в пределах месяца жизни). В строку Current записываем сумму ГГРа из таблицы 2 (с накопительными суммами), исключая когорты, которые не прошли порог. В строку Previous записываем сумму ГГРа из таблицы 2 (с накопительными суммами) тех же когорт, что и для строки Current, но значения берём за предыдущее кол-во месяцев жизни. Делим Current / Previous и получаем Coef 2. В строке Coef 1 первое значение всегда единица, чтобы рассчитать Coef 1 для следующих месяцев, умножаем Coef 2 за текущий месяц жизни и Coef 1 за предыдущий месяц жизни. В следующем абзаце более подробно расписан расчет. В итоге получаются готовые коэффициенты для прогнозирования.

image-20260115-144846.png

Для примера рассчитаем коэффициенты второго месяца. Рассчитываем стандартное отклонение и медиану по множителям в окне с Января 2023 по Июнь 2023 из таблицы 3. Рассчитываем первый порог (строка First) отнимая STDDEV от Median: 1,76 - 1,9473 = -0,19. В окне нет значений ниже, поэтому двигаемся дальше. Рассчитываем второй порог (строка Second) добавляя STDDEV к Median: 1,76 + 1,9473 = 3,71. В окне у когорты Мая 2023 значение множителя (6,43) выше порога, то есть дальше мы майские значения игнорируем (игнорируем только для 2 месяца, если при расчетах для 3 месяца он будет подходить под требования, то можно его использовать). Чтобы рассчитать Current суммируем накопительные суммы из таблицы 2 за второй месяц с Января 2023 по Июнь 2023 без Мая 2023, получаем: 182534,91 + 223561,68 + 353732,06 + 331719,67 + 227465,68 = 1319014,008. Чтобы рассчитать Previous суммируем накопительные суммы за первый месяц из таблицы 2 с Января 2023 по Июнь 2023 без Мая 2023, получаем: 100276,74 + 138729,26 + 251855,93 + 195023,71 + 122211,20 = 808096,8347. Чтобы рассчитать Coef 2 делим Current на Previous: 1319014,008 / 808096,8347 = 1,63. В колонку 1 строки Coef 1 ставим единицу, так как там оно всегда. Далее множим Coef 1 из колонки 1 и Coef 2 из колонки 2 и получаем Coef 2 в колонке 2: 1 * 1,63 = 1,63. Подобным образом считаются и остальные коэффициенты.

image-20260116-095107.png

В итоге должен получится вот такие плавные графики по коэффициентам. Если появляются значения, которые сильно отклоняются - правим, можно вручную (или можно расширить окно). В расчётах прогнозов используем коэф 2.

image-20260115-145131.png

image-20260115-145302.png