malyj_gorgan (
malyj_gorgan) wrote2023-08-30 03:48 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Entry tags:
А от вам математико-статистична задачка, в якій я загубився
У вас є магазин з мільйоном (грубо кажучи, насправді, більше) найменувань товарів. Всіх найрізноманітніших видів. І ось ви взяли, і за кожним найменуванням порахували продажі протягом двох тридцятиденних періодів один за одним: X0 і X1. Розподіл кожного з іксів -- приблизнно power-law, p ~ x-α. І ото вирішив я побудувати гістограму того, що називається "lift" -- відносна зміна продаж від місяця до місяця:
(X1 - X0) / (X0 + ε)
Епсилон там для того, аби не було ділення на нуль. (Десь 20% кожного з іксів -- нулі, але пари, де нулями є і X0, і X1, в популяцію не входять). Гістограма, як ви розумієте, тягнеться від -1 до безмежної асимптоти. І ось що я спостерігаю, і що мені абсолютно незрозуміло, звідки таке береться:
Що це, блін, таке? Моє єстество протестує проти того, що це може бути якийсь бізнесовий ефект. Це щось числове, чиста арифметика. З корінням або в статистиці, або в програмуванні (тобто, як воно все в таблички записується) Але що?
Графіків не покажу, бо, то не можна, таємниця слідства, вотетовотвсьо.
UPDATE: Сам дотумкав. Ефект, насправді, бізнесовий, а я просто не подумав. Ці ікси -- місячні продажі. Розподіл продаж щомісяця має купу локальних максимумів в різних "круглих" числах: пропорційних 10, особливо 20, сотня, півтораста... Цього виявилося достатньо, щоби сумарний розподіл відносноі різниці проріс максимумами в особливо раціональних точках
UPDATE 2: Я тормоз. Круглі числа ні при чому, це банальний ефект постійної ціни на одиницю товару, тому для невеликих кількостей проданих юнітів що дельта, що Х0 в знаменнику, будуть пропорційними цілим числам. Дякую
ichthuss за відповідь.
(X1 - X0) / (X0 + ε)
Епсилон там для того, аби не було ділення на нуль. (Десь 20% кожного з іксів -- нулі, але пари, де нулями є і X0, і X1, в популяцію не входять). Гістограма, як ви розумієте, тягнеться від -1 до безмежної асимптоти. І ось що я спостерігаю, і що мені абсолютно незрозуміло, звідки таке береться:
- Гістограма очікувано має максимума в нулі, плюс, великий пік в мінус одиниці, це ясно
- Але, крім того, є дуже чітко проявлені максимуми в 1, 2, 3, 4, ...
- Більше того, менш чітко проявлені, але видимі максимуми в 0.5, 1.5, 2.5 ...
- То було з позитивного боку, а зліва від нуля там є конкретні піки такі на 1/2, 2/3, 3/4, 4/5...
Що це, блін, таке? Моє єстество протестує проти того, що це може бути якийсь бізнесовий ефект. Це щось числове, чиста арифметика. З корінням або в статистиці, або в програмуванні (тобто, як воно все в таблички записується) Але що?
Графіків не покажу, бо, то не можна, таємниця слідства, вотетовотвсьо.
UPDATE: Сам дотумкав. Ефект, насправді, бізнесовий, а я просто не подумав. Ці ікси -- місячні продажі. Розподіл продаж щомісяця має купу локальних максимумів в різних "круглих" числах: пропорційних 10, особливо 20, сотня, півтораста... Цього виявилося достатньо, щоби сумарний розподіл відносноі різниці проріс максимумами в особливо раціональних точках
UPDATE 2: Я тормоз. Круглі числа ні при чому, це банальний ефект постійної ціни на одиницю товару, тому для невеликих кількостей проданих юнітів що дельта, що Х0 в знаменнику, будуть пропорційними цілим числам. Дякую
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
no subject
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
А так звичайна людина може і 10 років купувати все те саме практично в такій самій кількості на місяць.
Подруге, не тільки ви рахуєте ці речі, а ще керівницьтво платить відділу маркетинга, за те щоб він заводив в магазин стабільну кількість клієнтів.
Тобто, магазину не влаштовує щоб клієнтів було дуже мало, але також не влаштовує, щоб було дуже багато, бо в першому випадку недовантаження основних засобів, а в другому доведеться переплачувати людям за переробіток.
- І вони намагаються маркетинговими засобами робити, щоб кожного дня приходив дуже стабільний потік з тих самих людей, щоб купували ровно стільки скільки заплановано.
Приклад маркетингового засобу - пей пер клік на гуглі - там є загальний бюджет, і відома ціна кліка (вони купуються на біржі), і можна встановлювати, скільки має бути кліків за день і що робити коли денний бюджет закінчиться (зазвичай встановлюють більше не купувати показів в цей день).
Якщо клік дуже точно таргетований (місто, район, гендер, час доби, ітд), то зазвичай є дуже чіткий зв"язок "стільки-то кліків - стільки-то купили".
А і ще, в малому бізнесі із цим часто бардак, і там постійно плачуть, що в них або клієнта нема або вони не знають як клієнта обслужити бо забагато реклами купили, а в великих бізнесах (мільйон найменувань товарів це звісно великий), ці речі дуже чітко налаштовують, що там і пусто не буває і черг нема.
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)