malyj_gorgan: (Default)
malyj_gorgan ([personal profile] malyj_gorgan) wrote2023-08-30 03:48 pm

А от вам математико-статистична задачка, в якій я загубився

У вас є магазин з мільйоном (грубо кажучи, насправді, більше) найменувань товарів. Всіх найрізноманітніших видів. І ось ви взяли, і за кожним найменуванням порахували продажі протягом двох тридцятиденних періодів один за одним: X0 і X1. Розподіл кожного з іксів -- приблизнно power-law, p ~ x-α. І ото вирішив я побудувати гістограму того, що називається "lift" -- відносна зміна продаж від місяця до місяця:
(X1 - X0) / (X0 + ε)
Епсилон там для того, аби не було ділення на нуль. (Десь 20% кожного з іксів -- нулі, але пари, де нулями є і X0, і X1, в популяцію не входять). Гістограма, як ви розумієте, тягнеться від -1 до безмежної асимптоти. І ось що я спостерігаю, і що мені абсолютно незрозуміло, звідки таке береться:

  1. Гістограма очікувано має максимума в нулі, плюс, великий пік в мінус одиниці, це ясно

  2. Але, крім того, є дуже чітко проявлені максимуми в 1, 2, 3, 4, ...

  3. Більше того, менш чітко проявлені, але видимі максимуми в 0.5, 1.5, 2.5 ...

  4. То було з позитивного боку, а зліва від нуля там є конкретні піки такі на 1/2, 2/3, 3/4, 4/5...


Що це, блін, таке? Моє єстество протестує проти того, що це може бути якийсь бізнесовий ефект. Це щось числове, чиста арифметика. З корінням або в статистиці, або в програмуванні (тобто, як воно все в таблички записується) Але що?
Графіків не покажу, бо, то не можна, таємниця слідства, вотетовотвсьо.

UPDATE: Сам дотумкав. Ефект, насправді, бізнесовий, а я просто не подумав. Ці ікси -- місячні продажі. Розподіл продаж щомісяця має купу локальних максимумів в різних "круглих" числах: пропорційних 10, особливо 20, сотня, півтораста... Цього виявилося достатньо, щоби сумарний розподіл відносноі різниці проріс максимумами в особливо раціональних точках

UPDATE 2: Я тормоз. Круглі числа ні при чому, це банальний ефект постійної ціни на одиницю товару, тому для невеликих кількостей проданих юнітів що дельта, що Х0 в знаменнику, будуть пропорційними цілим числам. Дякую [personal profile] ichthuss за відповідь.

[personal profile] ichthuss 2023-08-30 11:29 pm (UTC)(link)
Якщо так багато нулів, то багато і малих чисел. А малі числа саме в такі раціональні числа і потраплятимуть. Скажімо, в діапазон [0.7499;0.7501] потраплять (7-4)/4, (14-8)/8 і т.д., а в діапазон [0.7497;0.7499] почнуть попадати зі знаменником ближче до 1000, тобто буде значно менше доданків, і кожен з них значно менший.

[personal profile] zyxman 2023-08-30 11:38 pm (UTC)(link)
Відносна зміна продажів між місяцями, насправді досить мала в стабільному світі, якісь великі аномалії виникають лише коли якісь великі революції чи війни, чи стихія.

А так звичайна людина може і 10 років купувати все те саме практично в такій самій кількості на місяць.

Подруге, не тільки ви рахуєте ці речі, а ще керівницьтво платить відділу маркетинга, за те щоб він заводив в магазин стабільну кількість клієнтів.

Тобто, магазину не влаштовує щоб клієнтів було дуже мало, але також не влаштовує, щоб було дуже багато, бо в першому випадку недовантаження основних засобів, а в другому доведеться переплачувати людям за переробіток.

- І вони намагаються маркетинговими засобами робити, щоб кожного дня приходив дуже стабільний потік з тих самих людей, щоб купували ровно стільки скільки заплановано.

Приклад маркетингового засобу - пей пер клік на гуглі - там є загальний бюджет, і відома ціна кліка (вони купуються на біржі), і можна встановлювати, скільки має бути кліків за день і що робити коли денний бюджет закінчиться (зазвичай встановлюють більше не купувати показів в цей день).
Якщо клік дуже точно таргетований (місто, район, гендер, час доби, ітд), то зазвичай є дуже чіткий зв"язок "стільки-то кліків - стільки-то купили".

А і ще, в малому бізнесі із цим часто бардак, і там постійно плачуть, що в них або клієнта нема або вони не знають як клієнта обслужити бо забагато реклами купили, а в великих бізнесах (мільйон найменувань товарів це звісно великий), ці речі дуже чітко налаштовують, що там і пусто не буває і черг нема.