malyj_gorgan: (Default)
[personal profile] malyj_gorgan
У вас є магазин з мільйоном (грубо кажучи, насправді, більше) найменувань товарів. Всіх найрізноманітніших видів. І ось ви взяли, і за кожним найменуванням порахували продажі протягом двох тридцятиденних періодів один за одним: X0 і X1. Розподіл кожного з іксів -- приблизнно power-law, p ~ x-α. І ото вирішив я побудувати гістограму того, що називається "lift" -- відносна зміна продаж від місяця до місяця:
(X1 - X0) / (X0 + ε)
Епсилон там для того, аби не було ділення на нуль. (Десь 20% кожного з іксів -- нулі, але пари, де нулями є і X0, і X1, в популяцію не входять). Гістограма, як ви розумієте, тягнеться від -1 до безмежної асимптоти. І ось що я спостерігаю, і що мені абсолютно незрозуміло, звідки таке береться:

  1. Гістограма очікувано має максимума в нулі, плюс, великий пік в мінус одиниці, це ясно

  2. Але, крім того, є дуже чітко проявлені максимуми в 1, 2, 3, 4, ...

  3. Більше того, менш чітко проявлені, але видимі максимуми в 0.5, 1.5, 2.5 ...

  4. То було з позитивного боку, а зліва від нуля там є конкретні піки такі на 1/2, 2/3, 3/4, 4/5...


Що це, блін, таке? Моє єстество протестує проти того, що це може бути якийсь бізнесовий ефект. Це щось числове, чиста арифметика. З корінням або в статистиці, або в програмуванні (тобто, як воно все в таблички записується) Але що?
Графіків не покажу, бо, то не можна, таємниця слідства, вотетовотвсьо.

UPDATE: Сам дотумкав. Ефект, насправді, бізнесовий, а я просто не подумав. Ці ікси -- місячні продажі. Розподіл продаж щомісяця має купу локальних максимумів в різних "круглих" числах: пропорційних 10, особливо 20, сотня, півтораста... Цього виявилося достатньо, щоби сумарний розподіл відносноі різниці проріс максимумами в особливо раціональних точках

UPDATE 2: Я тормоз. Круглі числа ні при чому, це банальний ефект постійної ціни на одиницю товару, тому для невеликих кількостей проданих юнітів що дельта, що Х0 в знаменнику, будуть пропорційними цілим числам. Дякую [personal profile] ichthuss за відповідь.

Date: 2023-08-31 04:17 am (UTC)
From: [personal profile] zyxman
Ви не розумієте про що говорите.

Є така штука, воронка продажів. Там непрогнозована одна річ - кількість лідів на вході, все інше дуже чітко прораховується і дуже надійно повторюване.

- ППК використовується 99% бізнеса, саме тому що воно дуже класно дозволяє керувати лідами. Краник відчиняється і зачиняється рівно коли треба, і практично ідеально видає рівно стільки лідів і продажів скільки хочеться, і більшість людей намагаються його використати щоб зробити ідеально псевдовипадкові продажі, що типу випадково продажі розподіляються рівномірно, саме щоб в звітності виглядало все рівно.

Усі інші інструменти набагато меньш прогнозовані а ніхто не хоче за негарантоване платити, навіть коли воно коштує набагато дешевше.

Date: 2023-08-31 04:19 pm (UTC)
From: [personal profile] zyxman
> один продавець продає цього місяця більше, а другийй може продати лише невелику кількість одиниць, а третій - жодної

Так не може бути.

Алгоритм там має бути простий, але хитрий, бо він має бути добре масштабованим і добре передбачуваним.

А саме передбачуваність має бути в тому, щоб кожного місяця був запланований результат.

Подруге, система має відсипати справедливу кількість лідів, і в інтернеті дуже багато охочих піймати агрегатора на нерівному розподілі лідів і на цьому зробити бабло якимось чином.

Є дві речі, дуже принципові для країн що декларують капіталізм як свій шлях.
Поперше, в усіх мають бути рівні можливості, і це не обговорюється.
Подруге, є хакери, які намагаються знайти слабке місце в алгоритма розподілення, щоб якимось чином собі (чи комусь за гроші) зробити набагато більше лідів.

І от алгоритм розподілення має бути з одного боку простим, щоб він працював швидко і не потребував великих обчислювальних витрат а також щоб не потребувати гіпермегашвидких зв"язків (він розподілений в хмарі); а з іншого боку, в йому має бути кілька костилів, щоб враховувати загальносистемний розподіл, і щоб для завданої групи користувачів ЗА МІСЯЦЬ був гарантований відсоток від загальної кількості лідів.

Чому за місяць, бо якщо в малого бізнеса не буде місяць прибутку він може закритись, і керівницьтво агрегатора з кожи вистрибує щоб за місяць отримували приблизно цифру яку обіцяє маркетинг (+-50% може бути але не більше), і зазвичай костиль так працює, що скажімо раз на тиждень розраховується статистика (частіше складно зібрати дані з усіх серверів), і корегується видача, так щоб наступний тиждень збалансував небаланси попереднього.

Самі алгоритми беруться з геймдеву, там є фах геймдизайнера або близький левелдезігнер, в його всі характеристики персонажів і ігрових айтемів вводяться в таблицю в екселі і рахуються ймовірні варіанти кінця битви, так щоб вирівняти шанси для одного рівня гравців, бо інакше людям буде нецікаво грати.

Тобто алгоритм дуже простий, а балансується отими коефіцієнтами.

Іноді геймдиз лажає і якась комбінація стає абсолютно сильною, тоді найпросунутіші контори роблять компенсації постраждалим, роздаючі нібито випадкові подарунки (можуть просто кинути під ноги лутбокс, можуть запросити на якусь подію, типу десь типу випадково випаде багато руди і гравця туди запросять).

Але див вище, алгоритм не може бути складний, бо обчислювальні ресурси і CAP теорема, і в той же час має бути можливість підкрутити результат ЗА МІСЯЦЬ, ніхто не очікує що воно буде ідеально кожного дня рівні цифри видавати.

Date: 2023-08-31 10:55 pm (UTC)
From: [personal profile] zyxman
Я думаю, вам просто лінь думати, як це може працювати, бо ви звикли думати, як НЕ_МОЖЕ працювати. Це цілком нормально, лише не треба з цього робити фетиш, а бажано іноді спробувати знайти можливість.

Date: 2023-09-01 12:08 am (UTC)
From: [personal profile] zyxman
> Я дивлюся на реальні продажі реальних продавців і бачу, що і наскільки продалося

Та ви вже самі себе заплутали. Лише вчора говорили, що ви дивитесь в статистику ДО ТОГО як продавець щось побачив, отже продажу ще не було.
Це просто несолідно, якось визначиться, ви за розумних чи за красивих.

Факти механизмам не суперечать. Є штук 5 статистичних розподілень, на всі випадки життя, але графіки красиво виглядають лише коли вибірка досить велика і коли нема спотворень розподілення алгоритмом чи ще чимось.

Якщо ж принципово вибирається якась маленька вибірка, це довгий хвіст, там все що завгодно може бути.
І я вже навів приклади спотворюючих механізмів. Фактично, якщо використати якісь технології витягування даних з шумів, то ви побачите оті механізми збільшеними.

Date: 2023-09-01 12:50 pm (UTC)
From: [personal profile] zyxman
> ми знаємо про продаж раніше, ніж продавець, він звітність отримує від нас

Може ви й бугалтерію за його здаєте і податки сплачуєте?

> швидко, може, навіть, менше секунди, але за визначенням пізніше за нас

Якщо ви за його звітність в податкову подаєте, то я б погодився. То подаєте? Чи ви тільки з оцих цифр висновки робите?

Date: 2023-09-01 07:43 pm (UTC)
From: [personal profile] zyxman
> коли на мене несправедливо погано думають

З чого ви вирішили що хтось на вас погано думає?

Все що ви показали, абсолютно нормальна поведінка людини що боїться. Інше питання, що це норма для совка, аж так боятись, в світі такого нема, але ок.

І можете не виправдовуватись, маєте повне право просто сказати що не можете надати подробиць, цього абсолютно достатньо.

Profile

malyj_gorgan: (Default)
malyj_gorgan

May 2025

S M T W T F S
    123
456 7 8 910
1112 13 1415 1617
18192021222324
25262728293031

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 21st, 2025 05:34 am
Powered by Dreamwidth Studios