malyj_gorgan: (Default)
[personal profile] malyj_gorgan
У вас є магазин з мільйоном (грубо кажучи, насправді, більше) найменувань товарів. Всіх найрізноманітніших видів. І ось ви взяли, і за кожним найменуванням порахували продажі протягом двох тридцятиденних періодів один за одним: X0 і X1. Розподіл кожного з іксів -- приблизнно power-law, p ~ x-α. І ото вирішив я побудувати гістограму того, що називається "lift" -- відносна зміна продаж від місяця до місяця:
(X1 - X0) / (X0 + ε)
Епсилон там для того, аби не було ділення на нуль. (Десь 20% кожного з іксів -- нулі, але пари, де нулями є і X0, і X1, в популяцію не входять). Гістограма, як ви розумієте, тягнеться від -1 до безмежної асимптоти. І ось що я спостерігаю, і що мені абсолютно незрозуміло, звідки таке береться:

  1. Гістограма очікувано має максимума в нулі, плюс, великий пік в мінус одиниці, це ясно

  2. Але, крім того, є дуже чітко проявлені максимуми в 1, 2, 3, 4, ...

  3. Більше того, менш чітко проявлені, але видимі максимуми в 0.5, 1.5, 2.5 ...

  4. То було з позитивного боку, а зліва від нуля там є конкретні піки такі на 1/2, 2/3, 3/4, 4/5...


Що це, блін, таке? Моє єстество протестує проти того, що це може бути якийсь бізнесовий ефект. Це щось числове, чиста арифметика. З корінням або в статистиці, або в програмуванні (тобто, як воно все в таблички записується) Але що?
Графіків не покажу, бо, то не можна, таємниця слідства, вотетовотвсьо.

UPDATE: Сам дотумкав. Ефект, насправді, бізнесовий, а я просто не подумав. Ці ікси -- місячні продажі. Розподіл продаж щомісяця має купу локальних максимумів в різних "круглих" числах: пропорційних 10, особливо 20, сотня, півтораста... Цього виявилося достатньо, щоби сумарний розподіл відносноі різниці проріс максимумами в особливо раціональних точках

UPDATE 2: Я тормоз. Круглі числа ні при чому, це банальний ефект постійної ціни на одиницю товару, тому для невеликих кількостей проданих юнітів що дельта, що Х0 в знаменнику, будуть пропорційними цілим числам. Дякую [personal profile] ichthuss за відповідь.

Date: 2023-08-30 11:29 pm (UTC)
From: [personal profile] ichthuss
Якщо так багато нулів, то багато і малих чисел. А малі числа саме в такі раціональні числа і потраплятимуть. Скажімо, в діапазон [0.7499;0.7501] потраплять (7-4)/4, (14-8)/8 і т.д., а в діапазон [0.7497;0.7499] почнуть попадати зі знаменником ближче до 1000, тобто буде значно менше доданків, і кожен з них значно менший.

Date: 2023-08-31 12:20 am (UTC)
From: [personal profile] ichthuss
А, так об'єми не в штуках, а в баксах? Хоча, якщо ціна на товар однакова, то в баксах чи штуках - різниці не буде, ефект не зміниться. І якщо ціна просто дуже близька, то все одно попаде близько до того самого піку.

Date: 2023-08-31 10:57 am (UTC)
From: [personal profile] ichthuss
Цей ефект проявився би і без "круглих" цін. Тобто якщо якась фігня коштує 36.82, і в один місяць її продано 3 штуки, а в другий - 5 штук, то у вихлопі матимемо 2/5, хоч цифри продаж будуть дуже некруглі.

Date: 2023-08-30 11:38 pm (UTC)
From: [personal profile] zyxman
Відносна зміна продажів між місяцями, насправді досить мала в стабільному світі, якісь великі аномалії виникають лише коли якісь великі революції чи війни, чи стихія.

А так звичайна людина може і 10 років купувати все те саме практично в такій самій кількості на місяць.

Подруге, не тільки ви рахуєте ці речі, а ще керівницьтво платить відділу маркетинга, за те щоб він заводив в магазин стабільну кількість клієнтів.

Тобто, магазину не влаштовує щоб клієнтів було дуже мало, але також не влаштовує, щоб було дуже багато, бо в першому випадку недовантаження основних засобів, а в другому доведеться переплачувати людям за переробіток.

- І вони намагаються маркетинговими засобами робити, щоб кожного дня приходив дуже стабільний потік з тих самих людей, щоб купували ровно стільки скільки заплановано.

Приклад маркетингового засобу - пей пер клік на гуглі - там є загальний бюджет, і відома ціна кліка (вони купуються на біржі), і можна встановлювати, скільки має бути кліків за день і що робити коли денний бюджет закінчиться (зазвичай встановлюють більше не купувати показів в цей день).
Якщо клік дуже точно таргетований (місто, район, гендер, час доби, ітд), то зазвичай є дуже чіткий зв"язок "стільки-то кліків - стільки-то купили".

А і ще, в малому бізнесі із цим часто бардак, і там постійно плачуть, що в них або клієнта нема або вони не знають як клієнта обслужити бо забагато реклами купили, а в великих бізнесах (мільйон найменувань товарів це звісно великий), ці речі дуже чітко налаштовують, що там і пусто не буває і черг нема.

Date: 2023-08-31 12:35 am (UTC)
From: [personal profile] zyxman
Так агрегатор це як раз велика организація, хоча це не проста а складна система (вона складається з багатьох малих незалежних систем).

А в бізнесів що працюють через агрегатор, 100% PPC система, ще й тому що вони намагаються втрамбуватись в специфічну групу оподаткування, яка зазвичай обмежена за обсягами.

Принцип такий - вони так планують продажі, щоб за місяць не вийти за межі обмеження групи оподаткування, і при цьому щоб в один день продавати стабільну кількість (ну щоб не перевантажувати персонал).
І звісно, ж жаба душить щоб продати мало, тож розраховують так щоб майже точно вписатись в обсяг, а це в випадку невеликої інфляції, будуть практично сталі ціни і постійно одні і ті самі цифри продажів.

Якщо вас турбують чіткі цифри цін, то це відома річ, покупці люблять круглі цифри і магазини намагаються їм підіграти, тим що також ставлять круглі цифри в цінники.

Date: 2023-08-31 12:42 am (UTC)
From: [personal profile] zyxman
Ще буває, що взагалі в звітність пускають лише те що хочуть пустити, також щоб меньше платити податків, і щоб не змусили платити за загальною системою, бо на ній дуже багато роботи по обліку, в деяких випадках це справді складно організувати, в інших просто лінь вивчати бугалтерію і кожен продаж обліковувати.

Date: 2023-08-31 04:17 am (UTC)
From: [personal profile] zyxman
Ви не розумієте про що говорите.

Є така штука, воронка продажів. Там непрогнозована одна річ - кількість лідів на вході, все інше дуже чітко прораховується і дуже надійно повторюване.

- ППК використовується 99% бізнеса, саме тому що воно дуже класно дозволяє керувати лідами. Краник відчиняється і зачиняється рівно коли треба, і практично ідеально видає рівно стільки лідів і продажів скільки хочеться, і більшість людей намагаються його використати щоб зробити ідеально псевдовипадкові продажі, що типу випадково продажі розподіляються рівномірно, саме щоб в звітності виглядало все рівно.

Усі інші інструменти набагато меньш прогнозовані а ніхто не хоче за негарантоване платити, навіть коли воно коштує набагато дешевше.

Date: 2023-08-31 04:19 pm (UTC)
From: [personal profile] zyxman
> один продавець продає цього місяця більше, а другийй може продати лише невелику кількість одиниць, а третій - жодної

Так не може бути.

Алгоритм там має бути простий, але хитрий, бо він має бути добре масштабованим і добре передбачуваним.

А саме передбачуваність має бути в тому, щоб кожного місяця був запланований результат.

Подруге, система має відсипати справедливу кількість лідів, і в інтернеті дуже багато охочих піймати агрегатора на нерівному розподілі лідів і на цьому зробити бабло якимось чином.

Є дві речі, дуже принципові для країн що декларують капіталізм як свій шлях.
Поперше, в усіх мають бути рівні можливості, і це не обговорюється.
Подруге, є хакери, які намагаються знайти слабке місце в алгоритма розподілення, щоб якимось чином собі (чи комусь за гроші) зробити набагато більше лідів.

І от алгоритм розподілення має бути з одного боку простим, щоб він працював швидко і не потребував великих обчислювальних витрат а також щоб не потребувати гіпермегашвидких зв"язків (він розподілений в хмарі); а з іншого боку, в йому має бути кілька костилів, щоб враховувати загальносистемний розподіл, і щоб для завданої групи користувачів ЗА МІСЯЦЬ був гарантований відсоток від загальної кількості лідів.

Чому за місяць, бо якщо в малого бізнеса не буде місяць прибутку він може закритись, і керівницьтво агрегатора з кожи вистрибує щоб за місяць отримували приблизно цифру яку обіцяє маркетинг (+-50% може бути але не більше), і зазвичай костиль так працює, що скажімо раз на тиждень розраховується статистика (частіше складно зібрати дані з усіх серверів), і корегується видача, так щоб наступний тиждень збалансував небаланси попереднього.

Самі алгоритми беруться з геймдеву, там є фах геймдизайнера або близький левелдезігнер, в його всі характеристики персонажів і ігрових айтемів вводяться в таблицю в екселі і рахуються ймовірні варіанти кінця битви, так щоб вирівняти шанси для одного рівня гравців, бо інакше людям буде нецікаво грати.

Тобто алгоритм дуже простий, а балансується отими коефіцієнтами.

Іноді геймдиз лажає і якась комбінація стає абсолютно сильною, тоді найпросунутіші контори роблять компенсації постраждалим, роздаючі нібито випадкові подарунки (можуть просто кинути під ноги лутбокс, можуть запросити на якусь подію, типу десь типу випадково випаде багато руди і гравця туди запросять).

Але див вище, алгоритм не може бути складний, бо обчислювальні ресурси і CAP теорема, і в той же час має бути можливість підкрутити результат ЗА МІСЯЦЬ, ніхто не очікує що воно буде ідеально кожного дня рівні цифри видавати.

Date: 2023-08-31 10:55 pm (UTC)
From: [personal profile] zyxman
Я думаю, вам просто лінь думати, як це може працювати, бо ви звикли думати, як НЕ_МОЖЕ працювати. Це цілком нормально, лише не треба з цього робити фетиш, а бажано іноді спробувати знайти можливість.

Date: 2023-09-01 12:08 am (UTC)
From: [personal profile] zyxman
> Я дивлюся на реальні продажі реальних продавців і бачу, що і наскільки продалося

Та ви вже самі себе заплутали. Лише вчора говорили, що ви дивитесь в статистику ДО ТОГО як продавець щось побачив, отже продажу ще не було.
Це просто несолідно, якось визначиться, ви за розумних чи за красивих.

Факти механизмам не суперечать. Є штук 5 статистичних розподілень, на всі випадки життя, але графіки красиво виглядають лише коли вибірка досить велика і коли нема спотворень розподілення алгоритмом чи ще чимось.

Якщо ж принципово вибирається якась маленька вибірка, це довгий хвіст, там все що завгодно може бути.
І я вже навів приклади спотворюючих механізмів. Фактично, якщо використати якісь технології витягування даних з шумів, то ви побачите оті механізми збільшеними.

Date: 2023-09-01 12:50 pm (UTC)
From: [personal profile] zyxman
> ми знаємо про продаж раніше, ніж продавець, він звітність отримує від нас

Може ви й бугалтерію за його здаєте і податки сплачуєте?

> швидко, може, навіть, менше секунди, але за визначенням пізніше за нас

Якщо ви за його звітність в податкову подаєте, то я б погодився. То подаєте? Чи ви тільки з оцих цифр висновки робите?

Date: 2023-09-01 07:43 pm (UTC)
From: [personal profile] zyxman
> коли на мене несправедливо погано думають

З чого ви вирішили що хтось на вас погано думає?

Все що ви показали, абсолютно нормальна поведінка людини що боїться. Інше питання, що це норма для совка, аж так боятись, в світі такого нема, але ок.

І можете не виправдовуватись, маєте повне право просто сказати що не можете надати подробиць, цього абсолютно достатньо.

Profile

malyj_gorgan: (Default)
malyj_gorgan

June 2025

S M T W T F S
12 345 67
89 1011 121314
15161718192021
22232425262728
2930     

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 17th, 2025 07:51 pm
Powered by Dreamwidth Studios