malyj_gorgan | Кредитний скоринг і інший профайлинг

Переклад оцього.

ПОпулярний клас метрик, які дуже часто місінтерпретують -- різні типи скорингу (не плутати з рейтингом). Найпопулярніші -- кредитний, довіри, автоматизації, які означають, відповідно, імовірність, що особа віддасть певну позику, що це чесний юзер, а не шахрай, що це бот/скрипт, а не жива людина. Найчастіше ці цифри рахують як оцінку імовірності в класифікаторі машинного навчання, який тренують на передбаченні відомих ярликів зі змінних, що описують середовище і попередню історію юзера.

Хибність інтерпретації, яка змусила мене додати теґ ДІДАМ, -- наслідок тенденції ставитися до статистичних оцінок як до особистих параметрів. Люди не вміють в імовірності (доказ: азартні ігри), більшість з нас, почувши "кредитний скоринг Івана 0.6, а Петра 0.9", сприймає це як "Петро є в півтора рази (9/6) більш фінансово відповідальний, ніж Іван"

Але це бздура!

Найкраща ілюстрація -- скоринг автоматизації. Юзер не може бути ботом на 90% чи 60%, ти або людина або ні; людина з автоматизаційною оцінкою 0.9 на 100% більше людина, ніж бот з оцінкою 0.6. Аналогічно з фінансами: позика, віддана кредитором зі скорингом 600 -- це на 100% більше, ніж іпотека, не виплачена кимось з прекрасним високим скорингом 900.

Найочевидніша і вірна паралель тут -- профайлинг. Так, ставитися до когось виходячи лише з їх скорингу і є старим добрим профайлингом. І, як і з профайлингом, треба знати, коли і як його застосовувати. Оголосити когось поганим чи хорошим лише через оцінку імовірності -- неправильно. Планувати бізнес або інші акції, де треба думати про дивіденди і баланс витрат-прибуткі -- правильна і єдино можлива стратегія. Так просто.

Який висновок? Не переставати рахувати скоринг, але знати, як ними користуватися. Не відкидати профайлинг, але знати, де і коли його застосовувати.

Flat | Top-Level Comments Only | Expand All

From:

mprotsenko

Оголосити когось поганим чи хорошим лише через оцінку імовірності -- неправильно.

Оголошення когось поганим/хорошим - це не найбільша проблема. Завжди можна заткнутися і не оголошувати.

Проблема - це поводження з людиною як "хорошою"/"поганою" на базі профайлінга, а не собсна чеснот і вад конкретної людини.

Приклад: розмовляв не так давно з HR-кою української айті-компанії. Каже: "ми ветеранів не наймаємо, навіть резюме не розглядаємо, бо є підвищена ймовірність того, що вони поплавлені, з ПТСР-ом, а нам проблеми не потрібні". (При тому і компанія, і конкретна працівниця - не вата, люди цілком патріотичні, волонтерять, донатять, оцецевсе.)

Але якщо прибрати патріотичне обурення в сторону - то я не розумію, чим цей профайлінг краще аналогічного профайлінгу по кольору шкіри, гендеру, орієнтації тощо. Тим більш, що концентрація ПТСР серед ветеранів дійсно підвищена, а без публічних оголошень - яких нема! - профайлінг довести практично неможливо. І з точки зору бізнесу та прибутків-витрат-дивідендів - така стратегія не є неефективною. (Тим більш в умовах підвищеного безробіття, коли ціна помилки дуже мала.)

Але якщо що - я проти такого профайлінгу, а інший, хороший та якісний профайлінг - існує переважно в рожевих мріях "як зробити ідеально, якщо замість живих людей в нас будуть чесні і безпристрасні янголи". Ну, може, пара виключень є, в галузях, де байас визнається і офіційно контролюється - типу як в трансплантології.

Edited Date: 2025-08-04 09:53 pm (UTC)

From:

malyj_gorgan

> Проблема - це поводження з людиною як "хорошою"/"поганою" на базі профайлінга,
> а не собсна чеснот і вад конкретної людини.
Ну так я теж про це саме, просто загальніше сформулював. І, так, це той самий профайлинг, будь він за расою, статтю, статусом ветерана чи ще чимось. При цьому, хоч індивідуально він має очевидні проблеми, але коли мова іде про роботу з популяціями, він майже завжди як мінімум доречний, якщо не необхідний, бо -- cost-benefit. Принципово не допускати на роботу ветерана або не пускати в магазин чорношкірого в чорно-оранжевій худі, бо один імовірно, має PTSD, a другий, імовірно, злодій -- це індивідуальний профайлинг. Не маркетувати роботу в ветеранській спільноті або не будувати магазин в бідному чорному районі, де керують gangs -- нормальне рішення, хоча теж може сприйматися як профайлинг, food-desert-системний расизм і т. п. Звичайно, треба бути обережним, бувають спірні моменти, коли ще ок, а коли вже ні, але якщо не узагальнювати, що це зажди погано, а розуміти, коли ок, коли ні, і чому, тоді можна якогось прогресу і досягнути.

From:

mprotsenko

бо -- cost-benefit

Ці міркування часто (практично завжди) conviniently забувають про cost для суспільства. Приватизація доходів, соціалізація витрат - капіталізм він такий капіталізм. Чомусь в США панує думка, що бізнес і прибутки - це найвища цінність, і бізнес може існувати вільним від суспільства, і за його, суспільства, рахунок. Але такий тренд, хоч і приносить прибуток тут і зараз, але в довгостроковій перспективі шкодить усім. Класична tragedy of commons.

Тому, щоб хоча б наближатися до якогось прогресу - треба казати, що профайлінг є злом, який зробить погано людям, які на те погано не заслужили, тупо тому, що scores неідеальні. Тоді можна буде оцінити наслідки (і чесні costs!) того зла, і зробити нормальний cost-benefit analysis, а не так, що "спочатку ми їмо твоє, потім кожен своє".

Окрема проблема - в тому, що ззовні неможливо сказати, чи це індивідуальний профайлінг ("принципово не беремо на роботу ветеранів"), чи ні ("так склалося, що ми не рекламуємо ці позиції серед ветеранів і тому нікого не наймаємо"). По-перше, профайлер може тупо промовчати чи навіть збрехати. По-друге, часто люди займаються раціоналізацією, підганяють причини під вже прийняте рішення. Тому єдине, що ми можемо оцінити зльоту - це факт найму певного відсотка ветеранів по індустрії.

А вже по результату цих замірів вже можемо побачити і порахувати, що дискримінація ветеранів веде до безробіття, алкоголізму, злочинності і в результаті коштує суспільству більше, ніж найм тих ветеранів - і зробити висновок про те, що з таким профайлінгом треба боротися банально з точки зору cost-benefit для всього суспільства. (Звісно, "ветерани" можна замінити на будь-яку іншу групу.)

Edited Date: 2025-08-05 12:14 am (UTC)

From:

malyj_gorgan

> ... профайлінг є злом, ...
Я боюся, у нас може бути легка термінологічна нестиковка. Я, на всякий випадок, уточню, що те, що я називаю допустимим профайлингом, що описав коментом вище -- він може не вписуватися в стандартне визначення, але методологічно він саме цим і є. І називати його злом по умовчанню -- неправильно і шкідливо, хіба що ти маєш на увазі виключно індивідуальний підхід, а не груповий.
Бо з груповим підходом все ок, хоча методологічно всякий груповий фільтр, абсолютний або навіть відносний, -- це все той самий профайлинг. Не відкривати магазин Сейфвей там, де нема достатньо платоспроможних покупців, можна вважати профайлингом, але це правильне бізнес-рішення, незалежно від того, чи покупців нема, бо це острів з дюжиною приватних маєтків, власники яких замовляють готове з мішленівського ресторану за 100 км і доставкою гелікоптерами, чи тому, що це бідне бандитське містечко, де в магазині ніхто не заплатить, бо у кожного або нема грошей, або нема совісті, зате є пістолет. Звичайно, з точки зору мешканців обох містечок, вони знаходяться в food desert, їм важко, але і керівництво Albertsons Safeway Inc можна зрозуміти.

> ... які на те погано не заслужили, тупо тому, що scores неідеальні. ...
Що значить -- неідеальні? Неточні? Я впевнений, що в наші часи більшість scores дуже точні.

> ... з таким профайлінгом треба боротися банально
> з точки зору cost-benefit для всього суспільства.
З купою всього можна і треба боротися для всього суспільства, одне погано -- чим глобальніший cost-benefit аналіз ти робиш, тим менш точний буде механізм локальної користі. Крайній варіант оптимуму вже оголошували, це я про "от каждаво па спасобностям, каждаму па патрєбностям". Інша крайність, чисте тваринне лібертаріанство -- теж ніфіга не працює. Оптимум шукаємо, хто як, хто де. Я, скажімо, переконаний, що статичного глобального оптимуму для людства точно нема, а з локальними все непросто.

Edited Date: 2025-08-05 01:19 am (UTC)

From:

mprotsenko

І називати його злом по умовчанню -- неправильно і шкідливо

Навпаки, ховати голову в пісок, і робити вигляд, що груповий профайлінг не приносить зла, не робить погано людям, які на то не заслуговують - не можна.

Ти тут казав про локальну користь. Так ось, в простому прикладі з наймом ветеранів - є мінімум дві різні типи локальної користі. (1) Користь для ветерана з потрібними навичками, який находить, або не находить роботу. (2) Користь для працедавця, який находить або не находить собі кваліфікованого працівника.

Так ось, питання - чому друга користь важливіша за першу? Це не просте питання, в ньому треба шукати баланс, але в твоїх прикладах імплікується те, що перша локальна користь взагалі неважлива, і що усі benefits, які ми враховуємо - це benefits для роботодавця, а не працівника.

Бачиш проблему?

Що значить -- неідеальні? Неточні? Я впевнений, що в наші часи більшість scores дуже точні.

Навіть якщо якісь scores помиляються в 5% випадків - в суспільстві з 300 млн людей це 15 мільйонів людей, яких профайлінг скривдив, поступив з ними несправедливо, за рахунок яких система зробила іншім добре. І добре, якщо це помилка, яку можна виправити, чи яка не дуже суттєво впливає на життя. Але буває, що і ні, впливає, і ще як впливає.

І це - зло. Це може бути злом, якому не можна запобігти. Це може бути меншим злом з усіх можливих альтернатив. Але це зло. Називати його добром (чи "ок") - не треба. Бо для пошуку оптимуму треба сказати про це зло, порахувати це зло і мінімізувати це зло - інакше ми перетворюємося на махрових лібертаріанців, якім прибуток тут і зараз важливіше за все, а далі хоч потоп.

І це ми тільки про scores кажемо - а інші класифікатори (які, в принципі, можна перетворити в дискретні scores) аж ніяк не є точними. Яка кореляція між наявністю соціально небезпечного ПТСР і фактом ветеранства? (Про колір шкіри, гендер чи національність не будемо навіть.) Ото ж і воно.

Вишенькою на торті - нагадаю, що збоку груповий вс індивідуальний профайлінг розрізнити в купі випадків неможливо - бо профайлери брешуть, або раціоналізують заздалегідь прийняте рішення. (тобто все одно брешуть, але вже самим собі).

Edited Date: 2025-08-05 03:20 am (UTC)

From:

malyj_gorgan

> ... груповий профайлінг не приносить зла ...
Груповий профайлинг, за визначенням, когось образить, як і всяка інша дія, яка зачіпає групу людей. Але то теоретична абстракція, а всі твої приклади -- про щось інше.

> ... в простому прикладі з наймом ветеранів є мінімум дві різні типи локальної користі ...
Приклад групового профайлингу з наймом ветеранів полягає не в тому наймати чи не наймати конкретного ветерана, а як діяти по відношенню до групи ветеранів в цілому. Наприклад, чи потратити $A на людину в спільноті, де відсоток ветеранів В, якщо прибуток від одного вдалого найму $C, шанс, що ветеран підійде на позицію D, шанс, що на позицію підійде не-ветеран E. І рішення це для кожної компанії однозначне: маркетувати лише якщо B < (А/C-D) / (E-D). Ну, в найпримітивнішому варіанті, з додатковими усередненнями і допущеннями. На фоні цього можна займатися державною або громадською підтримкою або власною підтримкою, спонсоруючи $А або поправляючи C для ветеранів. І це буде правильно, бо не працевлаштовувати ветеранів і аморально, і невигідно для суспільства. Тим не менше, формула залишиться, і для якихось комбінацій спільнот і робіт меркетувати не буде сенсу. І де тут зло?
Більше того, враховуючи, що спонсорувати це діло коштує ресурсів, вигідно це робити не всюди, а де буде найбільший cost-benefit, і знову профайлинг...

> усі benefits, які ми враховуємо - це benefits для роботодавця
Усі бенефітс, які повинен враховувати у своїх діях роботодавець -- так, це бенефіти для нього. АЛе незрозуміло, чому ти заперечуєш, що користь другого порядку для робітників не є в інтересах роботодавця. Є і матеріальна користь, і моральна. Навіть для роботодавця самого по собі, а в іншому місці і про інше ти правильно написав, що на це може впливати ще і оподаткування, і регуляції, і т. д. І жоден з цих впливів не відміняє того, що кожен в цій системі займається груповим профайлингом, соваються лише коефіцієнти важливості різних факторів.

> ... якщо якісь scores помиляються в 5% випадків ...
У мене підозра, що ти саме так abuse'єш скоринг, як я застерігаю не робити. Вірніше, що ти за умовчанням сприймаєш, що всякий скоринг можна лише абʼюзати.
От що значить "якісь scores помиляються в 5% випадків"? Скор (блін, пора українське слово нормальне придумати, мене уже коробить від англіцизму), має сенс лише для розподілу. І _в середньому_ він, якщо порахований хоч трохи неідіотом, завжди вірний, а індивідуально він не має смислу.

> 15 мільйонів людей, яких профайлінг скривдив, поступив з ними несправедливо
Їх скривдив не скоринг сам по собі, а невірне його застосування, проти якого я і застерігаю. А от незастосування скорингу би скривдило всіх. Тому що якщо не дискримінувати бажаючих отримати позику за хоч якоюсь моделлю правдоподібності погашення цеї позики, то банк прогорить через кілька місяців, і позики не отримає більше ніхто. Якщо не дискримінувати юзерів онлайн банку за скорингом довіри, то завтра зареєструється стільки шахраїв, що гроші розкрадуть у всіх.
Власне, останнє -- реальний приклад з моєї власної карʼєри, коли відмова від профайлингу зашкодила всім, а користі нікому не принесла. (Тут опущена купа деталей, зокрема, про те, що робити, коли даних не вистачає і про cost-accuracy дихотомію процесу скорингу.)

> інші класифікатори ... аж ніяк не є точними
Нема жодного точного класифікатора. ВОни всі імовірнісні. Про це і допис. Вірніше, про те, що якщо трактувати імовірнісну оцінку, як особистий параметр людини, то це погано.

From:

mprotsenko

Усі бенефітс, які повинен враховувати у своїх діях роботодавець -- так, це бенефіти для нього. АЛе незрозуміло, чому ти заперечуєш, що користь другого порядку для робітників не є в інтересах роботодавця.

Хе, це цікаве питання. Теоретично - користь навіть першого порядку для робітників є в інтересах роботодавця, бо роботодавці - це частина суспільства. А на практиці - "ми ветеранів не наймаєм, луганчанам не здаємо", і теде, і тепе... Люди, сцк, не раціональні - ти в цьому можеш переконатися, просто подивившись за вікно.

Їх скривдив не скоринг сам по собі, а невірне його застосування

А ось тут я принципово не погоджусь. Навіть в найкращих моделях є частина помилкових відповідей, коли модель застосується 100% вірно - але дає неправильну відповідь, бо як ти правильно кажеш - модель ймовірнісна. І ці помилки - це зло, з яким треба боротися. Перемогти його 100% неможливо, але якщо його не називати тим, чим воно є, і не намагатися асимптотично наблизитися до його відсутності, то буде фігня.

Головна різниця між профайлінгом типу "МЛ, яка оцінує ризики, і не видає позику" та "ветеранів не наймаємо" - false positive rate. Але ніякого "невірного застосування профайлінгу" в обох випадках нема - він застосовується "по інструкції". І обидва випадки так чи інакше перетворюють імовірнісну оцінку на особистий параметр ("тобі не можна довіряти позику"/"тебе не можна наймати").

І так, ти правий, перший тип профайлінгу може бути мінімальним злом, бо його відсутність принесе більше проблем.

Але про це зло треба говорити, і ці проблеми треба вимірювати на рівні популяції. Бо багато типу профайлінгу і навіть скорінгу - не є "в середньому точними", часто і густо їх точність навіть тупо не вимірюється. Яскравий приклад скорінгу з сумнівною ефективністю - credit score. Для того, щоб прикинути його ефективність - треба як мінімум поміряти ефект без нього, зробити контрольну групу, що ніхто не робить.

Більш того, очевидно, що кількість помилок (в обидві боки - від subprime mortgage crysis до системних недооцінок платежеспроможності людей, які справедливо не довіряють кредитним карткам), які робить цей скорінг - занадто велика, і що на цій планеті існують більш ефективні варіанти цього скорінгу, які приносять менше зла.

І про це треба говорити, і щось з цим робити, а не сліпо довіряти бізнесу з його профайлінгом і скорінгом, який часто і густо помиляється і закриває свої помилки за рахунок суспільства (як в випадку з вишепроцитованим subprime mortgage crysis).

(Про ресурси та ветеранів окремим коментарем напишу)

From:

malyj_gorgan

> Теоретично - користь навіть першого порядку для робітників є в інтересах роботодавця ...
Питання визначень. Для мене користь другого порядку -- все, що не прямий вклад в бізнес конкретного працівника, а бенефіти від того, що ця людина працевлаштована взагалі, а не забута чи бездомна під наркотою на тротуарі. Словом, те, про що ти в паралельному коменті сказав, що я ігнорую. Ні, звичайно, не ігнорую, може, просто не розписав в деталях одразу; тепер -- розписав.

> Навіть в найкращих моделях є частина помилкових відповідей, коли модель
> застосується 100% вірно - але дає неправильну відповідь, бо як ти правильно кажеш -
> модель ймовірнісна.

У нас явна термінологічна несумісність. False positives/negatives -- це не помилка scoring'a, це помилка бінарного класифікатора. І мій пост якраз про те, що індивідуальна класифікація тільки на базі імовірнісних оцінок -- це неправильно.

> і що на цій планеті існують більш ефективні варіанти цього скорінгу, які приносять менше зла.
Точно, термінологічна несумісність. Читай попередній абзац. Зло і інші менш морально забарвлені хиби стаються, коли хтось починають трактувати імовірнісну оцінку як особисту характеристику і відповідно застосовувати їх при оцінці індивідуальних обʼєктів.

Словом, не розумію: ти або робиш ту саму помилку, проти якої я застерігаю, або повторюєш ту саму критику тих, хто так помиляється, лише іншими словами. Якщо друге, то у тебе зміщений термінологічний приціл, скоринг тут не винен :)

From:

mprotsenko

Для мене користь другого порядку -- все, що не прямий вклад в бізнес конкретного працівника, а бенефіти від того, що ця людина працевлаштована взагалі

Ось це як раз принципова лібертаріанська помилка - лібертаріанці не рахують пряму користь для працівників, хоча для них (і для суспільства) це користь першого порядку, і незрозуміло, чому ця користь менш важлива, ніж користь для бізнесу.

І мій пост якраз про те, що індивідуальна класифікація тільки на базі імовірнісних оцінок -- це неправильно.

Тобто ти проти того, щоб блокувати транзакції виключно на основі рішення МЛ-моделей і приймати рішення про видачу позик виключно на основі credit score?

(Бо, пардон, це вже індивідуальна класифікація на основі ймовірнісних оцінок, як не крути!) Якщо так, то я приймаю твій аргумент, і погоджуюся з ним. Я ж правильно тебе зрозумів, чи ще є десь помилки?

Кредитний скоринг і інший профайлинг

Page Summary

Active Entries

Style Credit

Expand Cut Tags