Кредитний скоринг і інший профайлинг
Aug. 4th, 2025 12:33 pmПереклад оцього.
ПОпулярний клас метрик, які дуже часто місінтерпретують -- різні типи скорингу (не плутати з рейтингом). Найпопулярніші -- кредитний, довіри, автоматизації, які означають, відповідно, імовірність, що особа віддасть певну позику, що це чесний юзер, а не шахрай, що це бот/скрипт, а не жива людина. Найчастіше ці цифри рахують як оцінку імовірності в класифікаторі машинного навчання, який тренують на передбаченні відомих ярликів зі змінних, що описують середовище і попередню історію юзера.
Хибність інтерпретації, яка змусила мене додати теґ ДІДАМ, -- наслідок тенденції ставитися до статистичних оцінок як до особистих параметрів. Люди не вміють в імовірності (доказ: азартні ігри), більшість з нас, почувши "кредитний скоринг Івана 0.6, а Петра 0.9", сприймає це як "Петро є в півтора рази (9/6) більш фінансово відповідальний, ніж Іван"
Але це бздура!
Найкраща ілюстрація -- скоринг автоматизації. Юзер не може бути ботом на 90% чи 60%, ти або людина або ні; людина з автоматизаційною оцінкою 0.9 на 100% більше людина, ніж бот з оцінкою 0.6. Аналогічно з фінансами: позика, віддана кредитором зі скорингом 600 -- це на 100% більше, ніж іпотека, не виплачена кимось з прекрасним високим скорингом 900.
Найочевидніша і вірна паралель тут -- профайлинг. Так, ставитися до когось виходячи лише з їх скорингу і є старим добрим профайлингом. І, як і з профайлингом, треба знати, коли і як його застосовувати. Оголосити когось поганим чи хорошим лише через оцінку імовірності -- неправильно. Планувати бізнес або інші акції, де треба думати про дивіденди і баланс витрат-прибуткі -- правильна і єдино можлива стратегія. Так просто.
Який висновок? Не переставати рахувати скоринг, але знати, як ними користуватися. Не відкидати профайлинг, але знати, де і коли його застосовувати.
ПОпулярний клас метрик, які дуже часто місінтерпретують -- різні типи скорингу (не плутати з рейтингом). Найпопулярніші -- кредитний, довіри, автоматизації, які означають, відповідно, імовірність, що особа віддасть певну позику, що це чесний юзер, а не шахрай, що це бот/скрипт, а не жива людина. Найчастіше ці цифри рахують як оцінку імовірності в класифікаторі машинного навчання, який тренують на передбаченні відомих ярликів зі змінних, що описують середовище і попередню історію юзера.
Хибність інтерпретації, яка змусила мене додати теґ ДІДАМ, -- наслідок тенденції ставитися до статистичних оцінок як до особистих параметрів. Люди не вміють в імовірності (доказ: азартні ігри), більшість з нас, почувши "кредитний скоринг Івана 0.6, а Петра 0.9", сприймає це як "Петро є в півтора рази (9/6) більш фінансово відповідальний, ніж Іван"
Але це бздура!
Найкраща ілюстрація -- скоринг автоматизації. Юзер не може бути ботом на 90% чи 60%, ти або людина або ні; людина з автоматизаційною оцінкою 0.9 на 100% більше людина, ніж бот з оцінкою 0.6. Аналогічно з фінансами: позика, віддана кредитором зі скорингом 600 -- це на 100% більше, ніж іпотека, не виплачена кимось з прекрасним високим скорингом 900.
Найочевидніша і вірна паралель тут -- профайлинг. Так, ставитися до когось виходячи лише з їх скорингу і є старим добрим профайлингом. І, як і з профайлингом, треба знати, коли і як його застосовувати. Оголосити когось поганим чи хорошим лише через оцінку імовірності -- неправильно. Планувати бізнес або інші акції, де треба думати про дивіденди і баланс витрат-прибуткі -- правильна і єдино можлива стратегія. Так просто.
Який висновок? Не переставати рахувати скоринг, але знати, як ними користуватися. Не відкидати профайлинг, але знати, де і коли його застосовувати.
no subject
Date: 2025-08-04 09:22 pm (UTC)Оголошення когось поганим/хорошим - це не найбільша проблема. Завжди можна заткнутися і не оголошувати.
Проблема - це поводження з людиною як "хорошою"/"поганою" на базі профайлінга, а не собсна чеснот і вад конкретної людини.
Приклад: розмовляв не так давно з HR-кою української айті-компанії. Каже: "ми ветеранів не наймаємо, навіть резюме не розглядаємо, бо є підвищена ймовірність того, що вони поплавлені, з ПТСР-ом, а нам проблеми не потрібні". (При тому і компанія, і конкретна працівниця - не вата, люди цілком патріотичні, волонтерять, донатять, оцецевсе.)
Але якщо прибрати патріотичне обурення в сторону - то я не розумію, чим цей профайлінг краще аналогічного профайлінгу по кольору шкіри, гендеру, орієнтації тощо. Тим більш, що концентрація ПТСР серед ветеранів дійсно підвищена, а без публічних оголошень - яких нема! - профайлінг довести практично неможливо. І з точки зору бізнесу та прибутків-витрат-дивідендів - така стратегія не є неефективною. (Тим більш в умовах підвищеного безробіття, коли ціна помилки дуже мала.)
no subject
Date: 2025-08-04 10:15 pm (UTC)> а не собсна чеснот і вад конкретної людини.
Ну так я теж про це саме, просто загальніше сформулював. І, так, це той самий профайлинг, будь він за расою, статтю, статусом ветерана чи ще чимось. При цьому, хоч індивідуально він має очевидні проблеми, але коли мова іде про роботу з популяціями, він майже завжди як мінімум доречний, якщо не необхідний, бо -- cost-benefit. Принципово не допускати на роботу ветерана або не пускати в магазин чорношкірого в чорно-оранжевій худі, бо один імовірно, має PTSD, a другий, імовірно, злодій -- це індивідуальний профайлинг. Не маркетувати роботу в ветеранській спільноті або не будувати магазин в бідному чорному районі, де керують gangs -- нормальне рішення, хоча теж може сприйматися як профайлинг, food-desert-системний расизм і т. п. Звичайно, треба бути обережним, бувають спірні моменти, коли ще ок, а коли вже ні, але якщо не узагальнювати, що це зажди погано, а розуміти, коли ок, коли ні, і чому, тоді можна якогось прогресу і досягнути.
no subject
Date: 2025-08-05 12:10 am (UTC)Ці міркування часто (практично завжди) conviniently забувають про cost для суспільства. Приватизація доходів, соціалізація витрат - капіталізм він такий капіталізм. Чомусь в США панує думка, що бізнес і прибутки - це найвища цінність, і бізнес може існувати вільним від суспільства, і за його, суспільства, рахунок. Але такий тренд, хоч і приносить прибуток тут і зараз, але в довгостроковій перспективі шкодить усім. Класична tragedy of commons.
Тому, щоб хоча б наближатися до якогось прогресу - треба казати, що профайлінг є злом, який зробить погано людям, які на те погано не заслужили, тупо тому, що scores неідеальні. Тоді можна буде оцінити наслідки (і чесні costs!) того зла, і зробити нормальний cost-benefit analysis, а не так, що "спочатку ми їмо твоє, потім кожен своє".
no subject
Date: 2025-08-05 12:52 am (UTC)Я боюся, у нас може бути легка термінологічна нестиковка. Я, на всякий випадок, уточню, що те, що я називаю допустимим профайлингом, що описав коментом вище -- він може не вписуватися в стандартне визначення, але методологічно він саме цим і є. І називати його злом по умовчанню -- неправильно і шкідливо, хіба що ти маєш на увазі виключно індивідуальний підхід, а не груповий.
Бо з груповим підходом все ок, хоча методологічно всякий груповий фільтр, абсолютний або навіть відносний, -- це все той самий профайлинг. Не відкривати магазин Сейфвей там, де нема достатньо платоспроможних покупців, можна вважати профайлингом, але це правильне бізнес-рішення, незалежно від того, чи покупців нема, бо це острів з дюжиною приватних маєтків, власники яких замовляють готове з мішленівського ресторану за 100 км і доставкою гелікоптерами, чи тому, що це бідне бандитське містечко, де в магазині ніхто не заплатить, бо у кожного або нема грошей, або нема совісті, зате є пістолет. Звичайно, з точки зору мешканців обох містечок, вони знаходяться в food desert, їм важко, але і керівництво Albertsons Safeway Inc можна зрозуміти.
> ... які на те погано не заслужили, тупо тому, що scores неідеальні. ...
Що значить -- неідеальні? Неточні? Я впевнений, що в наші часи більшість scores дуже точні.
> ... з таким профайлінгом треба боротися банально
> з точки зору cost-benefit для всього суспільства.
З купою всього можна і треба боротися для всього суспільства, одне погано -- чим глобальніший cost-benefit аналіз ти робиш, тим менш точний буде механізм локальної користі. Крайній варіант оптимуму вже оголошували, це я про "от каждаво па спасобностям, каждаму па патрєбностям". Інша крайність, чисте тваринне лібертаріанство -- теж ніфіга не працює. Оптимум шукаємо, хто як, хто де. Я, скажімо, переконаний, що статичного глобального оптимуму для людства точно нема, а з локальними все непросто.
no subject
Date: 2025-08-05 02:33 am (UTC)Навпаки, ховати голову в пісок, і робити вигляд, що груповий профайлінг не приносить зла, не робить погано людям, які на то не заслуговують - не можна.
Ти тут казав про локальну користь. Так ось, в простому прикладі з наймом ветеранів - є мінімум дві різні типи локальної користі. (1) Користь для ветерана з потрібними навичками, який находить, або не находить роботу. (2) Користь для працедавця, який находить або не находить собі кваліфікованого працівника.
Так ось, питання - чому друга користь важливіша за першу? Це не просте питання, в ньому треба шукати баланс, але в твоїх прикладах імплікується те, що перша локальна користь взагалі неважлива, і що усі benefits, які ми враховуємо - це benefits для роботодавця, а не працівника.
Бачиш проблему?
Навіть якщо якісь scores помиляються в 5% випадків - в суспільстві з 300 млн людей це 15 мільйонів людей, яких профайлінг скривдив, поступив з ними несправедливо, за рахунок яких система зробила іншім добре. І добре, якщо це помилка, яку можна виправити, чи яка не дуже суттєво впливає на життя. Але буває, що і ні, впливає, і ще як впливає.
І це - зло. Це може бути злом, якому не можна запобігти. Це може бути меншим злом з усіх можливих альтернатив. Але це зло. Називати його добром (чи "ок") - не треба. Бо для пошуку оптимуму треба сказати про це зло, порахувати це зло і мінімізувати це зло - інакше ми перетворюємося на махрових лібертаріанців, якім прибуток тут і зараз важливіше за все, а далі хоч потоп.
І це ми тільки про scores кажемо - а інші класифікатори (які, в принципі, можна перетворити в дискретні scores) аж ніяк не є точними. Яка кореляція між наявністю соціально небезпечного ПТСР і фактом ветеранства? (Про колір шкіри, гендер чи національність не будемо навіть.) Ото ж і воно.
no subject
Date: 2025-08-05 06:05 am (UTC)Груповий профайлинг, за визначенням, когось образить, як і всяка інша дія, яка зачіпає групу людей. Але то теоретична абстракція, а всі твої приклади -- про щось інше.
> ... в простому прикладі з наймом ветеранів є мінімум дві різні типи локальної користі ...
Приклад групового профайлингу з наймом ветеранів полягає не в тому наймати чи не наймати конкретного ветерана, а як діяти по відношенню до групи ветеранів в цілому. Наприклад, чи потратити $A на людину в спільноті, де відсоток ветеранів В, якщо прибуток від одного вдалого найму $C, шанс, що ветеран підійде на позицію D, шанс, що на позицію підійде не-ветеран E. І рішення це для кожної компанії однозначне: маркетувати лише якщо B < (А/C-D) / (E-D). Ну, в найпримітивнішому варіанті, з додатковими усередненнями і допущеннями. На фоні цього можна займатися державною або громадською підтримкою або власною підтримкою, спонсоруючи $А або поправляючи C для ветеранів. І це буде правильно, бо не працевлаштовувати ветеранів і аморально, і невигідно для суспільства. Тим не менше, формула залишиться, і для якихось комбінацій спільнот і робіт меркетувати не буде сенсу. І де тут зло?
Більше того, враховуючи, що спонсорувати це діло коштує ресурсів, вигідно це робити не всюди, а де буде найбільший cost-benefit, і знову профайлинг...
> усі benefits, які ми враховуємо - це benefits для роботодавця
Усі бенефітс, які повинен враховувати у своїх діях роботодавець -- так, це бенефіти для нього. АЛе незрозуміло, чому ти заперечуєш, що користь другого порядку для робітників не є в інтересах роботодавця. Є і матеріальна користь, і моральна. Навіть для роботодавця самого по собі, а в іншому місці і про інше ти правильно написав, що на це може впливати ще і оподаткування, і регуляції, і т. д. І жоден з цих впливів не відміняє того, що кожен в цій системі займається груповим профайлингом, соваються лише коефіцієнти важливості різних факторів.
> ... якщо якісь scores помиляються в 5% випадків ...
У мене підозра, що ти саме так abuse'єш скоринг, як я застерігаю не робити. Вірніше, що ти за умовчанням сприймаєш, що всякий скоринг можна лише абʼюзати.
От що значить "якісь scores помиляються в 5% випадків"? Скор (блін, пора українське слово нормальне придумати, мене уже коробить від англіцизму), має сенс лише для розподілу. І _в середньому_ він, якщо порахований хоч трохи неідіотом, завжди вірний, а індивідуально він не має смислу.
> 15 мільйонів людей, яких профайлінг скривдив, поступив з ними несправедливо
Їх скривдив не скоринг сам по собі, а невірне його застосування, проти якого я і застерігаю. А от незастосування скорингу би скривдило всіх. Тому що якщо не дискримінувати бажаючих отримати позику за хоч якоюсь моделлю правдоподібності погашення цеї позики, то банк прогорить через кілька місяців, і позики не отримає більше ніхто. Якщо не дискримінувати юзерів онлайн банку за скорингом довіри, то завтра зареєструється стільки шахраїв, що гроші розкрадуть у всіх.
Власне, останнє -- реальний приклад з моєї власної карʼєри, коли відмова від профайлингу зашкодила всім, а користі нікому не принесла. (Тут опущена купа деталей, зокрема, про те, що робити, коли даних не вистачає і про cost-accuracy дихотомію процесу скорингу.)
> інші класифікатори ... аж ніяк не є точними
Нема жодного точного класифікатора. ВОни всі імовірнісні. Про це і допис. Вірніше, про те, що якщо трактувати імовірнісну оцінку, як особистий параметр людини, то це погано.
no subject
Date: 2025-08-05 02:56 pm (UTC)Хе, це цікаве питання. Теоретично - користь навіть першого порядку для робітників є в інтересах роботодавця, бо роботодавці - це частина суспільства. А на практиці - "ми ветеранів не наймаєм, луганчанам не здаємо", і теде, і тепе... Люди, сцк, не раціональні - ти в цьому можеш переконатися, просто подивившись за вікно.
А ось тут я принципово не погоджусь. Навіть в найкращих моделях є частина помилкових відповідей, коли модель застосується 100% вірно - але дає неправильну відповідь, бо як ти правильно кажеш - модель ймовірнісна. І ці помилки - це зло, з яким треба боротися. Перемогти його 100% неможливо, але якщо його не називати тим, чим воно є, і не намагатися асимптотично наблизитися до його відсутності, то буде фігня.
Головна різниця між профайлінгом типу "МЛ, яка оцінує ризики, і не видає позику" та "ветеранів не наймаємо" - false positive rate. Але ніякого "невірного застосування профайлінгу" в обох випадках нема - він застосовується "по інструкції". І обидва випадки так чи інакше перетворюють імовірнісну оцінку на особистий параметр ("тобі не можна довіряти позику"/"тебе не можна наймати").
І так, ти правий, перший тип профайлінгу може бути мінімальним злом, бо його відсутність принесе більше проблем.
Але про це зло треба говорити, і ці проблеми треба вимірювати на рівні популяції. Бо багато типу профайлінгу і навіть скорінгу - не є "в середньому точними", часто і густо їх точність навіть тупо не вимірюється. Яскравий приклад скорінгу з сумнівною ефективністю - credit score. Для того, щоб прикинути його ефективність - треба як мінімум поміряти ефект без нього, зробити контрольну групу, що ніхто не робить.
Більш того, очевидно, що кількість помилок (в обидві боки - від subprime mortgage crysis до системних недооцінок платежеспроможності людей, які справедливо не довіряють кредитним карткам), які робить цей скорінг - занадто велика, і що на цій планеті існують більш ефективні варіанти цього скорінгу, які приносять менше зла.
І про це треба говорити, і щось з цим робити, а не сліпо довіряти бізнесу з його профайлінгом і скорінгом, який часто і густо помиляється і закриває свої помилки за рахунок суспільства (як в випадку з вишепроцитованим subprime mortgage crysis).
(Про ресурси та ветеранів окремим коментарем напишу)
no subject
Date: 2025-08-05 04:40 pm (UTC)Питання визначень. Для мене користь другого порядку -- все, що не прямий вклад в бізнес конкретного працівника, а бенефіти від того, що ця людина працевлаштована взагалі, а не забута чи бездомна під наркотою на тротуарі. Словом, те, про що ти в паралельному коменті сказав, що я ігнорую. Ні, звичайно, не ігнорую, може, просто не розписав в деталях одразу; тепер -- розписав.
> Навіть в найкращих моделях є частина помилкових відповідей, коли модель
> застосується 100% вірно - але дає неправильну відповідь, бо як ти правильно кажеш -
> модель ймовірнісна.
У нас явна термінологічна несумісність. False positives/negatives -- це не помилка scoring'a, це помилка бінарного класифікатора. І мій пост якраз про те, що індивідуальна класифікація тільки на базі імовірнісних оцінок -- це неправильно.
> і що на цій планеті існують більш ефективні варіанти цього скорінгу, які приносять менше зла.
Точно, термінологічна несумісність. Читай попередній абзац. Зло і інші менш морально забарвлені хиби стаються, коли хтось починають трактувати імовірнісну оцінку як особисту характеристику і відповідно застосовувати їх при оцінці індивідуальних обʼєктів.
Словом, не розумію: ти або робиш ту саму помилку, проти якої я застерігаю, або повторюєш ту саму критику тих, хто так помиляється, лише іншими словами. Якщо друге, то у тебе зміщений термінологічний приціл, скоринг тут не винен :)
no subject
Date: 2025-08-05 04:49 pm (UTC)Ось це як раз принципова лібертаріанська помилка - лібертаріанці не рахують пряму користь для працівників, хоча для них (і для суспільства) це користь першого порядку, і незрозуміло, чому ця користь менш важлива, ніж користь для бізнесу.
Тобто ти проти того, щоб блокувати транзакції виключно на основі рішення МЛ-моделей і приймати рішення про видачу позик виключно на основі credit score?
(Бо, пардон, це вже індивідуальна класифікація на основі ймовірнісних оцінок, як не крути!) Якщо так, то я приймаю твій аргумент, і погоджуюся з ним. Я ж правильно тебе зрозумів, чи ще є десь помилки?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2025-08-05 03:15 pm (UTC)В твоїх міркуваннях є принципова помилка - ти не рахуєш збитки від безробіття ветеранів. Залишаючи мораль за кадром (бо яка мораль на ринку? ти за вікно дивився?) - ти знову ігноруєш локальну користь для ветеранів (чи інших членів суспільства взагалі), рахуючи тільки користь для роботодавця.
Я розумію, що з точки зору роботодавця на суспільство начхати, але в суспільній дискусії про це забувати не можна, інакше ми перетворюємося на екстремалів-лібертаріанців.
І навіть в твоїй спрощеній моделі треба рахувати збитки $Z (збитки від не-найму кваліфікованих працівників), і може бути ситуація, коли Z перевищує А, і навіть перевищує С! І тоді з точки зору суспільства треба витрачати більше, ніж A на працевлаштування ветеранів - бо інакше суспільство втрачає більше грошей на те, щоб спричинити більше зла оточуючим (безробіття, злочинність тощо)!
Побачивши це - має сенс пригадати, що ми не граємо в гру з нульовою сумою, кількість ресурсів в нас не є жорстко фіксованою (навіть якщо не є необмеженою), і з точки зору суспільства може бути сенс обкласти митом роботодавців (чи когось іншого), взяти позику та/або ввести примусовий контроль за дискримінацією при наймі - і витратити Z на найм, отримуючи кращий ROI при тих самих витратах (бо працевлаштована людина буде платити податки, і приносити користь).
Це, до речі, теж буде злом (ніхто не любить віддавати гроші державі) - але це може бути (і часто є) меншим злом навіть чисто по грошам. Але бізнес сам по собі на це ніколи не піде, він навіть не буде рахувати Z. Але ми мусимо.
no subject
Date: 2025-08-05 04:43 pm (UTC)Словом, ти тут проповідуєш церковному хорові, я абсолютно з усім згоден :)
no subject
Date: 2025-08-05 04:53 pm (UTC)Тому цій байас треба чЕкати, як на мене - тут різниця в термінології створює різницю в світогляді.
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2025-08-05 07:17 am (UTC)А що каже game theory?
Якщо на ринку будуть ті, хто профайлінг використовують, і ті, хто ігнорують, хто з них буде успішнішим? Стратегія має бути еволюційно стабільна, бо інакше носії такої стратегії вимруть.
Я вважаю, що треба розуміти проблеми, скажімо, працевлаштування ветеранів - об'єктивні чи ні не має значення, і формувати умови, у яких стабільною стратегією буде наймати ветеранів. Це може здатися тавтологією, але ж це якось так.
no subject
Date: 2025-08-05 03:00 pm (UTC)На ринку США будуть успішніші ті, хто too big to fail - ти можеш налажати з профайлінгом, як то було під час subprime mortgage crysis, але потім держава збере з ветеранів і неветеранів податки і віддасть їх банкам, які облажалися.
І це, сцк, не жарт. Більш того - це тільки частина проблеми. Кількість пільг, які отримає олігархат робить game theory - нерелевантною, бо вона має сенс тільки тоді, коли всі грають в одну гру по одним правилам, а це в реалі не так.
UPD: навіть якщо цю проблему залишити за кадром - все одно питання складне, бо банкінг це не тільки позики. Але в мене є рахунок в credit union, де офіційний credit score використовують опціонально - and they're doing just fine. Не жартую - коли я переїхав в штати, я відкрив в них рахунок і взяв позику, не маючи credit score взагалі.
Amen, brother! Правда, для цього треба рахувати не тільки cost & benefits для бізнесу, про що ми з Ростиком і сперечаємося.
no subject
Date: 2025-08-05 05:06 pm (UTC)Це ти сперечаєшся, я не сперечаюся а на різні лади повторюю, що написав те ж саме.
no subject
Date: 2025-08-05 11:19 pm (UTC)> відкрив в них рахунок і взяв позику
Не може бути, щоб бізнесу було все одно на прибутки. За credit union не скажу, а за капітал уан скажу. Теж видавали кредитки усім, навіть банкрутам. Але відсоток був 24%.
no subject
Date: 2025-08-06 12:04 am (UTC)Не знаю, як у вас, а в Штатах часом стається таке: якісь гравці йдуть на завеликий ризик, через що в середньому в часі помітно виграють, отримуючи змогу перемогти в конкуретнтій боротьбі і витіснити з ринку менш ризикових гравців. А потім в якийсь момент серйозний ризик матеріалізується у вигляді серйозного програшу, який найбільше бʼє по великих гравцях... яким не можна банкрутувати, бо too big to fail, тому їх рятують за рахунок платників податків, і все починається спочатку.
Але це з великими позиками, типу іпотеки, такі проблеми. А з дрібним кредитуванням якийсь продукт є для кожного, просто, чим у тебе все гірше, тим більше ти платиш і тим гірше воно на тебе впливає. Кредитки з вищими відсотками, з обовʼязковою заставою, позики "до получки" всяке. А американці при цьому досить масово не вміють бути фінансовими реалістами, тратять як дурні, живучи в борг, а потім їм все погано і кредитів не дають. Нє, когось шкода, але, так, чисто інтуїтивно, в цьому суспільстві на кожного чесного робітника, який би віддав кредит, але не дають, бо credit score замалий, випадає 5-10 таких, кому і не слід давати, бо не вміють жити в рамках можливого.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2025-08-06 12:17 am (UTC)Я не думаю, що їм було все одно на прибутки - але вони розуміли різницю між "нема credit score - ти лох" та "нема credit score, бо ти кваліфікований спеціаліст, який приїхав на нормальну роботу з нормальною зп". (Позику, до речі, дали, якщо не плутаю, під 4 з копійками відсотки - точної цифри не пам'ятаю, давно справа була.)
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2025-08-05 05:03 pm (UTC)Тут скорше питання в тому, хто використовує і як використовує.
На рівні бізнес-планування і агрегатних даних це використовують всі, що би вони тобі не казали. Але часом, найчастіше з ідеологічних причин, вирішують не використовувати. Я нижче напишу приклад, а зараз лише додам, що у випадку як з ветеранами чи подібних ситуаціях, де є дворівнева користь/шкода (бізнесові користі хороші працівники, а суспільству корисно, щоби ветерани були працевлаштовані і вели нормальне життя) часом виходить досить підла ситуація. Для досягнення користі суспільного масштабу необовʼязково, щоби всі бізнеси наймали,.. назвем їх представниками групи підвищеного ризику. Відповідно, може статися (і часто стається) ситуація, коли одні роботодавці це роблять, хай за рахунок підвищеного ризику і втрачаючи якісь кошти, але виграючи через глобальне покращення в суспільстві. А якісь інші компанії цього _не_ роблять, і в цілому виграють, бо самі ма ризикованих працівниках не втрачають, а вигоди суспільного рівня отримують за рахунок лохів, які думають про greater good. Коли таких егоїстичніших компаній стає більше, все валиться нафіг.
Рівно те ж саме стається з вакцинами (не вакцинуватися самому краще для здоровʼя, але якщо в суспільстві вакцинується менше певного відсотка, втрачається груповий імунітет і починаються епідемії, всім гаплик), з глобальним потеплінням (виграє той, хто більше забруднює) і т. п.
Напевно, теорія ігор це все описує, але єдині реальні рішення тут існують за межами гри, а у вигляді державних регуляцій і інших зовнішніх інтервенцій. Правда, зовнішні інтервенції найчастіше схильні грати на користь сильнішого, а не для всіх, то і виходить, як Микита прокоментував, всяка фігня.
Приклад з життя напишу окремим дописом, може, кому цікаво буде.
no subject
Date: 2025-08-05 08:25 pm (UTC)Ще цікаве те, що практично будь-хто є представником групи підвищеного ризику, треба тільки чесно подивитися.
Коротше, б було бажання - а група підвищеного ризику завжди найдеться!
no subject
Date: 2025-08-05 09:27 pm (UTC)no subject
Date: 2025-08-05 11:26 pm (UTC)(no subject)
From:no subject
Date: 2025-08-06 07:29 pm (UTC)no subject
Date: 2025-08-06 08:56 pm (UTC)На жаль, на практиці профайлинг іде не через максимально гнучке врахування важливих особистих характеристик кандидата (нехай, вони описуються змінними x1, x2, x3..), а через належність-неналежність до ряду множин, про які відомо лише відсоток того, скільки людей підходить, а скільки ні. Тобто, далеко не кожна така множина Y1, Y2 має відповідний неперервний score y1, y2, y3.., на якому ми можемо вибрати різне порогове значення. І навіть якби всі такі множини мали відповідну незалежну змінну, нема ніякої гарантії, що набір змінних ігреків може відобразити набір змінних іксів, в просторі яких даний оптимум існує. При цьому, оскільки кожна додаткова змінна не обовʼязково точна, то помилка може рости швидше, ніж сигнал.
В перекладі на мову датазнавства -- збільшення кількості features далеко не завжди покращує точнісь (що sensitivity, що specificity) класифікатора. Тому, якщо лише не перевизначати профайлинг в зручну для себе сторону, можливості його у світі з небезкінечною кількістю тренувальних даних будуть завжди обмежені.
no subject
Date: 2025-08-07 06:16 pm (UTC)(no subject)
From: