malyj_gorgan: (Default)
TL/DR; І ті, хто каже вам, що радіація шкідлива, і ті, хто каже, що вона нешкідлива, брешуть, хай, ненавмисно. Навіть відносно технічно підковані особи погано розуміють вплив радіації на нас, зате емоційна реакція на радіацію невиправдано висока. Правда в тому, що ми (не по одному, а людство взагалі) не все знаємо, і частину знання не пробуємо отримати.


Давно хотів написати про радіацію. Зараз якраз нагода.

Хіросіма-бімба-Чорнобиль! Мутації! "Дідусь погладив внука по другій голові", Ґодзіла і всякий постап.... Залякування радіацією ми отримуємо давно і з різних боків, через що більшість людей чітко засвоїло, що "радіація -- погано, чим її менше, тим краще". І весь світ навколо нас будується і структурується виключно в цій парадигмі. І більшість з нас, не лише обивателі, вважають, що це факт, доказаний, задокументований і відкалібрований. Але чи це правда, що радіація -- шкідлива? Правильна відповідь тут одна -- як писав часом один жж-юзер: "дурнувате опитування, не відповідатиму." А якщо точніше, то -- зараз буде лекція на тему :) Дисклеймер: пишу без посилань, але правду, то дуже близька мені професійно тема (в попередній професії, до 2015-го року). Основні факти і думки тут -- мій вільний переказ лекцій і поглядів покійного Джона Р. Камерона, одного із основоположників науки Медична Фізика.

Почемо з визначень: у твердженні "радіація шкідлива" обидва слова недовизначені. Тут не фізичне значення слова радіація -- випромінення, або, часто, "іонізуюче випромінення" (електромагнітні хвилі від ультрафіолету і далі або розігнані елементарні частинки), а доза випромінення, поглинута тілом, плюс, якась міра радіоактивності (здатність деяких ізотопів деяких елементів розпадатися з випроміненням іонізуючої радіації), попадаючи вам в організм. Фізики дозу міряють поглинутою сумарною енергією на масу, але оскільки вплив залежить від енергії випромінення (в смислі енергії фотона) і в яку частину тіла попало, міряють ефективну дозу, зівертах, або, в Штатах, в ремах -- спробах нормалізувати біологічну шкоду організму з урахуванням енергій і вражених органів. Але всяка додаткова штучна нормалізація -- такоє, модель, а не обʼєктивна відтворювана істина. З поглинутими (зʼїдженими, вколотими, вдихнутими) ізотопами все ще гірше, бо там міряють дозу, яка попала вам всередину, це зовсім інша доза, але те ж слово, оцінюють в кюрі або бекерелях, які передбачають кількість реакцій розпаду з виділенням гамма-променю на одиницю часу. Наче, все визначено, але вплив на організм залежить від енергії променю, часу піврозпаду, анатомії/фізіології того, куди воно попало... Ще гірше з поняттям "шкоди". При величезних дозах воно ясно: людина згорає, при трохи менших -- вражаються лише деякі тканини, найчутливіші -- кістковий мозок, наприклад. А от ще нижче -- уже геть сіра зона. Часто міряють ризик раку, але ж ми памʼятаємо -- різні енергії, органи, вік..., плюс, рак -- не єдина проблема в цьому житті (взагалі, рак однозначно грозить кожному з нас, єдиний спосіб його уникнути -- померти раніше від інших причин). Тому часто використовують одну з кількох метрик очікуваної довжини життя, ризику смерті і т. п. Але це, знову ж таки -- модель, і як всяка модель, працює лише постільки-поскільки.

Це все було -- труднощі технічно-термінологічні, які означають всього лиш, що про шкоду радіації не можна говорити взагалі, бо більшість узагальнень вийде неправдою. Просто тому, що не все в житті можна узагальнити. Ну, наприклад, отримати дозу радіоактивності в кілька мілікюрі може бути набагато небезпечніше, ніж в кількадесят мілікюрі... якщо перша -- полоній-210 (Луговий і Литвиненко, памʼятаєте?), а друга, наприклад, технецій-99м або фтор-18, нормальна доза в ядерній радіографії. Тому що полоній ще й токсичний, попадає у вразливі тканини, там випромінює альфа-промені, які так-то зупинить листок паперу або шкіра, але не прямо в організмі. Або отримати однакову дозу радіоактивності у вигляді йоду дуже залежить від ізотопу, бо ті самі кількасот мікрокюрі йоду-123, які колють при діагностиці щитовидки, у формі йоду-131 привели до раку щитовидки у дітей, бо інший час піврозпаду. А ще більша доза завдавала менше шкоди тим, хто їв йодовану сіль і/або вчасно закинувся піґулками з йодом.

Багато букв і посилання на кілька графіків )

Хотів написати більше -- про альтернативні градієнти (а їх є), про те, чому шкідливо переоцінювати шкоду, і про те, що ж робити, але втомився. Якщо цікаво -- питайте. Прикладів і висновків там ще багато.
malyj_gorgan: (Default)


Тому що в data-based-tech слід памʼятати програмний анекдот: "банани не для того, щоб їсти, банани для того, щоб продавати"
malyj_gorgan: (Default)
Якщо вам цікаво знати трохи більше про те, чому, як, коли і від чого формувалися українські прізвища, то ось вам відео годинної лекції на тему. Лекцію провела для Українського Навчального Центру що на Санфранцисканщині Ганна Бучко, колишній доцент Чернівецького і Тернопільського університетів і відомий український антропомініст. (Я, звичайно, упереджений, але, як на мене, серед нині живих, пані Бучко один з двох-трьох найсерйозніших спеціалістів з антропонімії України.)

Відео нередаговане, просто, запис онлайн презентації. Пощастило, що того вечора в Тернополі не було тривог і не відключали світло. Тут година і три хвилини, але якщо маєте час подивитися, то там багато цікавого. Спочатку -- загальна теорія, від того, які були імена і що мова з тими іменами робила, до прикладів класів прізвищ за походженням. Потім -- трохи про конкретні прізвища родин учасників нашого центру. В кінці -- пару слайдів, де говорю я -- про статистику і порівняння з іншими європейськими мовами.

malyj_gorgan: (Default)
В процесі обдумування, чого навчити дітей в недільний школі, почав перелопачувати всякі давні ресурси. Зокрема розкопав архіви журналу "Квант" -- там була така рубрика, "Квант для молодших школярів". Блін, я тупий. Дивлюся на пару задачок, не з фізики, з примітивної геометрії, і не можу розвʼязати. А на відміну від складніших задач з "Задачника Кванта", відповідей там нема. І тепер не можу викинути то з голови.
Здавалося б проста задачка:
На хуторі Семихатки є сім хатів, збудованих так, що які три з них не вибери, в тій трійці обовʼязково буде хоч одна пара, де відстань між хатами буде дорівнювати якійсь величині Х>0. Намалювати карту Семихаток.

І ось я уже кілька днів думаю, і не можу придумати. В смислі, в двох вимірах. В трьох -- можу, але тоді нема однозначності, а постановка задачі підрозуміває, що воно має бути
:(
malyj_gorgan: (Default)
Як ви знаєте, ми тут з групою однодумців створили Український Навчальний Центр -- нерелігійну недільну школу з ідеєю навчити дітей ще чогось, крім читати/писати/співати. Зокрема, 2-3 рази на місяць я проводжу ... фізику. Не за якоюсь програмою, вчу, що вважаю за потрібне, а тут зараз прошу небайдужих читачів поділитися зауваженнями і пропозиціями щодо свого підходу до викладання.

(Ліричний відступ для незнайомих з американською системою освіти ))

Мої учні -- ±7-класники американської школи, математику знають не далі арифметики (квадратного рівняння не бачили, геометрії і тригонометрії теж, в абстрактні позначення типу (ac+bc)=(a+b)c, не вміють). Тому філософію курсу я придумав таку:
* В першу чергу хочу показати дітям (а то і навчити) концепцію "розвʼязувати задачі". У них в школі ідея "задачі" (as opposed to "приклад") дуже розмита, відповідно, мені здається, це те одне корисне, що я матиму шанс їм показати.
* Тому в програмі я обмежуся кінематикою і механікою, може, навесні дам трішечки електрики, цього достатньо для розвʼязання задач. Більше, все-одно, без математики, лабораторій і купи занять викладати можна лише як "магію", а не як науку. (Власне, тут так майже все і викладають: діти в школі завчають якісь мантри про фотосинтез, кругообіг води і мітохондрію, але то чемодан без ручки, толку нуль, лише мозок засмічує.)
* Купу часу доведеться потратити на те, щоби привити дітям ідею використання абстрактних змінних: F=ma або d=vot+at2/2 і т. п. Бо в школі всі рівняння у них лише в числах, вони приходять в коледж, не вміючи в абстракції.
* Щодо підручника, роздав їм PDF Пшенічки-Мельничука, але пройти вийде лише невелику частину, буду думати, яку частину вибрати.

Ось такі у мене мінімалістичні плани. Що скажете? Що порадите?
Врахуйте, що по суті основна мета класу -- щоби діти щось говорили і розуміли українською на рівні хоч трохи вище побутового, але ж, холєра, хочеться і завдати дітям якоїсь користі. Аби набуте вміння їм в житті знадобилося. Надало, так би мовити, якусь конкурентну перевагу...
malyj_gorgan: (Default)
Недавно вийшло цікавий пресс-реліз служби державної безпеки США (це котра Сікрет Сервіс). Накрили (незрозуміло кого взагалі-то), хто був готовий влаштувати мобільно-телефонний мінітеракт. Що саме ці невідомо-хто планували зробити, нам не кажуть, кажуть, що могли: як мінімум, перевантажити і завалити мобільну телефонію в локальному місці, а то і паразитувати на ній для локального вжитку всякими зловмисниками. Слідами цієї події вийшла цікава стаття -- огляд техніки, яку перехопили в процесі. Я звернув увагу, що в Україні і деінде в Європі давно популярні телефони "на дві SIMʼки", щоби одночасно два номери -- переважно, від різних провайдерів, але часом і того самого. Мені хтось розповідав, що є апарати на ТРИ сімки. ("розповідав": може, придумали, може, мали на увазі E-SIM,... але ідея в головах була). Та хоч пʼять! Це все дитячі забавки, справжні круті пацани мають апарат на 256 сімок! Ось такий:

Основний споживач -- не лише кібертерористи, а спамери і індустріального масштабу скамери. Чогось аналогічного можна було досягнути, використовуючи так звані device farms, апаратні ферми, але окремий прилад -- дешевше, надійніше і елеґантніше.
Як боротися з телефонним шахрайством, спамом і т. д. в сучасних умовах -- неясно, ясно, що треба міняти парадигму. Як на мене, що з телефонією, що з емейлами, найкращий вихід для цього світу --
капіталізм. )
malyj_gorgan: (Default)
Вибачте, що замість нормального контенту, продовжую виставляти сюди чорновики допису для ФБ нового навчального центру. Зараз -- друга редакція викладеного в попередньому дописі. Якщо маєте конструктивну критику, то наперед за неї дякую

Під катом, бо то лише якщо вам геть нема, що робити )
malyj_gorgan: (Default)
Використаю Дрім для обкатки тексту місії нової української школи, яку ми з кількома однодумцями заснували цього літа. Якщо маєте поради чи зауваження, то пишіть; наперед дякую. Якщо захоплені відгуки, то тим більше пишіть, але щось я сумніваюся ;)

Цю версію розкритикували (не в Дрімі, так я і не лише тут відгуки збирав), тому залишаю ї під катом для історії, а зараз виставлю перероблену. Відгуки туди, будь-ласка.
стара, погано написана версія )
malyj_gorgan: (Default)
В коментах до попереднього допису зрозумів, що саме я хочу запитатися у загалу, бо в коментах зразу замахнулися на реформу системи фінансування школи :) Винесу запитання з коменті, трохи розширивши:

Для початку: думайте, як вчитель. (На крайняк, учень.) Думки політиків і регіональних адміністраторів хай залишаться за рамками.
Дано: клас з 20 учнів (число довільне). Річний курс географії України. (Або європейської літератури XVIII століття. Або початків алгебри і тригонометрії. Або зоології. Іспанської мови. Трудового навчання. You get the point.).
Питання: Ви повинні провести цей курс і в кінці його виставити оцінки; як ви це робитимете? (Варіант: ви учень в цьому класі, як би ви хотіли, щоби вчитель ставив оцінки.) Я знаю про кілька основних концептуальних підходів:
    1. Оцінка в першу чергу відображає, наскільки добре учень засвоїв навчальний предмет. Тобто, якщо учень А отримав кращу оцінку, ніж Б, ця різниця між оцінками першу чергу відбиватиме, наскільки А краще розбирається в карті (аналізує прозу Вольтера, розвʼязує рівняння і т. п.)
    2. Оцінка в першу чергу відображає, наскільки добре учень виконав окреслений список вчительських вимог. Повертаючись до наших піддослідних, різниця в першу чергу опише, наскільки А вчасніше здавав домашки. не пропускав тести, і виконував групові завдання з гарно оформленими рефератами.
    3. Оцінка відображає зусилля учнів. В нашій парі це означатиме, що А більше "старався", слухав, приходив на додаткові заняття, задавав питання, очевидно тратив купу часу на домашні і проекти.
    4. Оцінка відображає відносне покращення знань і вмінь кожного. А не знав, що таке карта, а зараз уже відрізняє карту від глобуса, а Б як знав на карті ріку Дніпро і 25 обласних центрів, так нічого нового і не вивчив -- А заробив більше.
    5. (додатковий фактор) Оцінка відображає належність учнів до тих чи інших груп. А дістане вищу оцінку, ніж Б, якщо він щиріший українець, чорніший афроамериканець, класовіший пролєтарій, біженськіший палєстинець etc.

Правила відповіді:
А. Це питання про те, як би вважали за правильне оцюнювати (чи бути оціненим) в школі ви, а не які мають бути вимоги з РайВНО, скулборду чи дорадника президента.
Б. Будь-ласка, не треба казати, що "все важливе" -- щось завжди важливіше. Скажімо, в тих школах де вчаться/вчилися мої діти (діти знайомих і друзів, просто мої знайомі, коли були дітьми) основа навчання -- підхід номер 2. Часом з невеликою домішкою підходу 5.
В. Вибір може залежати від курсу. Я буду ок з відповіддю "номер 1 для математики, номер 2 для фізкультури", але прошу дати не лише два варіанти, а хоча б натякнути, що повинно працювати для якого _виду_ шкільних предметів.
malyj_gorgan: (Default)
По радіо передавали виступ якогось республіканського конгресмена на захист їхнього Big Beautiful Bill. Хто не знає -- недавній закон республіканців, написаний, щоб загнати країну в остаточно непідйомні борги, в процесі попсувавши купу корисних функцій уряду, в процесі підлизатися до кількох груп виборцівлоббістів і зменшити податки. Зменшення податків там переважно для найзаможніших, але республіканці не втомлюються повторювати, що ні-ні, прості трудяги теж виграють. Я оце мінімум втретє чув ту саму захисну риторику: дивіться, середній клас і бідні теж щось виграють, он, подивіться, ми забрали податки на overtime і tips (наднормовану роботу і чайові). А далі називають всякі цифри, в які, якщо вслухатися, вилазить дуже цікава штука: в районі медіани за заробітками і трохи нижче середній податковий плюс буде півтори-дві тисячі. А в іншому місці ті самі люди кажуть, що середній податковий плюс за overtime і tips буде 1300-1800.

І от тут я трохи розгублений. Мені здається очевидним, що якщо середня загальна вигода лише дуже трохи відстає від середнього виграшу від перепрацювання (що овертайм, що чайові -- це про роботу вище норми), то люди, робота яких не має овертайму і чайових, в середньому майже нічого не виграють.1 Що, в свою чергу, означає, що більшість з них отримає дулю з маком, якщо ще і не доплатить, так працюють асиметричні розподіли. Далі: я розумію, чому про це мовчать республіканці -- шифруються, це ж вдарить по шумнішій частині їх електорату, просто, в момент, коли реально вдарить, при владі буде вже хтось інший, от їх і звинуватять. Але чому про це мовчать інші: хоч демократи, хоч прогресисти, хоч скільки-завгодно-ліберальніші-ліберали? Це ж прекрасний лозунг: "No tax cuts for working class Americans until they strain more than normal. Yes tax cuts for wealthy Americans no matter what they do."2 Чи це вони мовчать тому, що навіть мінімальна домішка математики в риториці автоматичо дискваліфікує цільовий електорат? Щось мені каже, що, найімовірніше, таки так. А ви кажете, "шкільна освіта"...
Дотичний спогад: в інтервʼю якогось республіканця ще в процесі дебатів за той закон, його запитали, що, дивіться, люди втратять $X грошей у формі послуг, переважно, медичних, і виграють $Y податками, але ж X>Y, то яка вигода? На що він почав віщати, що це not a zero-sum game, насправді, мовляв, додасться, не $Y, а через всякі економічні процеси $Z≫$Y, тому все буде ок ну як же ви не розумієте, values- імігранти- кляті-ліберали-довели-країну. Він, правда, і там лукавив, бо в гру з ненульовою сумою треба було включати не Y, а (YX), але я про інше: розрахунки середніх -- це таки гра з нульовою сумою; при фіксованому середньому те, що додається в одного, віднімається в іншого.


1 Overtime -- штука досить рідкісна. По-перше, вона є лише в обмеженої кількості позицій, більшість робіт просто "full time" і все, скільни не працюй, ніяких додаткових виплат тобі не належиться. Але основне навіть не це, а вид з іншого боку: більшість людей, які працюють понад 40 годин на тиждень, роблять це на різних роботах, на жодній з них ніяких овертаймів не отримуючи. Навпаки, на багато робіт часто наймають на строго менше 30 годин, щоби не покривати медичну страхівку. (Тому обмеження Medicaidʼу для них якраз важливіше, ніж зайвих $20/тиждень.)
2 Я свідомий того, що моя теорія спирається на те, що я правильно почув правдиві цифри. З іншого боку, для застосування запропонованого лозунгу достатньо не цифр, а самого факту, що податки на овертайм і чайові є ключовою "вигодою для робочих" в риториці республіканців.
malyj_gorgan: (Default)
В коментах у одного з онлайн-друзів придумав ілюстрацію.

Там була розмова, що, он, дитина мову якусь забула/не вивчила, але це ок, бо та мова дитині в житті не знадобиться. Аналогічних виступів про математику (або історію, або географію, або літературу, і т. д.) можна почути майже від кожного. І якась дрібка здорового ґлузду в цьому є, я критикую не право так казати, а виключно логіку "я не вивчив в школі Х, а воно мені в житті не знадобилося, то й добре"

Людина, яка, наприклад, не вміє водити машину, живе собі без машини хоч ціле життя. Вміння водити машину їй "не потрібне". Тобто, комусь воно стає потрібне, і людина вчиться, хоча з віком це важче, але не настільки важче, як вчити мову чи математику. Але навіть дивлячись на тих, хто так і не завів машини і водити не навчився, хіба не очевидно, скільки всього вони недоотримали? Це ж ти, без такого вміння, не пройти на деякі роботи, не попадеш під час подорожей в десятки місць, бо потяг/велосипед туди не їде, а таксі задорого, не зможеш підмінити друга за кермом в поїздці... впевнений, ви і без мене придумаєте ще приклади. Висновок один: простір можливостей для того, хто не вміє водити, вужчий. Що не завжди погано: невміння стрибати з парашутом, їздити на мотоциклі чи гірських лижах --це теж звуження простору можливостей, але оскільки більшість додаткових сценаріїв, де ці можливості можуть знадобитися, приносять в життя додаткові ризики, сумарний ефект від пропущених парашута, лиж і мотоцикла може бути і позитивним. Але вже від машини, в наш час -- ні. А від мови чи математики -- так тим більше.

P.S. Думав поставити в якості епіграфа анекдот про дохлу ворону, яка не знадобилася, але передумав
malyj_gorgan: (Default)
(а новини такі, що на їхньому тлі, взагалі, хоч застрелься, але не мож, бо, блін, їм же всім від того ліпше) дві думки:

1. По-перше, ну нафіг ідею застрелитися. Хай ліпше це вони застреляться... але, блін, у них для такого занадто товста душевна організація. О, знаю, хай вони ліпше нами подавляться(*)

2. Таке враження, що в цій країні якісь права і майбутнє є лише в церкви. А можна організувати церкву... назвем її подібно до чогось, що вже було, але з додатком... о, придумав: Church of Jesus-Christ, the Ph.D. Scientist. Ну, там, щоби попасти в духовенство, треба спочатку заробити Ph.D. з природничих наук, служби-релігійні-ритуали всі в стилі лекцій/практичних/лабораторних, пожертви збирати (без податків) на витрати типу наукових ґрантів, але без зайвих урядових обмежень, які при кожній адміністрації міняються, куда захоче ліва нога третього радника четвертого помічника зам-голови адміністрації. Оскільки воно релігія, а не освіта, непотрібного державного контролю в рази менше, податки платити так само не треба, краса!
А, відносно імені: одним з таїнств церкви є виступ пошукача на промоцію в релігійній ієрархії перед групою представників духовенства (активні вчені у відповідній галузі наук) з завданням доказати їм, що ти зробив щось нове, типу, семінара за власною ж статтею. Як тільки ти кажеш дурницю, всі учасники колегіуму, хором, вигукують: "JeezusChrist!"

(*) Хто не провів багато часу в западенському селі, звичайно, до кінця не відчує, але не розказати не можу. Один з програмних анекдотів савєцького періоду: Виступ голови пересічного колгоспу:
- Того року ми посіяли двайцять га кукурудзи... усе воронє зʼїло. Сего року ми посіяли трийцять га кукурудзи... усе воронє зʼїло. На другий рік ми посіємо... СТО га кукурудзи! Най вони сі подавʼят!!!
malyj_gorgan: (Default)
Нижченаписане -- це як табличка множення для всякої людини, яка хоч колись працювала близько до модної останні чверть століття теми "машинне навчання", ака, Machine Learning (ML). Якщо ви це все знаєте, пропустіть, але комусь може і цікаво буде.

Як оцінювати якість класифікатора машинного навчання )
malyj_gorgan: (Default)
Переклад оцього.

ПОпулярний клас метрик, які дуже часто місінтерпретують -- різні типи скорингу (не плутати з рейтингом). Найпопулярніші -- кредитний, довіри, автоматизації, які означають, відповідно, імовірність, що особа віддасть певну позику, що це чесний юзер, а не шахрай, що це бот/скрипт, а не жива людина. Найчастіше ці цифри рахують як оцінку імовірності в класифікаторі машинного навчання, який тренують на передбаченні відомих ярликів зі змінних, що описують середовище і попередню історію юзера.

Хибність інтерпретації, яка змусила мене додати теґ ДІДАМ, -- наслідок тенденції ставитися до статистичних оцінок як до особистих параметрів. Люди не вміють в імовірності (доказ: азартні ігри), більшість з нас, почувши "кредитний скоринг Івана 0.6, а Петра 0.9", сприймає це як "Петро є в півтора рази (9/6) більш фінансово відповідальний, ніж Іван"

Але це бздура!

Найкраща ілюстрація -- скоринг автоматизації. Юзер не може бути ботом на 90% чи 60%, ти або людина або ні; людина з автоматизаційною оцінкою 0.9 на 100% більше людина, ніж бот з оцінкою 0.6. Аналогічно з фінансами: позика, віддана кредитором зі скорингом 600 -- це на 100% більше, ніж іпотека, не виплачена кимось з прекрасним високим скорингом 900.

Найочевидніша і вірна паралель тут -- профайлинг. Так, ставитися до когось виходячи лише з їх скорингу і є старим добрим профайлингом. І, як і з профайлингом, треба знати, коли і як його застосовувати. Оголосити когось поганим чи хорошим лише через оцінку імовірності -- неправильно. Планувати бізнес або інші акції, де треба думати про дивіденди і баланс витрат-прибуткі -- правильна і єдино можлива стратегія. Так просто.

Який висновок? Не переставати рахувати скоринг, але знати, як ними користуватися. Не відкидати профайлинг, але знати, де і коли його застосовувати.
malyj_gorgan: (Default)
One of very frequently misinterpreted data science-related metrics is a likelihood "score". Most popular score classes: credit score, trust score, and automation score, respectively, estimating how likely a person is to return a certain loan, to be an honest user vs bad actor, and to be a script vs a live person. These days, such scores are computed as a prediction probability in a machine learning classifier trained on some past data mapping a bunch of environmental, metadata, and prior behaviour information about a person/user to known binary outcome.

The misinterpretation that makes me categorize this post as fac is the human tendency to treat statistical estimates as deterministic parameters. Humans are bad at probabilities. (Proof: gambling) Basically, most of us, when hearing "credit scores for John and Paul are 0.6 and 0.9 respectively" would perceive this Paul being 9/6 = is one and a half times more financially responsible than Paul.

But that is bullshit.

It's best understood with automation trust score. A person cannot be 90% bot or a 60% bot. You either are a human or you ain't; a human with 0.9 automation score is 100% more human than a bot with a 0.6 automation score. The same thing about credit score: a borrower with credit score of 600 returning a loan is 100% better than a 900-credit-score borrower who defaults. The only way a score can and should be treated is when dealing with populations and risks: "out of a thousand applicants with a credit score of .9, a hundred will not pay off properly".

The most obvious (and correct!) parallel here is profiling. Yes, treating people only by credit score is just that -- good old profiling. And just like with profiling, you have to know when not to use it and when yes use it. Declaring someone definitely good or bad just because they fit the profile is wrong. Planning your business or policy or any other large scale thing where you have to care about return of investment and cost-benefit analysis is right and the only way to go. That simple.

So, what's the takeaway? Don't stop computing scores but hnow when to use them. Don't stop profiling, but know why and where you do it.
malyj_gorgan: (Default)
В силу неприємних життєвих (дякувати богу, не особистих) обставин задіяний в процесі конфлікту між двома групами осіб, які колись мали спільну власність, а тепер розкололися на дві частини, посварилися, судяться і ділять майно. Причому, частина майна зараз у групи А, частина -- у групи Б, майно часто не нове, може мати не лише матеріальну, а і сентиментальну цінність, як ділити? Я оце придумав спосіб поділитися більш-менш порівну, який вважаю потенційно найсправедливішим, але цікаво, чи так насправді роблять. Як ви скажете? (ґуґлити? нє, не пробував, ви ще до чата джіпіті мене пошліть...)

Кожна сторона пише список майна, яким володіє і ціни, які вважає справедливими за те майно, яке у неї зараз є. А далі кожна сторона дивиться на список свого опонента пункт за пунктом, і відбувається таке:
1. Допустім, сторона А написала, що володіє сепулькою, яка варта $X
2. Якщо сторона Б згодна з названою ціною, то ця сепулька попадає в кошик випадкового поділу за $X.
3. Якщо сторона Б вважає, що ціна сепульки завищена, то вона про це каже вголос, і сепулька залишається у сторони А і "рахується", що сторона А отримала $X спільного майна.
4. Якщо сторона Б вважає, що ціна сепульки занижена, то сепулька відходить стороні Б, і вважається, що сторона Б отримала $Х(1+λ) спільного майна, де λ -- параметр алгоритму, "ціна" транзакції, реалістично, порядка кількох відсотків.

Після того, як всі речі в списках обох сторін пройшли через цей процес, кожна сторона має якусь кількість предметів з тих, де А і Б спочатку не погодилися, плюс, є "кошик" -- набір оцінених предметів, про які А і Б погодилися в оцінці. З цього кошика сторони добирають речей випадковим чином, поки загальна сума у кожного не буде більш-менш однаковою. Вуаля!

Як вам таке? Спрацює? Нагадую, що це не про алгоритм максимально однакових сум з набору нерівномірних величин, а про те, як бути, коли сторони назло одна одній можуть щось не так оцінювати.

UPDATE. Хоча для самого алгоритму воно несуттєво, але для розстановки пріоритетів треба сказати: крім майна, сторони ділять і гроші в банку, причому загальна сума більше ніж вдвічі перевищує (раціонально пораховану) вартість майна. Ну і про вартість транзакції я недаремно згадав -- це реальне життя, кожна транзакція коштує якщо не гроші, то нерви.

UPDATE 2. В процесі обговорення, нарешті, досформулював:
Організація Ко, у власності якої було якесь матеріальне майно і Sко доларів в банку, розпалася на дві частини, А і Б. На момент розколу, майно було якось поділено між А і Б, а гроші контролював суд. Майно не нове, вартість його незрозуміла, хоч і точно не нульова, але А і Б мають різні погляди на те, що скільки вартує. Для спрощення задачі, можна вважати, що сумарнa вартість майна за оцінкою кожної зі сторін не перевищує Sко.
Задача: поділити майно між А і Б так, щоби обидві сторони погодилися з результатом розподілу в форматі грошової дельти D доларів. Тобто, після розподілу майна обидві сторони повинні підписати спільну заяву на кшталт "Ми поділитися, і частка, отримана А, вийшла на D більше". Після чого суд віддасть сторонам А і Б, відповідно SА і SБ доларів, так, що
    SА + SБ = Sко
    SБ - SА = D
Додаткові умови: сторони одна одній не довіряють, не люблять, бачити одна одну не хочуть, готові робити речі одна одній на зло. В результаті, з одного боку, треба очікувати спроб недооцінити своє і переоцінити чуже, кожна сторона прагне, щоби дельта D вийшла якнайвища на користь опонента (щоби забрати собі якнайбільше реальних грошей, а опонентові віддати якнайменше. А ще, через взаємну нелюбов, кожний зайвий обмін предметами між сторонами коштує зайвих нервів і/або грошей, тому мінятися кожним предметом сторони готові лише, якщо новий власних оцінить його мінімум на λ вище, ніж попередній власник. (λ~10%)
malyj_gorgan: (Default)
Яху підкинула допис про фаворитизм в сімʼях. Ну, про те, що, коли більше одної дитини, то хтось з дітей є фаворитом ("більше любимо", більше вибачаємо, надаємо перевагу і т. д.), а навіть якщо ні, то діти сприймають, що фаворитами є не вони, а брат/сестра. Але останнє то уже психологічні моменти, в реалі повної гомогенності не буває, так що, якщо у вас, скажімо, двоє дітей, то хтось один з них -- улюбленець. Я читав статтю в HuffPost, яка розповідає про статтю пари вчених з, of all places, Brigham Young University, яка, в свою чергу, є оглядовим мета-аналізом кількох десятків уже справжніх статей на тему. Сподіваюся, ніде з ідеологічних причин сильно не прибрехали, але не впевнений, в якому місці меседж втратив важливу компоненту. Я це до чого -- далі в статті наводяться дані про те, як буття фаворитом впливає на подальшу долю дитини. Кому цікаво, спробуйте вгадати: як відрізняється стан і майбутня доля дітей, які були фаворитами в родині? Щоби не було спойлерів, заховаю решту допису.
Клацніть сюди, коли сформулюєте для себе відповідь і захочете читати далі )
malyj_gorgan: (Default)
Цікаво дивитися, як на теми, про які я тут лементую уже котрий рік, сваряться навіть в міцних і єдиних у своїй трампанутості лавах MAGAмериканців. Багато хто про це написав, але раптом хто не знає. Там у них таке: затрампіст індійського походження Вівек Рамазвами написав очевидну, в принципі, думку, на тему, чого США не вистачає технічно грамотних громадян: культурка не та, цінності не націлені на знання, тому і не навчається публіка нічого хорошого. Я, прямо, не втримаюся і процитую:
American culture has venerated mediocrity over excellence for way too long (at least since the 90s and likely longer). That doesn’t start in college, it starts YOUNG.
A culture that celebrates the prom queen over the math olympiad champ, or the jock over the valedictorian, will not produce the best engineers.
... (далі про то, що американська норма ортогональна до краще вчитися і більше знати) ...
If you grow up aspiring to normalcy, normalcy is what you will achieve. ... “Normalcy” doesn’t cut [today]
...

Перша процитована фраза -- могли би бути мої слова. Друга -- могли би бути мої слова, якби я вирішив стати політиком. За то цього Вівека зараз з усіх боків з гімном мішають правдиві американські затрампісти. При тому, що, типу, на його боці, виступив сам президент Маск. Шкода лише, що у затрампістських розумніших людей типу Вівека з гідністю (за фактом того, де вони знаходяться) тугувато, впевнений, вони прогнуться, поцілують в сраку всіх, до кого губами дотягнуться, ще й, чого доброго, вибачаться.

Таке. Ще у Якова пара цікавих цитат на тему.
malyj_gorgan: (Default)
В розмові з mprotsenko зачепили тему, яка з якоюсь частотою присутня в моєму житті з ... ну, може, не з народження, але точно з шкільних років. (А що ви хочете? Ріс в родині університетських викладачів. Потім передвступні страждання , навчання в різних вузах і країнах, аспірантура, викладання, академічне життя, свої діти... Як тут не думати на такі теми?)

Недавно в Каліфорнії університетам заборонили так звані legacy admissions -- офіційні преференції при вступі у вуз для дітей з родин донорів вузу, працівників вузу і навіть випускників вузу. Що з того вийде -- буде видно не скоро, але ось які очевидні питання зачіпає ідея вступу у вузи:

1. Наскільки, взагалі, реальна система вступу, яка реально оцінює знання абітурієнтів?
2. Наскільки важливо те, що рівень знань при вступі далеко не так добре корелює з рівнем знань при навчанні, а той, в свою чергу -- з рівнем знань і вмінь в реальному житті?
3. Як саме краще влаштувати вищу освіту, щоби було справедливіше, ніж зараз? Ефективніше ніж зараз? За якими критеріями міряємо ефективність?
3а. У вищезгаданому запитанні врахуйте тему падіння якості освіти. Це не старе бурчання, це про інфляцію оцінок -- ващє цікава тема, зараз за ту саму оцінку треба менше треба знати і робити, це тема стара і стабільна, уже кілька десятків років про це трублять, але поки що мало чого досягнули.

P.S. Мої гіпотези, коротко:
1. Реально лише в рамках одного університету шляхом банальних вступних екзаменів, проведених на місці цим університетом. Така система дискримінує тих, хто гірше вміє складати екзамени, плюс, є можливості для локальної корупції, але в цілому ок. Наступний -- система універсального тестування, ті ж мінуси, плюс менша гнучкість універсальних тестів, але хоч якась справедливість. Все інше -- фігня.
2. Якщо рішення є, воно мені невідоме. Це як зі співбесідою на роботу і продуктивністю. Є наявні дані з того ж Гарварду, які показують мінімальну залежність між оцінками при вступі і оцінками в універі.
3. Я думаю за критеріями справедливості стосовно знань і зусиль студентів і досягнення кваліфікації при випуску. Як на мене, єдина система, достатньо справедлива і ефективна -- високий але не надмірно високий поріг необхідних знань при вступі і можливість, навіть не можливість, а заохочення того, щоби відраховувати студентів під час навчання за недостатній рівень. Або, альтернативно, можливість розтягнути навчання за додаткові гроші, які платить студент. Така система заодно допускає в міру справедливий розподіл зовнішнього фінансування через стипендії і знижки.
3а. Імхо, єдине, що може щось поміняти -- періодичне зовнішнє оцінювання з штрафами на організаційному рівні, якщо внутрішні і зовнішні оцінки сильно різняться.
malyj_gorgan: (Default)
Замість епіграфа:
Істину кажу я вам, коли на обкладинці книжки, яка претендує на обґрунтування серйозних речей для загалу, пише "Джон Сміт, ПіЕйчДі", то є бздура, шахрайство і маніпуляції. Malyj Gorgan, Ph.D.


Як я і обіцяв, переглянув Проджект 2025 аби перевірити, як вони поводяться зі статистикою. Якась помітна кількість статистики в графіках там була лише в одному розділі -- про освіту. Тема мені, як ви знаєте, близька, я зрадів і як подивився...
Мгм.
Плюси: Прямого пересмикування і брехні там нема. Мінуси: тому що нема причин пересмикувати і брехати. Вони вставили ті графіки просто так, вони ними нічого не доказують. Тобто, вони просто так, без привʼязки до якихось конкретних ідей, вставили в текст кілька графіків. Ну, типу "про освіту ж буде, хай буде графік". Як в анекдоті про воєнрука, який розповідає про трубу, якою їде танк. Для чого танк? Ну, ми ж на військовій кафедрі. Так от, назад до цього прожекту. Графіки там просто так, без всякої привʼязки до ідей тексту, але до графіків прикріплені посилання на джерело. На пару я клацнув, одне, на диво, попало, а в другому, на сторінці 329 (нагадую, документ тут) джерелом довготривалих трендів тестування з математики вказана сторінка з історією цін сироої нафти. Там правда, написано, "accessed March 17, 2023", але навряд чи сайт eia.gov в 23-му році показував на щось інше, а не на US Energy Information Administration. Словом, там не лише графіки просто так, а і посилання на джерела. А навколо посилань -- довга розповідь про те, як з освітою стагнація, тому треба відмінити обмеження і регуляції, хай сімʼя і штати вирішують. Бо все погане зводиться до rules and red tape, якщо їх забрати, все буде о-го-го. Що не заважає їм в іншому місці розповідати, що урядові ОК придумувати правила стосовно того, як (не) вчити дітей про статеву дисфорію і секс, але що ви хочете, то традиціоналісти, без того, щоби поцілувати в дупу еванґелістів, у них рот рухатися не починає.
Може, звичайно, хтось вважає, що це я такий дурний, очевидних посилань в тексті не бачу. Може, але скорше їх там таки нема. Інакше була би хоча би спроба привʼязати десятки ідей "заборонити" і "відмінити" до графіків. Он, пишуть, в Арізоні довший час були кльові на їх думку правила, так, блін, покажіть ті ж самі графіки з Арізоною на фоні середнього або хоча би кількох інших штатів.

У мене два пояснення. Перше: весь цей прожект писали не піейчді (ну, або не піейчді з дисциплін, де думати треба), а аутсорснули у вигляді серії дипломних робіт для випускників якогось з корумпованіших українських вузів. А ті випускники написали, як вміли: текст переписали з шпаргалки від начальника, а картинки повставляли без різниці, які, аби пилу в очі всім напустити. Друге пояснення: це галімий розводняк і скам. Типу популярного нині різання свиней. Скорше, друге. Публіка подивиться: піечді написав, вумні графіки вставлені, посилання на всякі джерела з dot-gov, значить статистика правдива, урядова... І повірить. А потім почне розповідати, що статистика, мовляв, така брехня...
Повбивавби

Profile

malyj_gorgan: (Default)
malyj_gorgan

May 2026

S M T W T F S
     12
3456789
1011 12 13141516
17 181920212223
24252627282930
31      

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 22nd, 2026 01:49 am
Powered by Dreamwidth Studios