Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ (Validation Data)

Π’Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ (Validation Data, Holdout Data – «ΡƒΠ΄Π΅Ρ€ΠΆΠ°Π½Π½Ρ‹Π΅» Π΄Π°Π½Π½Ρ‹Π΅) – это Ρ‡Π°ΡΡ‚ΡŒ ДатасСта (Dataset), основа для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ работоспособности МодСли (Model) Машинного обучСния (ML). ЯвляСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΡ… Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… наряду с Π’Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΌΠΈ (Train Data) ΠΈ ВСстовыми (Test Data) Π΄Π°Π½Π½Ρ‹ΠΌΠΈ.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠ’ΠΈΠΏΡ‹ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΉ датасСта

ΠŸΡ€ΠΈΠΌΠ΅Ρ€. ΠœΡ‹ создаСм модСль, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΡƒΡŽ ΠΏΠΎΡ‚Ρ€Π΅Π±Π»Π΅Π½ΠΈΠ΅ элСктроэнСргии Π² Π³ΠΎΡ€ΠΎΠ΄Π΅. Если Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΠ½Π°, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ чСловСчСскому ΠΌΠΎΠ·Π³Ρƒ, учится Π²ΠΈΠ΄Π΅Ρ‚ΡŒ скачки потрСблСния элСктричСства, Ρ‚ΠΎ Π½Π° тСстовой Π”Π°Ρ‚Π°-сайСнтист (Data Scientist) провСряСт качСство обучСния. Но Π·Π°Ρ‡Π΅ΠΌ ΠΆΠ΅ Π½ΡƒΠΆΠ½Π° валидационная Ρ‡Π°ΡΡ‚ΡŒ?

Когда модСль пытаСтся ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒΡΡ, ΠΎΠ½Π° подыскиваСт ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ значСния Π“ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² (Hyperparameter). Π’ этом случаС сущСствуСт Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠŸΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡ (Overfitting): модСль слишком ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ особСнности ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΎΠ±ΡƒΡ‡ΠΈΠ»Π°ΡΡŒ, ΠΈ ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄Π΅ Π½Π° Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Π±ΡƒΠ΄Π΅Ρ‚ малоэффСктивна. Π§Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ датасСта, ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° любом подходящСм этапС Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ.

Π’ основС всСх ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π»Π΅ΠΆΠΈΡ‚ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠŸΡ€ΠΈΠ½Ρ†ΠΈΠΏ прост: ΠΌΡ‹ случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅ΠΌ Π΄Π°Π½Π½Ρ‹Π΅ Π² ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΈ 70 : 30, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ большая Ρ‡Π°ΡΡ‚ΡŒ отводится Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ, Π° мСньшая – тСстовым. Но Ρ‡Ρ‚ΠΎ Ссли Π² ΠΎΠ΄Π½ΠΎ подмноТСство Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠΏΠ°Π»ΠΈ энСргопотрСбитСли Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ возраста ΠΈΠ»ΠΈ уровня Π΄ΠΎΡ…ΠΎΠ΄Π°? Π­Ρ‚Π° систСматичСская ошибка называСтся Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ (Sampling Bias). Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ нСслучайной Π’Ρ‹Π±ΠΎΡ€ΠΊΠΈ (Sampling) ΠΈΠ· Π“Π΅Π½Π΅Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ совокупности (Population) Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΎΠ΄Π½ΠΈΡ… Ρ‚ΠΈΠΏΠΎΠ² НаблюдСний (Observation) Π² Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ Π½ΠΈΠΆΠ΅, Ρ‡Π΅ΠΌ Ρƒ Π΄Ρ€ΡƒΠ³ΠΈΡ…, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ искаТСнному Π²ΠΎΡΠΏΡ€ΠΈΡΡ‚ΠΈΡŽ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ модСлью.

Π’ΠΈΠ΄Ρ‹ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

Π’Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ:

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΠΌ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΠ΄Π½Π° ΠΈΠ· этих Ρ‚Π΅Ρ…Π½ΠΈΠΊ.

k-блочная кросс-валидация

Π§Ρ‚ΠΎΠ±Ρ‹ свСсти ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡƒ ΡΠΈΡΡ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΊΡƒ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, ΠΌΡ‹ ΠΈΠ·ΠΌΠ΅Π½ΠΈΠΌ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ раздСлСния Π΄Π°Π½Π½Ρ‹Ρ… ВмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠ΄Π½ΠΎ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΡƒΡŽ ΠΈ Ρ‚Π΅ΡΡ‚ΠΎΠ²ΡƒΡŽ части, ΠΌΡ‹ сдСлаСм ΠΈΡ… ΠΌΠ½ΠΎΠ³ΠΎ ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ модСль Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ всС наблюдСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ для обучСния, Ρ‚Π°ΠΊ ΠΈ для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, Π° ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ наблюдСниС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΌΡ‹ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅ΠΌ датасСт Π½Π° 5 ΠΈΠ»ΠΈ 10 частСй: это обСспСчиваСт баланс ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΈ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ.

k-блочная кросс-валидация ΠΈ Scikit-learn

ΠŸΡ€ΠΎΠ΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΠ΅ΠΌ, ΠΊΠ°ΠΊ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° такая валидация Π² Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ Scikit-learn. Для Π½Π°Ρ‡Π°Π»Π° ΠΈΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ:

Π‘ΠΎΠ·Π΄Π°Π΄ΠΈΠΌ ΠΈΠ³Ρ€ΡƒΡˆΠ΅Ρ‡Π½Ρ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹ΠΉ датасСт, Π³Π΄Π΅ X – ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° 4 Ρ… 2, состоящая ΠΈΠ· ΠŸΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…-ΠΏΡ€Π΅Π΄ΠΈΠΊΡ‚ΠΎΡ€ΠΎΠ² (Predictor Variable), Π° y – ЦСлСвая пСрСмСнная (Target Variable), классы, ΠΊ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ Ρ‚ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ΅ наблюдСниС:

ΠŸΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌ k-Π±Π»ΠΎΡ‡Π½ΡƒΡŽ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ Π² Π΄Π²Π΅ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ:

Π’Ρ‹Π²Π΅Π΄Π΅ΠΌ индСксы Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… ΠΈ тСстовых Π΄Π°Π½Π½Ρ‹Ρ… для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Π΄Π²ΡƒΡ… ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ:

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ датасСт скромный, Ρ‚ΠΎ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ: Ρ‚ΠΎ Π² Ρ‚Π΅ΡΡ‚ΠΎΠ²ΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ ΠΏΠΎΠΏΠ°Π΄Π°ΡŽΡ‚ 2-ΠΉ ΠΈ 3-ΠΉ наблюдСния, Ρ‚ΠΎ 0-ΠΉ ΠΈ 1-ΠΉ.

ИспользованиС ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ объСма Π΄Π°Π½Π½Ρ‹Ρ… – это Ρ…ΠΎΡ€ΠΎΡˆΠΎ для ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ такая валидация ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Ноутбук, Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‰ΠΈΠΉ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ настройки Π½Π° ΠΌΠΎΠΌΠ΅Π½Ρ‚ написания ΡΡ‚Π°Ρ‚ΡŒΠΈ, ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Ρ‡Π°Ρ‚ΡŒ здСсь.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Об ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΈ тСстовых Π½Π°Π±ΠΎΡ€Π°Ρ… Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ Dec 6, 2017

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π­Ρ‚ΠΎ дСлаСтся для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΡ‚Π°Ρ‚ΡŒ ΠΊΡ€Π°Ρ‚ΠΊΠΈΠΌ ΡƒΡ‡Π΅Π±Π½ΠΈΠΊΠΎΠΌ для всСх, ΠΊΠΎΠΌΡƒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π·Π½Π°Ρ‚ΡŒ Ρ€Π°Π·Π½ΠΈΡ†Ρƒ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ разбиСниями Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ модСлям машинного обучСния.

Для этой ΡΡ‚Π°Ρ‚ΡŒΠΈ я Π±Ρ‹ ΠΏΡ€ΠΎΡ†ΠΈΡ‚ΠΈΡ€ΠΎΠ²Π°Π» Π±Π°Π·ΠΎΠ²Ρ‹Π΅ опрСдСлСния ΠΈΠ·ΠžΡ‚Π»ΠΈΡ‡Π½Π°Ρ ΡΡ‚Π°Ρ‚ΡŒΡ ДТСйсона Π‘Ρ€Π°ΡƒΠ½Π»ΠΈΠ½Π° Ρ‚Ρƒ ΠΆΠ΅ Ρ‚Π΅ΠΌΡƒ, это довольно Π²ΡΠ΅ΠΎΠ±ΡŠΠ΅ΠΌΠ»ΡŽΡ‰ΠΈΠΉ, Ссли Π²Π°ΠΌ нравится большС Π΄Π΅Ρ‚Π°Π»Π΅ΠΉ, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅ это.

Π£Ρ‡Π΅Π±Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…

Π£Ρ‡Π΅Π±Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…: ΠžΠ±Ρ€Π°Π·Π΅Ρ† Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для соотвСтствия ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ЀактичСский Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ для обучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ (вСса ΠΈ смСщСния Π² случаС Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти). ΠœΠΎΠ΄Π΅Π»ΡŒΠ²ΠΈΠ΄ΠΈΡ‚Π° Ρ‚Π°ΠΊΠΆΠ΅ΡƒΠ·Π½Π°Π΅Ρ‚ΠΈΠ· этих Π΄Π°Π½Π½Ρ‹Ρ….

Набор Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ

Набор Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ: Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ для ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ соотвСтствия ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡƒΡ‡Π΅Π±Π½ΠΎΠΌΡƒ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ настройкС Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠžΡ†Π΅Π½ΠΊΠ° становится Π±ΠΎΠ»Π΅Π΅ прСдвзятой, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π½Π°Π²Ρ‹ΠΊ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Набор ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ Π΄Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΎ это для частой ΠΎΡ†Π΅Π½ΠΊΠΈ. ΠœΡ‹, ΠΊΠ°ΠΊ ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€Ρ‹ машинного обучСния, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ эти Π΄Π°Π½Π½Ρ‹Π΅ для Ρ‚ΠΎΡ‡Π½ΠΎΠΉ настройки Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠžΡ‚ΡΡŽΠ΄Π° ΠΈ модСль изрСдкавидитэти Π΄Π°Π½Π½Ρ‹Π΅, Π½ΠΎ Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π΄Π΅Π»Π°Π΅Ρ‚ ΡΡ‚ΠΎΠ£Ρ‡ΠΈΡ‚ΡŒΡΡ» ΠΈΠ· этого. ΠœΡ‹ (Π² основном люди, ΠΏΠΎ ΠΊΡ€Π°ΠΉΠ½Π΅ΠΉ ΠΌΠ΅Ρ€Π΅, ΠΏΠΎ ΡΠΎΡΡ‚ΠΎΡΠ½ΠΈΡŽ Π½Π° 2017 Π³.) ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° ΠΈ обновляСм Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π±ΠΎΠ»Π΅Π΅ высокого уровня. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΎΠΊ влияСт Π½Π° модСль, Π½ΠΎ косвСнно.

ВСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…

ВСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…: Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, подходящСй для Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… обучСния.

Набор Π΄Π°Π½Π½Ρ‹Ρ… Test прСдоставляСт Π·ΠΎΠ»ΠΎΡ‚ΠΎΠΉ стандарт, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΉ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Он ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ послС Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ модСль ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΠ±ΡƒΡ‡Π΅Π½Π° (с использованиСм Π½Π°Π±ΠΎΡ€ΠΎΠ² ΠΏΠΎΠ΅Π·Π΄ΠΎΠ² ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ). Набор тСстов, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΊΠΎΠ½ΠΊΡƒΡ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π½Π° ΠΌΠ½ΠΎΠ³ΠΈΡ… сорСвнованиях Kaggle Π½Π°Π±ΠΎΡ€ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ выпускаСтся ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ вмСстС с Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΌ Π½Π°Π±ΠΎΡ€ΠΎΠΌ, Π° фактичСский Π½Π°Π±ΠΎΡ€ тСстов выпускаСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚ΠΎΠ³Π΄Π°, ΠΊΠΎΠ³Π΄Π° сорСвнованиС ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ ΠΊ ΠΊΠΎΠ½Ρ†Ρƒ, ΠΈ это Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ опрСдСляСт побСдитСля). Много Ρ€Π°Π· Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΊΠ°ΠΊ Π½Π°Π±ΠΎΡ€ тСстов, Π½ΠΎ это Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ°. ВСстовый Π½Π°Π±ΠΎΡ€, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Ρ…ΠΎΡ€ΠΎΡˆΠΎ курируСтся. Он содСрТит Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ классы, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ столкнСтся модСль ΠΏΡ€ΠΈ использовании Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ ΠΌΠΈΡ€Π΅.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

О коэффициСнтС раздСлСния Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΊΠΎΠ³Π΄Π° Π²Ρ‹ Π·Π½Π°Π΅Ρ‚Π΅, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°ΡŽΡ‚ эти Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΊΠ°Ρ‚ΡŒ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ ваш Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Π½Π°Π±ΠΎΡ€Ρ‹ Train, Validation ΠΈ Test…

Π­Ρ‚ΠΎ Π² основном зависит ΠΎΡ‚ 2 Π²Π΅Ρ‰Π΅ΠΉ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΎΠ±Ρ‰Π΅Π΅ количСство ΠΎΠ±Ρ€Π°Π·Ρ†ΠΎΠ² Π² Π²Π°ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π²ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π½Π° Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π²Ρ‹ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΡƒΠ΅Ρ‚Π΅.

НСкоторыС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½ΡƒΠΆΠ΄Π°ΡŽΡ‚ΡΡ Π² сущСствСнных Π΄Π°Π½Π½Ρ‹Ρ… для обучСния, поэтому Π² этом случаС Π²Ρ‹ Π±Ρ‹ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π½Π°Π±ΠΎΡ€ΠΎΠ². МодСли с ΠΎΡ‡Π΅Π½ΡŒ нСбольшим количСством Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π±ΡƒΠ΄Π΅Ρ‚ Π»Π΅Π³ΠΊΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ ΠΈ Π½Π°ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ Π²Ρ‹, вСроятно, смоТСтС ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ своСго Π½Π°Π±ΠΎΡ€Π° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, Π½ΠΎ Ссли Π² вашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠ½ΠΎΠ³ΠΎ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π²Ρ‹ Ρ‚Π°ΠΊΠΆΠ΅ Π·Π°Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΈΠΌΠ΅Ρ‚ΡŒ большой Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ (хотя Π²Ρ‹ Ρ‚Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ пСрСкрСстная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°). ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Ссли Ρƒ вас Π΅ΡΡ‚ΡŒ модСль Π±Π΅Π· Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΈΠ»ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π»Π΅Π³ΠΊΠΎ настроСны, Π²Π°ΠΌ, вСроятно, Π½Π΅ понадобится ΠΈ Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ!

Π’ Ρ†Π΅Π»ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π²Π΅Ρ‰ΠΈ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, коэффициСнт раздСлСния обучСния ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ достовСрности Ρ‚Π°ΠΊΠΆΠ΅ вСсьма спСцифичСн для вашСго Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π° использования, ΠΈ Π²Π°ΠΌ становится Π»Π΅Π³Ρ‡Π΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ, ΠΊΠΎΠ³Π΄Π° Π²Ρ‹ ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚Π΅ ΠΈ строитС всС большС ΠΈ большС ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π”Π°ΠΉΡ‚Π΅ ΠΌΠ½Π΅ Π·Π½Π°Ρ‚ΡŒ Π² коммСнтариях, Ссли Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΎΠ±ΡΡƒΠ΄ΠΈΡ‚ΡŒ Ρ‡Ρ‚ΠΎ-Π»ΠΈΠ±ΠΎ ΠΈΠ· этого дальшС. Π― Ρ‚Π°ΠΊΠΆΠ΅ ΡƒΡ‡ΡƒΡΡŒ, ΠΊΠ°ΠΊ ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΈΠ· вас, Π½ΠΎ я ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΡΡ‚Π°Ρ€Π°ΡŽΡΡŒ ΠΏΠΎΠΌΠΎΡ‡ΡŒ всСм, Ρ‡Π΅ΠΌ смогу.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’Π΅Ρ…Π±Π»ΠΎΠ³ АлСксандра ΠšΡƒΡ€Π°ΠΊΠΈΠ½Π°

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти

Π‘Ρ‚Ρ€Π°Π½ΠΈΡ†Ρ‹

понСдСльник, 20 августа 2018 Π³.

Π’Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€

Π’ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ постС ΠΌΡ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΠ»ΠΈ ΠΎ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΈ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ ΠΈ тСстовый Π½Π°Π±ΠΎΡ€. Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ позволяСт Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ модСль Π½Π° ΠΎΠ΄Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ Π΅Π΅ Π½Π° Π΄Ρ€ΡƒΠ³ΠΎΠΌ. Π‘ двумя ΠΏΠΎΠ΄Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Ρ€Π°Π±ΠΎΡ‡ΠΈΠΉ процСсс выглядит Ρ‚Π°ΠΊ:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π½Π°Π±ΠΎΡ€Π° Π½Π° Π΄Π²Π΅ части Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ идСя, Π½ΠΎ Π½Π΅ панацСя ΠΎΡ‚ всСх ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ. МоТно Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ шанс пСрСобучСния, раздСляя Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Ρ‚Ρ€ΠΈ части, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Ρ‚Ρ€ΠΈ части

Π’Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² послС Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π—Π°Ρ‚Π΅ΠΌ Π΄Π΅Π»Π°Π΅ΠΌ Π²Ρ‚ΠΎΡ€ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ, примСняя модСль ΠΊ тСстовому Π½Π°Π±ΠΎΡ€Ρƒ, послС Ρ‚ΠΎΠ³ΠΎ ΠΊΠ°ΠΊ ΠΎΠ½Π° ΠΏΡ€ΠΎΡˆΠ»Π° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ Π½Π° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅. Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Π³Ρ€Π°Ρ„ΠΈΠΊ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ‚Π°ΠΊΠΎΠΉ Ρ€Π°Π±ΠΎΡ‡ΠΈΠΉ процСсс:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’ этом ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½Π½ΠΎΠΌ Ρ€Π°Π±ΠΎΡ‡Π΅ΠΌ процСссС:

Π­Ρ‚ΠΎΡ‚ Ρ€Π°Π±ΠΎΡ‡ΠΈΠΉ процСсс Π΄Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ мСньшС взаимодСйствуСт с тСстовым Π½Π°Π±ΠΎΡ€ΠΎΠΌ, поэтому ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π½Π° Π½Π΅ΠΌ становится Π±ΠΎΠ»Π΅Π΅ достовСрной.

РСзюмС

ВСстовый ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ «ΠΈΠ·Π½Π°ΡˆΠΈΠ²Π°ΡŽΡ‚ся» ΠΏΡ€ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠΌ использовании. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, Ρ‡Π΅ΠΌ большС Ρ‚Π΅ ΠΆΠ΅ самыС Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² Ρ…ΠΎΠ΄Π΅ прогнозирования для настройки Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚Π΅ΠΌ мСньшС Π³Π°Ρ€Π°Π½Ρ‚ΠΈΠΉ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ такая модСль Π±ΡƒΠ΄Π΅Ρ‚ Π±ΡƒΠ΄Π΅Ρ‚ Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π³Π΅Π½Π΅Ρ€Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π½Π° Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. НСобходимо ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Π½Π°Π±ΠΎΡ€Ρ‹ ΠΌΠ΅Π΄Π»Π΅Π½Π½Π΅Π΅ «ΠΈΠ·Π½Π°ΡˆΠΈΠ²Π°ΡŽΡ‚ся», Ρ‡Π΅ΠΌ тСстовыС.

Если Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Ρ‚ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΡ€ΠΈΠ³ΠΎΡ‚ΠΎΠ²ΠΈΡ‚ΡŒ большС Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ тСстовый ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π² Ρ…ΠΎΠ΄Π΅ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠŸΠ΅Ρ€Π΅Π²ΠΎΠ΄ ΠΊΠ½ΠΈΠ³ΠΈ Π­Π½Π΄Ρ€ΡŽ Π«Π½Π° Β«Π‘Ρ‚Ρ€Π°ΡΡ‚ΡŒ ΠΊ ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽΒ» Π“Π»Π°Π²Ρ‹ 40 ΠΈ 41

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹ примСняСтС ML Π² условиях, ΠΊΠΎΠ³Π΄Π° распрСдСлСниС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ. НапримСр, ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π°Ρ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° содСрТит изобраТСния ΠΈΠ· Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π° + изобраТСния ΠΈΠ· мобильного прилоТСния, Π° тСстовая ΠΈ валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΠ· мобильного прилоТСния. ΠŸΡ€ΠΈ этом Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ: ΠΎΠ½ ΠΈΠΌΠ΅Π΅Ρ‚ Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΊΡƒ Π½Π° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ ΠΈ тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ…, Ρ‡Π΅ΠΌ Ρ…ΠΎΡ‚Π΅Π»ΠΎΡΡŒ Π±Ρ‹. ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅ΠΌ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹:

НапримСр, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, чСловСчСский ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ распознавания кошСк являСтся практичСски ΠΈΠ΄Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ. Π’Π°Ρˆ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅Π³ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚:

Π’ этом случаС явно присутствуСт ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° нСсоотвСтствия распрСдСлСний Π΄Π°Π½Π½Ρ‹Ρ…. Для Π΅Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚ΡŒ распрСдСлСниС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΊ распрСдСлСниям Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ ΠΈ тСстовой. НиТС Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ΄Π΅ΠΈ, ΠΊΠ°ΠΊ это ΠΌΠΎΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ.

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊΠΎΠ΅ влияниС ΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ каТдая ΠΈΠ· Ρ‚Ρ€Π΅Ρ… ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ, описанных Π²Ρ‹ΡˆΠ΅, Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΠ»Π΅Π·Π½Π° Π΅Ρ‰Π΅ ΠΎΠ΄Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°. ВмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ всС ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ΡΡ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π΅Π΅ Π½Π° Π΄Π²Π° подмноТСства: ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΡƒΡŽ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡƒΡŽ для обучСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΡƒΡŽ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Π·Π²Π°Ρ‚ΡŒ Β«Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° для Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉΒ», эту Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ Π½Π΅ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ ΠΏΡ€ΠΈ Π΅Π³ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Ρƒ вас Π΅ΡΡ‚ΡŒ Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…:

Π’ΠΎΠΎΡ€ΡƒΠΆΠΈΠ²ΡˆΠΈΡΡŒ этими Ρ‡Π΅Ρ‚Ρ‹Ρ€ΡŒΠΌΡ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌΠΈ, ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ:

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ ΠΈΠ· 5-7 Π³Π»Π°Π² ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€Ρƒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹ ΠΊ ΠΏΡ€ΠΈΠ½ΡΡ‚ΠΈΡŽ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π΅ Β«Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ для Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉΒ».

41. ВыявлСниС смСщСния, разброса ΠΈ нСсоотвСтствия Π΄Π°Π½Π½Ρ‹Ρ…

Допустим люди Π΄ΠΎΡΡ‚ΠΈΠ³Π°ΡŽΡ‚ ΠΏΠΎΡ‡Ρ‚ΠΈ идСального качСства (ошибка β‰ˆ0%) Π² Π·Π°Π΄Π°Ρ‡Π΅ обнаруТСния кошСк, ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ ошибки для этой Π·Π°Π΄Π°Ρ‡ΠΈ составляСт ΠΎΠΊΠΎΠ»ΠΎ 0%.

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρƒ нашСго Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

О Ρ‡Π΅ΠΌ это Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚? МоТно ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π²Ρ‹Π²ΠΎΠ΄, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ Π΄Π΅Π»ΠΎ с высоким разбросом. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ разброса, описанныС Ρ€Π°Π½Π΅Π΅, Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΏΠΎΠΌΠΎΡ‡ΡŒ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ качСство Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.
Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ:

Π­Ρ‚ΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° высокоС ΠΈΠ·Π±Π΅Π³Π°Π΅ΠΌΠΎΠ΅ смСшСниС Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Π’.Π΅. Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠ»ΠΎΡ…ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΡƒΠΆΠ΅ Π½Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠŸΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ ΠΊ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡŽ смСщСния Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Π² этом случаС.

Π’ ΠΎΠ±ΠΎΠΈΡ… ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ страдаСт Ρ‚ΠΎΠ»ΡŒΠΊΠΎ высоким ΠΈΠ·Π±Π΅Π³Π°Π΅ΠΌΡ‹ΠΌ смСщСниСм ΠΈΠ»ΠΈ высоким разбросом. Однако, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊ высокоС ΠΈΠ·Π±Π΅Π³Π°Π΅ΠΌΠΎΠ΅ смСщСния, высокий разброс, Ρ‚Π°ΠΊ ΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с нСсоотвСтствиСм Π΄Π°Π½Π½Ρ‹Ρ… Π² Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ….
Рассмотрим Π΅Ρ‰Π΅ Ρ‚Π°ΠΊΡƒΡŽ ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ:

Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС Ρƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° высокоС ΠΈΠ·Π±Π΅Π³Π°Π΅ΠΌΠΎΠ΅ смСщСниС ΠΈ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ Π΄Π΅Π»ΠΎ с нСсоотвСтствиСм Π΄Π°Π½Π½Ρ‹Ρ…. Однако, Π½Π΅Ρ‚ особых ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ с разбросом Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅.
ΠœΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ‰Π΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ, ΠΊΠ°ΠΊ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ‚ΠΈΠΏΡ‹ ошибок связаны Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ, Ссли ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΈΡ… Π² Π²ΠΈΠ΄Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠ°Ρ рассмотрСниС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° с Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ кошСк, располоТим Π½Π° оси Π₯ Π΄Π²Π° Ρ€Π°Π·Π½Ρ‹Ρ… распрСдСлСния Π΄Π°Π½Π½Ρ‹Ρ…. На оси Y располоТим Ρ‚Ρ€ΠΈ Ρ‚ΠΈΠΏΠ° ошибок: ошибка Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°, ошибка Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… для обучСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΈ ошибка Π² ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ…, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π½Π΅ обучался. ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π·Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ поля значСниями Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ‚ΠΈΠΏΠΎΠ² ошибок, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ»ΠΈ Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ Π³Π»Π°Π²Π΅.

ΠŸΡ€ΠΈ ΠΆΠ΅Π»Π°Π½ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΎΡΡ‚Π°Π²ΡˆΠΈΠ΅ΡΡ Π΄Π²Π° поля Π² этой Ρ‚Π°Π±Π»ΠΈΡ†Π΅. МоТно Π·Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π΅ Π² Π²Π΅Ρ€Ρ…Π½Π΅ΠΌ ΠΏΡ€Π°Π²ΠΎΠΌ ΡƒΠ³Π»Ρƒ (качСство Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° Π½Π° изобраТСниях, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ· мобильного прилоТСния), Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, попросив Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… подписчиков Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ изобраТСния ΠΈΠ· вашСго мобильного Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΎΡ€Π° ΠΊΠΎΡ‚ΠΎΠ² ΠΈ ΠΈΠ·ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ ΠΈΡ… ΠΎΡˆΠΈΠ±ΠΊΡƒ. МоТно Π·Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ ΠΊΠ»Π΅Ρ‚ΠΊΡƒ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅, взяв изобраТСния кошСк ΠΈΠ· мобильного прилоТСния (распрСдСлСниС B) ΠΈ помСстив ΠΈΡ… Π½Π΅Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΡƒΡŽ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ нСйронная ΡΠ΅Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°Π»Π°ΡΡŒ Π½Π° Π½Π΅ΠΌ Ρ‚ΠΎΠΆΠ΅. Π—Π°Ρ‚Π΅ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° этом подмноТСствС Π΄Π°Π½Π½Ρ‹Ρ…. Π—Π°ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½Ρ‹Ρ… Π΄Π²ΡƒΡ… Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΊΠ»Π΅Ρ‚ΠΎΠΊ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ даст ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΎΡ‚Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ Π½Π° этих Π΄Π²ΡƒΡ… Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ распрСдСлСниях Π΄Π°Π½Π½Ρ‹Ρ… (РаспрСдСлСниС A ΠΈ B).

ΠžΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ², с ΠΊΠ°ΠΊΠΈΠΌΠΈ Ρ‚ΠΈΠΏΠ°ΠΌΠΈ ошибок Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ испытываСт наибольшиС трудности, ΠΌΠΎΠΆΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ обосновано Ρ€Π΅ΡˆΠΈΡ‚ΡŒ, слСдуСт Π»ΠΈ ΡΠΎΡΡ€Π΅Π΄ΠΎΡ‚ΠΎΡ‡ΠΈΡ‚ΡŒΡΡ Π½Π° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠΈ смСщСния, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠΈ разброса ΠΈΠ»ΠΈ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠ·Π°Π΄Π°Ρ‡ΠΈΡ‚ΡŒΡΡ Π±ΠΎΡ€ΡŒΠ±ΠΎΠΉ с нСсоотвСтствиСм Π΄Π°Π½Π½Ρ‹Ρ….

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Валидация ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

На связи ΠΊΠΎΠΌΠ°Π½Π΄Π° Advanced Analytics GlowByte ΠΈ сСгодня ΠΌΡ‹ Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
Иногда Ρ‚Π΅Ρ€ΠΌΠΈΠ½ «валидация» ассоциируСтся с вычислСниСм ΠΎΠ΄Π½ΠΎΠΉ Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ статистичСской ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ROC AUC) Π½Π° ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…. Однако Ρ‚Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ ряду ошибок.

Π’ ΡΡ‚Π°Ρ‚ΡŒΠ΅ Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ, ΠΎ ΠΊΠ°ΠΊΠΈΡ… ΠΎΡˆΠΈΠ±ΠΊΠ°Ρ… ΠΈΠ΄Π΅Ρ‚ Ρ€Π΅Ρ‡ΡŒ, ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ рассмотрим процСсс Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΈ Π΄Π°Π΄ΠΈΠΌ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ Π½Π° вопросы:

Π Π°ΡΡˆΠΈΡ€ΡΠ΅ΠΌ понятиС Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

Π§Ρ‚ΠΎ Π½Π΅ Ρ‚Π°ΠΊ с Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠ΅ΠΉ ΠΊΠ°ΠΊ вычислСниСм ΠΎΠ΄Π½ΠΎΠΉ Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ статистичСской ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π½Π° ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…?

АргумСнт ΠΏΡ€ΠΎΡ‚ΠΈΠ² β„– 1: ΠΎΠ΄Π½Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡ‡Π΅ΡΡ‚ΡŒ всС аспСкты качСства ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠšΠ°Ρ‡Π΅ΡΡ‚Π²ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ измСряСтся Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΡŽ, Π½ΠΎ ΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ Π²ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ.

АргумСнт ΠΏΡ€ΠΎΡ‚ΠΈΠ² β„– 2: количСствСнныС ΠΎΡ†Π΅Π½ΠΊΠΈ Π½Π΅ всСгда ΡΠΎΠ³Π»Π°ΡΡƒΡŽΡ‚ΡΡ с бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ ΠΈ поэтому вводятся Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅. НапримСр, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ модСль с Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ ΠΈΠ½Ρ‚Π΅Π³Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ, Π½ΠΎ ΠΏΡ€ΠΈ ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠ΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² Ρ€Π°Π·Ρ€Π΅Π·Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒΡΡ, Ρ‡Ρ‚ΠΎ Ρ„Π°ΠΊΡ‚ΠΎΡ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎ бизнСс-Π»ΠΎΠ³ΠΈΠΊΠ΅ ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ значСния Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΠ½ΠΈΠΆΠ°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ, Π² Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚, Π΅Π³ΠΎ ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚.

АргумСнт ΠΏΡ€ΠΎΡ‚ΠΈΠ² β„– 3: точСчная ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠΆΠ΅Ρ‚ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² зависимости ΠΎΡ‚ состава Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, особСнно это касаСтся Π½Π΅ сбалансированных Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ (с ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ классов 1:50 ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ Π·Π½Π°Ρ‡ΠΈΠΌΡ‹ΠΌ пСрСкосом). ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ стоит Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΎΡ†Π΅Π½ΠΊΠΈ.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

АргумСнт ΠΏΡ€ΠΎΡ‚ΠΈΠ² β„– 4: Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ ΠΎΡ‚ историчСских, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π±Ρ‹Π»Π° построСна модСль, поэтому Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ стоит Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΈ Π½Π° Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΌ срСзС Π΄Π°Π½Π½Ρ‹Ρ….

АргумСнт ΠΏΡ€ΠΎΡ‚ΠΈΠ² β„– 5: Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой Π½Π°Π±ΠΎΡ€ Π½Π΅ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… (ΠΏΠΎ слоТности ΠΈ ΠΏΠ΅Ρ€Π΅Ρ‡Π½ΡŽ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ) скриптов, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ нСточности ΠΈΠ»ΠΈ Π½Π΅ΡƒΡ‡Ρ‚Π΅Π½Π½Ρ‹Π΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ повСдСния. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ для ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ всСго ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΠ΄Π³ΠΎΡ‚Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌΠΎΠΉ ΠΊ Ρ€Π°Π·Π²Π΅Ρ€Ρ‚Ρ‹Π²Π°Π½ΠΈΡŽ, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ стоит ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ зависимости ΠΌΠ΅ΠΆΠ΄Ρƒ скриптами Π² ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π΅, Π½ΠΎ ΠΈ порядок ΠΈΡ… запуска: ΠΏΡ€ΠΈ нСсоблюдСнии порядка ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΡ‚Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π±Π΅Π· ошибок, Π½ΠΎ ΡΡ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎ Π½Π΅ Π²Π΅Ρ€Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Валидация ΠΈ ΠΆΠΈΠ·Π½Π΅Π½Π½Ρ‹ΠΉ Ρ†ΠΈΠΊΠ» ΠΌΠΎΠ΄Π΅Π»ΠΈ

Валидация β€” комплСксный процСсс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ осущСствляСтся Π½Π° протяТСнии всСго ΠΆΠΈΠ·Π½Π΅Π½Π½ΠΎΠ³ΠΎ Ρ†ΠΈΠΊΠ»Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π•Π΅ ΠΌΠΎΠΆΠ½ΠΎ Π΄Π΅ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π° составныС части Π² соотвСтствии с этапами ΠΆΠΈΠ·Π½Π΅Π½Π½ΠΎΠ³ΠΎ Ρ†ΠΈΠΊΠ»Π°. На схСмС Π½ΠΈΠΆΠ΅ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½ΠΎ:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€ΠΎΡ„ΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ (Π°ΡƒΠ΄ΠΈΡ‚ Π²ΠΈΡ‚Ρ€ΠΈΠ½Ρ‹) осущСствляСтся Π½Π° этапС ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. Π—Π΄Π΅ΡΡŒ провСряСтся соотвСтствиС собранных Π΄Π°Π½Π½Ρ‹Ρ… поставлСнной Π·Π°Π΄Π°Ρ‡Π΅, Π° Ρ‚Π°ΠΊΠΆΠ΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ простых ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, число пропусков Π² Π΄Π°Π½Π½Ρ‹Ρ…, Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π² Ρ€Π°Π·Ρ€Π΅Π·Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ²) опрСдСляСтся качСство Π²ΠΈΡ‚Ρ€ΠΈΠ½Ρ‹.

Когда модСль построСна, выполняСтся пСрвичная валидация, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚ΠΎΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ†Π΅Π»Π΅ΡΠΎΠΎΠ±Ρ€Π°Π·Π½ΠΎΡΡ‚ΡŒ внСдрСния Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

На этапС внСдрСния проводится Π΄Π²Π° Π²ΠΈΠ΄Π° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΎΠΊ.

Π’ΡƒΡ‚ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΡΠ²ΠΈΡ‚ΡŒΡΡ вопрос, Ρ‡Π΅ΠΌ валидация отличаСтся ΠΎΡ‚ ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π°. Если ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΎ, Ρ‚ΠΎ ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ β€” Π±ΠΎΠ»Π΅Π΅ лСгковСсный процСсс, ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠΌΡ‹ΠΉ с большСй частотой.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠœΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

ВсС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ ΠΏΡ€ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ тСсты ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Π΄Π²Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹: количСствСнныС ΠΈ качСствСнныС.

Π’ качСствС Π°Ρ€Ρ‚Π΅Ρ„Π°ΠΊΡ‚Π° ΠΏΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ прСдоставляСтся ΠΎΡ‚Ρ‡Π΅Ρ‚:

Рассмотрим Π΄Π΅Ρ‚Π°Π»ΡŒΠ½Π΅Π΅ список тСстов для ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° вСроятности Π΄Π΅Ρ„ΠΎΠ»Ρ‚Π° (PD-ΠΌΠΎΠ΄Π΅Π»ΠΈ) ΠΏΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠΌΡƒ Π΄ΠΎΠ³ΠΎΠ²ΠΎΡ€Ρƒ (ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎ PD-модСлях см. [1]).

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²Π΅Π½Π½Π°Ρ ΠΎΡ†Π΅Π½ΠΊΠ°

К Π³Ρ€ΡƒΠΏΠΏΠ΅ относятся расчСты ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΈ статистичСскиС тСсты, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… этапах ΠΈ Ρ€Π°Π·Π½Ρ‹Ρ… уровнях (пСрСчисляСм Π½Π΅ всС, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅).

1. Дискриминационная ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ

ПослС Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ вопрос, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ интСрСсуСт бизнСс-Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊΠ°: Π° насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ модСль справляСтся со своСй Π·Π°Π΄Π°Ρ‡Π΅ΠΉ? Если ΠΌΡ‹ построили PD-модСль, Ρ‚ΠΎ этот вопрос Π·Π²ΡƒΡ‡ΠΈΡ‚ Ρ‚Π°ΠΊ: насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ модСль отдСляСт ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠΉΠ΄ΡƒΡ‚ Π² Π΄Π΅Ρ„ΠΎΠ»Ρ‚, ΠΎΡ‚ Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ Π² Π΄Π΅Ρ„ΠΎΠ»Ρ‚ Π½Π΅ ΡƒΠΉΠ΄Π΅Ρ‚, ΠΈ насколько Π»ΡƒΡ‡ΡˆΠ΅ эта модСль, Ρ‡Π΅ΠΌ случайноС ΡƒΠ³Π°Π΄Ρ‹Π²Π°Π½ΠΈΠ΅?

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° это вопрос, ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠΌ тСсты:

Π’ случаС Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события коэффициСнт Π”ΠΆΠΈΠ½ΠΈ рассчитываСтся ΠΊΠ°ΠΊ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠ»ΠΎΡ‰Π°Π΄Π΅ΠΉ Π΄Π²ΡƒΡ… Ρ„ΠΈΠ³ΡƒΡ€:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠΠ»ΡŒΡ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ способ опрСдСлСния ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ β€” ΠΏΡƒΠ·Ρ‹Ρ€ΡŒΠΊΠΎΠ²Π°Ρ сортировка (ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ см. [2]). ΠŸΡƒΡΡ‚ΡŒ имССтся список Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события, порядок Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ совпадаСт с порядком Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ вСроятности, ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… модСлью. Π’ΠΎΠ³Π΄Π° ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ Swaps Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ количСство пСрСстановок сосСдних элСмСнтов для привСдСния списка Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… событий ΠΊ отсортированному Π²ΠΈΠ΄Ρƒ Π±Π΅Π· инвСрсий.

На ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Π½ΠΈΠΆΠ΅ число Ρ‚Π°ΠΊΠΈΡ… пСрСстановок Swaps = 2.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π³Π΄Π΅: Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном обучСнии– число пСрСстановок для Π²Π°Π»ΠΈΠ΄ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном обучСнии– для случайной ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Однако, ΠΊΠ°ΠΊ Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· Ρ‚Π°ΠΊΠΎΠΉ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ, рост коэффициСнта Π”ΠΆΠΈΠ½ΠΈ Π½Π΅ всСгда ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠΎΠ»ΡŒΠ·Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ для бизнСса, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π½Π΅ ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ измСнСния Π² Ρ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Π² сСгмСнтС ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ интСрСсСн с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния бизнСса. Π’Π΅Π΄ΡŒ ΠΏΡ€ΠΈ подсчСтС пСрСстановок Π½Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ элСмСнтов: Π½Π° рисункС Π½ΠΈΠΆΠ΅ ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½Ρ‹ Π΄Π²Π΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠ»ΡƒΡ‡ΡˆΠ°ΡŽΡ‚ Π±Π°Π·ΠΎΠ²ΡƒΡŽ Π½Π° ΠΎΠ΄Π½Ρƒ пСрСстановку: Π΄ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π° отсСчки ΠΈ послС. ОбС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ°Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π”ΠΆΠΈΠ½ΠΈ, Π½ΠΎ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния бизнСс-постановки Π·Π°Π΄Π°Ρ‡ΠΈ пСрвая модСль Π»ΡƒΡ‡ΡˆΠ΅, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ Ρ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ послС ΠΏΠΎΡ€ΠΎΠ³Π°, срСди ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π΄Π°Π½ ΠΊΡ€Π΅Π΄ΠΈΡ‚. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π°Ρ€Π°Π²Π½Π΅ с Π”ΠΆΠΈΠ½ΠΈ Π½ΡƒΠΆΠ½Ρ‹ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ β€” ΠΎ Π½ΠΈΡ… дальшС.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

О расчСтС коэффициСнта Π”ΠΆΠΈΠ½ΠΈ для Π½Π΅Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… событий см. Π² ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΈΠ· Ρ†ΠΈΠΊΠ»Π° ΠΏΡ€ΠΎ риск-ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ([3]).

Если Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π΅ сбалансированы, Ρ‚ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΡŒΠ½Π°Ρ ΠΎΡ†Π΅Π½ΠΊΠ° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ бутстрэп. На основС исходной Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ гСнСрируСтся B (

1000 ΠΈ Π±ΠΎΠ»Π΅Π΅) ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ, для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… рассчитываСтся коэффициСнт Π”ΠΆΠΈΠ½ΠΈ. Π—Π°Ρ‚Π΅ΠΌ провСряСтся, Ρ‡Ρ‚ΠΎ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΉ Π·Π°Ρ€Π°Π½Π΅Π΅ ΠΏΠ΅Ρ€Ρ†Π΅Π½Ρ‚ΠΈΠ»ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠ³ΠΎ распрСдСлСния Π½Π΅ пСрСсСкаСт фиксированный ΠΏΠΎΡ€ΠΎΠ³ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ссли 2.5% ΠΏΠ΅Ρ€Ρ†Π΅Π½Ρ‚ΠΈΠ»ΡŒ распрСдСлСния коэффициСнтов Π”ΠΆΠΈΠ½ΠΈ мСньшС 30%, Ρ‚ΠΎ ΠΏΠΎ тСсту ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ выставлСна ΠΎΡ†Π΅Π½ΠΊΠ° Π² Π²ΠΈΠ΄Π΅ красного сигнала).

Однако Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ бутстрэпа – Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ слоТная Π·Π°Π΄Π°Ρ‡Π°, которая ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°Π½ΡΡ‚ΡŒ Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ врСмя. Π‘ Ρ†Π΅Π»ΡŒΡŽ Π΅Π΅ ускорСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ пуассоновский бутстрэп.

Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π΅Π½ΠΈΠ΅ΠΌ элСмСнтов Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° n с фиксированной Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π½Π° сэмплированиС с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ биномиального распрСдСлСния Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном обучСниичастот появлСния ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ элСмСнта Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠŸΡ€ΠΈ условии достаточно большого Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ выполняСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ ΠΎΡ‚ биномиального распрСдСлСния ΠΊ пуассоновскому [4]:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

2. ΠžΡ†Π΅Π½ΠΊΠ° ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ

ΠœΡ‹ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ модСль, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠ»ΠΈ Π΅Π΅ Π΄ΠΈΡΠΊΡ€ΠΈΠΌΠΈΠ½Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ, Π·Π°Π΄Π΅ΠΏΠ»ΠΎΠΈΠ»ΠΈ, Π½ΠΎ спустя нСсколько мСсяцСв ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡƒΡ…ΡƒΠ΄ΡˆΠΈΠ»ΠΈΡΡŒ. ПослС выяснСния ΠΏΡ€ΠΈΡ‡ΠΈΠ½ оказалось, Ρ‡Ρ‚ΠΎ для обучСния Π±Ρ‹Π»ΠΈ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π½Ρ‹ Π½Π΅Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅. ВСрнСмся Π½Π°Π·Π°Π΄ Π²ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΡƒΡŽ ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ ΠΈ Π΄ΠΎΠ±Π°Π²ΠΈΠΌ Π΅Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ Π±Π»ΠΎΠΊ Π² ΠΎΡ‚Ρ‡Π΅Ρ‚ ΠΎ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ: ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒ.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π³Π΄Π΅: Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈβ€” доля наблюдСний с i-ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°; Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈβ€” количСство наблюдСний, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… i-ΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°; Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈβ€” ΠΎΠ±Ρ‰Π΅Π΅ количСство наблюдСний Π² Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ ( Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈβ€” валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°, Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈβ€” Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ). (Если Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΏΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Π² ΠΊΠ°ΠΊΠΈΡ… случаях Π΅Ρ‰Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ PSI, см. Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡΡ‚Π°Ρ‚ΡŒΡŽ ΠΏΡ€ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ LGD ΠΈΠ· Ρ†ΠΈΠΊΠ»Π° ΠΏΡ€ΠΎ риск-ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ [3].)

Один ΠΈΠ· способов ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ PSI – Ρ‡Π΅Ρ€Π΅Π· Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ ΠšΡƒΠ»ΡŒΠ±Π°ΠΊΠ°β€“Π›Π΅ΠΉΠ±Π»Π΅Ρ€Π° [5], ΠΌΠ΅Ρ€Ρƒ удалСнности Π΄Π²ΡƒΡ… распрСдСлСний P ΠΈ Q:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠœΠ΅Ρ€Π° нСсиммСтрична (Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ) ΠΈ ΠΈΠ· Π΄Π²ΡƒΡ… срСзов Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΡ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅ΠΌ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π°ΠΏΡ€ΠΈΠΎΡ€Π½ΠΎΠ΅ распрСдСлСниС, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ сравнСниС, поэтому для симмСтричности ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ сумму Π΄Π²ΡƒΡ… ΠΌΠ΅Ρ€ ΠΎΡ‚ P Π΄ΠΎ Q ΠΈ ΠΎΡ‚ Q Π΄ΠΎ P:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Когда ΠΌΡ‹ ΡƒΠ±Π΅Π΄ΠΈΠ»ΠΈΡΡŒ Π² ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½Π°Π΄ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² сформированных ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ… соотвСтствуСт ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌ значСниям Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события. Для этого примСняСтся ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ°. Π—Π΄Π΅ΡΡŒ ΠΌΡ‹ ΠΊΡ€Π°Ρ‚ΠΊΠΎ остановимся Π½Π° Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΎΠ½Π° Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚, подробности Π±ΡƒΠ΄ΡƒΡ‚ описаны Π² ΡΡ‚Π°Ρ‚ΡŒΠ΅, которая Π²Ρ‹ΠΉΠ΄Π΅Ρ‚ Ρ‡ΡƒΡ‚ΡŒ ΠΏΠΎΠ·ΠΆΠ΅ (stay tuned).

МодСль считаСтся Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΎΡ‚ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ, Ссли фактичСский ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события (доля наблюдСний с фактичСским Ρ†Π΅Π»Π΅Π²Ρ‹ΠΌ событиСм = 1) Π±Π»ΠΈΠ·ΠΎΠΊ ΠΊ срСднСй ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ модСлью вСроятности. Для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ ΠΏΠΎΠΏΠ°Π΄Π°Π½ΠΈΠ΅ наблюдаСмого уровня Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события Π² Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» прСдсказанных модСлью вСроятностСй Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события: Π² Ρ†Π΅Π»ΠΎΠΌ ΠΏΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ»ΠΈ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… Π±Π°ΠΊΠ΅Ρ‚ΠΎΠ² прСдсказанной вСроятности.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ тСстов ΠΈ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ:

Для провСдСния биномиального тСста Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ всСх вСроятностСй Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события разбиваСтся Π½Π° Π±Π°ΠΊΠ΅Ρ‚Ρ‹ ΠΏΠΎ принятой Π² финансовой ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ шкалС (мастСр-шкалС) ΠΈΠ»ΠΈ ΠΏΠΎ пСрцСнтилям. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π±Π°ΠΊΠ΅Ρ‚Π° рассчитываСтся Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» ΠΏΠΎ прСдсказаниям ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ опрСдСляСтся, ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ‚ Π»ΠΈ фактичСский ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Π΄Π΅Ρ„ΠΎΠ»Ρ‚Π° Π² Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π».

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Для формирования ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎ стратСгии взаимодСйствия с ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡƒΡ‚ΡŒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ разряд ΠΏΠΎ Π·Π°Ρ€Π°Π½Π΅Π΅ Π·Π°Π΄Π°Π½Π½ΠΎΠΉ шкалС Π½Π° основС значСния вСроятности Π΄Π΅Ρ„ΠΎΠ»Ρ‚Π°, спрогнозированного модСлью. Π’ Ρ‚Π°ΠΊΠΎΠΌ случаС стоит ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² распрСдСлСнии наблюдСний ΠΏΠΎ разрядам Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΎΠ²ΠΎΠΉ ΡˆΠΊΠ°Π»Ρ‹ отсутствуСт пСрСкос. Π˜Π½Ρ‹ΠΌΠΈ словами, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ ΠΏΠΎΠΏΠ°Π΄Π°Π½ΠΈΠ΅ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π° всСх наблюдСний Π² ΠΎΠ΄ΠΈΠ½-Π΄Π²Π° разряда ΠΈΠ· всСго Π½Π°Π±ΠΎΡ€Π°.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΊΠΎΠ½Ρ†Π΅Π½Ρ‚Ρ€Π°Ρ†ΠΈΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ индСкс Π₯Срфиндаля–Π₯ΠΈΡ€ΡˆΠΌΠ°Π½Π° ΠΊΠ°ΠΊ Π² Ρ†Π΅Π»ΠΎΠΌ ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, Ρ‚Π°ΠΊ ΠΈ Π² Ρ€Π°Π·Ρ€Π΅Π·Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… сСгмСнтов.

РассчитываСтся ΠΏΠΎ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅:

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Подводя ΠΈΡ‚ΠΎΠ³ этого Ρ€Π°Π·Π΄Π΅Π»Π°, ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΈΠΌ риск-Π·ΠΎΠ½Ρ‹. Π’ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΡƒΠΊΠ°Π·Π°Π½Ρ‹ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Π΅ значСния риск-Π·ΠΎΠ½.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠœΡ‹ пСрСчислили тСсты, ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹Π΅ ΠΊ модСлям Π² Ρ€Π°Π·Π½Ρ‹Ρ… Π΄ΠΎΠΌΠ΅Π½Π½Ρ‹Ρ… областях. Но ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Ρ€Π°ΠΆΠ°ΡŽΡ‚ спСцифику ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π°. НапримСр, ΠΏΡ€ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… рисков ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ установлСно Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅, связанноС с пропускной ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΡŽ подраздСлСния, проводящСго расслСдования ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°Π½Π½Ρ‹ΠΌ модСлью ΠΏΠΎΠ΄ΠΎΠ·Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ наблюдСниям. ПослС Ρ‚ΠΎΠ³ΠΎ ΠΊΠ°ΠΊ модСль присвоила скоры всСм ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ, Ρ‚ΠΎΠΏ 1% ΠΈΠ»ΠΈ 5% ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΏΠΎ скору пСрСдаСтся для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Ρ‚Π°ΠΊΠΎΠΌΡƒ ΠΏΠΎΠ΄Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΡŽ, Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΠΈ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒΡΡ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ максимальноС число ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² с y_true=1 ΠΏΠΎΠΏΠ°Π»ΠΈ Π² Ρ‚ΠΎΠΏ 1% ΠΈΠ»ΠΈ Ρ‚ΠΎΠΏ 5%.

Π’Π°ΠΊΠΆΠ΅ для ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ прСдусмотрСны спСцифичСскиС тСсты. НапримСр, для LGD-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Loss Shortfall.

Loss Shortfall – ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, ΡƒΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰Π°Ρ, насколько ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΎΡ‚ фактичСского Π΄Π΅Ρ„ΠΎΠ»Ρ‚Π° оказались Π½ΠΈΠΆΠ΅, Ρ‡Π΅ΠΌ Π±Ρ‹Π»ΠΎ прСдсказано модСлью (ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ° расчСта описана Π² [3]). По шкалС выставлСния ΠΎΡ†Π΅Π½ΠΊΠΈ для ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Loss Shortfall Π²ΠΈΠ΄Π½ΠΎ (см. рисунок Π½ΠΈΠΆΠ΅), Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° риска Π² Π΄Π°Π½Π½ΠΎΠΌ случаС производится консСрвативно, модСль считаСтся Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚Π΅Ρ… случаях, ΠΊΠΎΠ³Π΄Π° прСдсказанныС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ Π²Ρ‹ΡˆΠ΅, Ρ‡Π΅ΠΌ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Π΅.

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠšΠ°Ρ‡Π΅ΡΡ‚Π²Π΅Π½Π½Ρ‹Π΅ тСсты

НС всС аспСкты качСства ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ количСствСнно, поэтому вмСстС с Π½ΠΈΠΌΠΈ ΠΏΡ€ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ качСствСнныС тСсты. Π§Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ с ΠΈΡ… ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ?

1. ΠšΠ°Ρ‡Π΅ΡΡ‚Π²ΠΎ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Для обСспСчСния воспроизводимости ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠ° Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ докумСнтация.

ΠžΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ², насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π·Π°Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹:

2. Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ качСство ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…:

Π—Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊ ΠΌΠΎΠΆΠ΅Ρ‚ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π·Π°ΠΏΡ€ΠΎΡΠΈΡ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ: Ссли это рСгрСссионная модСль, Ρ‚ΠΎ коэффициСнты Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²; Ссли decision tree/decision list, Ρ‚ΠΎ Π½Π°Π±ΠΎΡ€ ΠΏΡ€Π°Π²ΠΈΠ»; Ссли Π±ΠΎΠ»Π΅Π΅ слоТныС ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚ΠΎ ΠΎΡ‚Ρ‡Π΅Ρ‚ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ‚ΠΎΡ€ΠΎΠ² SHAP/LIME.

Π­Ρ‚Π° информация ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΎΠΉΡ‚ΠΈ ΠΏΡ€ΠΈΠ΅ΠΌΠΊΡƒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ наглядно ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ всС Π²Π°ΠΆΠ½Ρ‹Π΅ Ρ„ΠΈΡ‡ΠΈ, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… модСль Π΄Π΅Π»Π°Π΅Ρ‚ Π²Ρ‹Π²ΠΎΠ΄Ρ‹, ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½Ρ‹ бизнСс-Π»ΠΎΠ³ΠΈΠΊΠΎΠΉ.

Model performance predictor (MPP)

Π’ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π±Ρ‹Π²Π°Π΅Ρ‚ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ события, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄ΡƒΡ‚ спустя мСсяцы. НапримСр, ΠΊΠ»ΠΈΠ΅Π½Ρ‚ Π½Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ свои ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π²Π° ΠΏΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠΌΡƒ Π΄ΠΎΠ³ΠΎΠ²ΠΎΡ€Ρƒ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π³ΠΎΠ΄Π°. Из-Π·Π° этого Π»Π°Π³Π° Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°: ΠΊΠ°ΠΊ ΠΏΠΎΠ½ΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ модСль стала Ρ…ΡƒΠΆΠ΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ, Π΄ΠΎ Ρ‚ΠΎΠ³ΠΎ ΠΊΠ°ΠΊ ΠΌΡ‹ смоТСм ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ это, Π΄ΠΎ получСния фактичСских Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ события?

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Ρ‚Π°ΠΊΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ наряду с основной строится Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ модСль β€” Model Performance Predictor (MPP) [6].

Π‘Ρ…Π΅ΠΌΠ° обучСния MPP-ΠΌΠΎΠ΄Π΅Π»ΠΈ

Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Π·Π°Ρ‡Π΅ΠΌ Π½ΡƒΠΆΠ½Π° валидационная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ MPP-ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ тСстовая Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° основной ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π¨Π°Π³ΠΈ ΠΏΠΎ ΠΏΠΎΡΡ‚Ρ€ΠΎΠ΅Π½ΠΈΡŽ MPP-ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π’ Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½ΠΈΠ΅ сформулируСм ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΡŽΡ‚, Ρ‡Ρ‚ΠΎ валидация ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ эффСктивна:

Π‘ΠΈΠ½Π°Ρ€Π½ΠΎΠ΅ Ρ†Π΅Π»Π΅Π²ΠΎΠ΅ событиС:

ВСстБлокВиды тСстирования ΠΏΠΎ ΡƒΡ€ΠΎΠ²Π½ΡŽ «модСль/Ρ„Π°ΠΊΡ‚ΠΎΡ€Β»Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΡƒΡ€ΠΎΠ²Π½ΠΈ тСстирования
Π”ΠΆΠΈΠ½ΠΈ индСкс: Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ / Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ВСст ΠšΠΎΠ»ΠΌΠΎΠ³ΠΎΡ€ΠΎΠ²Π°β€“Π‘ΠΌΠΈΡ€Π½ΠΎΠ²Π°ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
IVΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ВСст Ρ…ΠΈ-ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠšΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ°ΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
Π‘ΠΈΠ½ΠΎΠΌΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ‚Π΅ΡΡ‚ΠšΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ°ΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
Π”ΠΆΠΈΠ½ΠΈ индСкс: ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΠΠ±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ / ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ срСза
PSIΠ‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ / Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ВСст ΠšΠΎΠ»ΠΌΠΎΠ³ΠΎΡ€ΠΎΠ²Π°β€“Π‘ΠΌΠΈΡ€Π½ΠΎΠ²Π°Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ИндСкс Π₯Срфиндаля–Π₯ΠΈΡ€ΡˆΠΌΠ°Π½Π°ΠšΠΎΠ½Ρ†Π΅Π½Ρ‚Ρ€Π°Ρ†ΠΈΡΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
VIFΠ”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
ΠŸΠ°Ρ€Π½Π°Ρ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡΠ”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
Π—Π½Π°Ρ‡ΠΈΠΌΠΎΡΡ‚ΡŒ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² (p-value)Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
ВСстБлокВиды тСстирования ΠΏΠΎ ΡƒΡ€ΠΎΠ²Π½ΡŽ «модСль/Ρ„Π°ΠΊΡ‚ΠΎΡ€Β»Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΡƒΡ€ΠΎΠ²Π½ΠΈ тСстирования
Π”ΠΆΠΈΠ½ΠΈ индСкс (Loss Capture Ratio): Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ / Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ΠšΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡ Π‘ΠΏΠΈΡ€ΠΌΠ΅Π½Π°: Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ / Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
MAEΠšΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ°ΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
ВСст ΠœΠ°Π½Π½Π°β€“Π£ΠΈΡ‚Π½ΠΈΠšΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ°ΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ модСлиПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
Π”ΠΆΠΈΠ½ΠΈ индСкс (Loss Capture Ratio): ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΠΠ±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ / ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ срСза
ΠšΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡ Π‘ΠΏΠΈΡ€ΠΌΠ΅Π½Π°: ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΠΠ±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ / ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ срСза
PSIΠ‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ / Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
ВСст ΠšΠΎΠ»ΠΌΠΎΠ³ΠΎΡ€ΠΎΠ²Π°β€“Π‘ΠΌΠΈΡ€Π½ΠΎΠ²Π°Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²ΠŸΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ / Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сСгмСнтов
VIFΠ”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
ΠŸΠ°Ρ€Π½Π°Ρ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡΠ”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅
Π—Π½Π°Ρ‡ΠΈΠΌΠΎΡΡ‚ΡŒ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² (p-value)Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΠ° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² для Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… модСлСйПо всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΈΠ»ΠΈ: Илья Могильников (EienKotowaru), АлСксандр Π‘ΠΎΡ€ΠΎΠ΄ΠΈΠ½ (abv_gbc)

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *