ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Наука ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. ΠœΠΎΠ΄ΡƒΠ»ΡŒ 6

Как ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ

Π’ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… модулях ΠΌΡ‹ ΠΏΡ€ΠΎΡˆΠ»ΠΈ всС основныС шаги ΠΎΡ‚ постановки Ρ†Π΅Π»ΠΈ Π΄ΠΎ создания ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΈ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

Π’ этом ΠΌΠΎΠ΄ΡƒΠ»Π΅ Π²Ρ‹ ΡƒΠ·Π½Π°Π΅Ρ‚Π΅:

β€’ ΠΊΠ°ΠΊ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΏΠΎΠ½ΡΡ‚ΡŒ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ модСль;
β€’ ΠΊΠ°ΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ подходят для Π·Π°Π΄Π°Ρ‡ рСгрСссии ΠΈ классификации ΠΈ Π² Ρ‡Π΅ΠΌ основныС ΠΏΠ»ΡŽΡΡ‹ ΠΈ минусы ΠΊΠ°ΠΆΠ΄ΠΎΠΉ;
β€’ ΠΊΠ°ΠΊ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ для ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°.

ОглавлСниС

ΠœΠΎΠ΄ΡƒΠ»ΡŒ 6. Как ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ

ΠŸΠΎΡ‡Π΅ΠΌΡƒ ΠΌΡ‹ Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ Π½Π° самом стартС ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°

Π’Π°ΡˆΠ΅ сотрудничСство с Π΄Π°Ρ‚Π°-сайСнтистом β€” это Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΉ Β«Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊ β€” подрядчик», Π° ΠΎ ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… Π²Π΅Ρ‰Π°Ρ… ΠΈ показатСлях Π² этом случаС принято Π΄ΠΎΠ³ΠΎΠ²Π°Ρ€ΠΈΠ²Π°Ρ‚ΡŒΡΡ Β«Π½Π° Π±Π΅Ρ€Π΅Π³ΡƒΒ». ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠ° β€” ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ: с Π΅Π΅ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π²Ρ‹ Π±ΡƒΠ΄Π΅Ρ‚Π΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π² процСссС ΠΏΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обсуТдСния ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° вопрос ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅ всплывСт ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ вспомним ΠΎΠ±Ρ‰ΡƒΡŽ схСму, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΠΎΠΆΠ½ΠΎ вСсти Π΄ΠΈΠ°Π»ΠΎΠ³ ΠΈ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ запрос ΠΊ спСциалисту, ΠΈ ΡƒΡ‚ΠΎΡ‡Π½ΠΈΠΌ Π΅Π΅, Π΄ΠΎΠ±Π°Π²ΠΈΠ² Π² ΠΊΠΎΠ½Π΅Ρ† Π΅Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ шаг β€” Π²Ρ‹Π±ΠΎΡ€ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ. Π§Ρ‚ΠΎΠ±Ρ‹ Π²Π°ΠΌ Π±Ρ‹Π»ΠΎ ΠΏΡ€ΠΎΡ‰Π΅, Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ всС Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅:

1. ΠžΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅ бизнСс-Π·Π°Π΄Π°Ρ‡Ρƒ

Π’Ρ‹: Компании Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ΄Π½ΡΡ‚ΡŒ Π²Ρ‹Ρ€ΡƒΡ‡ΠΊΡƒ Π½Π° 5% Π΄ΠΎ ΠΊΠΎΠ½Ρ†Π° Π³ΠΎΠ΄Π° и…

2. РасскаТитС ΠΎ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… ΡˆΠ°Π³Π°Ρ… ΠΏΠΎ Π΅Π΅ Π΄ΠΎΡΡ‚ΠΈΠΆΠ΅Π½ΠΈΡŽ

Π’Ρ‹: … ΠΈ для достиТСния этой Ρ†Π΅Π»ΠΈ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Π΄ΠΎΠΏΡ€ΠΎΠ΄Π°Π²Π°Ρ‚ΡŒ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌ Ρ†ΠΈΡ„Ρ€ΠΎΠ²Ρ‹Π΅ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΡƒΠ΄Π°Ρ‡Π½ΠΎ ΡΠΎΡ‡Π΅Ρ‚Π°Ρ‚ΡŒΡΡ с Ρ‚Π΅ΠΌΠΈ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΈ ΡƒΠΆΠ΅ Ρƒ нас ΠΏΠΎΠΊΡƒΠΏΠ°ΡŽΡ‚. Но Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ Π±Ρ‹Π»Π° высокой, Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ² Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎ-настоящСму Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹ΠΌΠΈ ΠΈ качСствСнными (ΠΏΠΎ ΠΏΡ€ΠΈΠΊΠΈΠ΄ΠΊΠ°ΠΌ ΠΎΡ‚Π΄Π΅Π»Π° ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π°, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡƒΠ±Π΅Π΄ΠΈΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ дСсятого ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°).

3. ΠžΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅, ΠΌΠΎΠΆΠ½ΠΎ Π»ΠΈ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ машинного обучСния

Π”Π°Ρ‚Π°-сайСнтист: МоТно ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅ΠΊΡƒΡ‰ΡƒΡŽ Π±Π°Π·Ρƒ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ ΠΈΡ… повСдСнчСскиС ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½Ρ‹ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² со схоТими ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½Π°ΠΌΠΈ Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ сСгмСнты. Π—Π°Ρ‚Π΅ΠΌ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ сСгмСнта ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹Π΅ услуги ΠΈΠ»ΠΈ Ρ‚ΠΎΠ²Π°Ρ€Ρ‹.

4. ΠžΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅, Ρ‡Ρ‚ΠΎ Ρƒ вас с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ ΠΈ ΠΏΡ€ΠΎΡ‡ΠΈΠΌ

Π’Ρ‹: Π£ нас Π΅ΡΡ‚ΡŒ CRM (Π°Π½Π³Π». Customer Relationship Management, систСма управлСния Π²Π·Π°ΠΈΠΌΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΉ с ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌΠΈ) ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ источники Π΄Π°Π½Π½Ρ‹Ρ… ΠΎ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°Ρ… β€” ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ ΠΈ с ΠΊΠ°ΠΊΠΎΠΉ частотой ΠΎΠ½ΠΈ ΠΏΠΎΠΊΡƒΠΏΠ°Π»ΠΈ Ρ€Π°Π½Π΅Π΅, ΠΎΡ‚ΠΊΡƒΠ΄Π° ΠΎΠ½ΠΈ, ΠΊΠ°ΠΊΠΈΠΌΠΈ Π΅Ρ‰Π΅ услугами ΠΈ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π°ΠΌΠΈ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ пользовались ΠΈΠ»ΠΈ ΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² ΠΈΡ… домохозяйствС.

Π”Π°Ρ‚Π°-сайСнтист: По ΠΈΠ΄Π΅Π΅, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°Π±Ρ€Π°Ρ‚ΡŒ достаточно ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Π° модСль сама ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ ΠΈΡ… вСса ΠΈ сгруппируСт ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ². Π—Π΄Π΅ΡΡŒ угадываСтся Π·Π°Π΄Π°Ρ‡Π° кластСризации.

5. ΠžΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ качСства

Π”Π°Ρ‚Π°-сайСнтист: Π˜Ρ‚Π°ΠΊ, Ρ€Π΅ΡˆΠ΅Π½ΠΎ: ΠΌΡ‹ строим Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ систСму. ΠžΡΡ‚Π°Π΅Ρ‚ΡΡ ΠΏΠΎΠ½ΡΡ‚ΡŒ, ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ подсказываСт ΠΈΠΌΠ΅Π½Π½ΠΎ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ людям? По ΠΊΠ°ΠΊΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅ Π±ΡƒΠ΄Π΅ΠΌ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ качСство?

Π§Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ ΠΌΠΎΠ³Π»ΠΈ ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° этот вопрос, Π² ΠΌΠΎΠ΄ΡƒΠ»Π΅ ΠΌΡ‹ ΠΈΠ·ΡƒΡ‡ΠΈΠΌ основныС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ машинного обучСния.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для Π·Π°Π΄Π°Ρ‡ рСгрСссии: ΠΊΠ°ΠΊΠΈΠ΅ Π±Ρ‹Π²Π°ΡŽΡ‚, ΠΏΠ»ΡŽΡΡ‹ ΠΈ минусы

Π›ΡŽΠ±ΠΎΠΉ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π΅ Π½Π° 100% Ρ‚ΠΎΡ‡Π΅Π½, Π° Π²ΠΎΡ‚ ΠΊΠ°ΠΊΠΎΠ΅ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ допустимо, Ρ€Π΅ΡˆΠ°Π΅Ρ‚Π΅ Π²Ρ‹, исходя ΠΈΠ· Π·Π°Π΄Π°Ρ‡ ΠΈ Ρ†Π΅Π»Π΅ΠΉ бизнСса. Π’ этом Π²ΠΈΠ΄Π΅ΠΎ Π­Π»Π΅Π½ расскаТСт ΠΎ пяти популярных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°Ρ… для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с числовыми ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌΠΈ ΠΈ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ ΠΏΠΎΠΌΠΎΠ³Π°ΡŽΡ‚ Π²Ρ‹ΡΠ²Π»ΡΡ‚ΡŒ расхоТдСния ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΈ Β«ΡˆΡ‚Ρ€Π°Ρ„ΠΎΠ²Π°Ρ‚ΡŒΒ» Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π·Π° слишком Π½Π΅Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ прСдсказания. Как всСгда β€” с ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π—Π°ΠΌΠ΅Ρ‚ΠΊΠΈ Π”Π°Ρ‚Π° БайСнтиста: Π½Π° Ρ‡Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния β€” ΠΏΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΉ Ρ‚ΠΎΠΏ-10

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠœΡ‹ снова Π² эфирС ΠΈ ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅ΠΌ Ρ†ΠΈΠΊΠ» Π·Π°ΠΌΠ΅Ρ‚ΠΎΠΊ Π”Π°Ρ‚Π° БайСнтиста ΠΈ сСгодня ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽ ΠΌΠΎΠΉ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎ ΡΡƒΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹ΠΉ Ρ‡Π΅ΠΊ-лист ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€Ρƒ ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния.

Π­Ρ‚ΠΎ Ρ‚ΠΎΠΏ-10 свойств Π·Π°Π΄Π°Ρ‡ΠΈ ΠΈ просто ΠΏΡƒΠ½ΠΊΡ‚ΠΎΠ² (Π±Π΅Π· порядка Π² Π½ΠΈΡ…), с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… я Π½Π°Ρ‡ΠΈΠ½Π°ΡŽ Π²Ρ‹Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π²ΠΎΠΎΠ±Ρ‰Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ….

БовсСм Π½Π΅ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‡Ρ‚ΠΎ Ρƒ вас ΠΎΠ½ Π±ΡƒΠ΄Π΅Ρ‚ Ρ‚Π°ΠΊΠΈΠΌ ΠΆΠ΅ β€” здСсь всС ΡΡƒΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ, Π½ΠΎ дСлюсь ΠΎΠΏΡ‹Ρ‚ΠΎΠΌ ΠΈΠ· ΠΆΠΈΠ·Π½ΠΈ.

А какая Ρƒ нас Π²ΠΎΠΎΠ±Ρ‰Π΅ Ρ†Π΅Π»ΡŒ? Π˜Π½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ ΠΈ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ β€” спСктр

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠŸΠΎΠΆΠ°Π»ΡƒΠΉ самый Π²Π°ΠΆΠ½Ρ‹ΠΉ вопрос, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ стоит ΠΏΠ΅Ρ€Π΅Π΄ Π΄Π°Ρ‚Π° сайСнтист ΠΏΠ΅Ρ€Π΅Π΄ Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ Π½Π°Ρ‡Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ это:

Π’ Ρ‡Π΅ΠΌ, собствСнно, состоит бизнСс Π·Π°Π΄Π°Ρ‡Π°?

Или ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠ°Ρ, Ссли Ρ€Π΅Ρ‡ΡŒ ΠΎΠ± Π°ΠΊΠ°Π΄Π΅ΠΌΠΈΠΈ, etc.

НапримСр, Π½Π°ΠΌ Π½ΡƒΠΆΠ½Π° Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ° Π½Π° основС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚ нас Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‚ качСствСнныС прСдсказания вСроятности Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ письмо β€” это спам.

ΠšΠ»Π°ΡΡΠΈΡ‡Π΅ΡΠΊΠΈΠΉ баланс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ я Π²ΠΈΠ΄Π΅Π», это ΠΊΠ°ΠΊ Ρ€Π°Π· спСктр ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΈ Π΅Π³ΠΎ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ (ΠΊΠ°ΠΊ Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ Π²Ρ‹ΡˆΠ΅).

Но ΠΏΠΎ сути Π½ΡƒΠΆΠ½ΠΎ Π½Π΅ просто ΠΏΡ€ΠΎΠ³Π½Π°Ρ‚ΡŒ Catboost / Xgboost / Random Forest ΠΈ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΡŒΠΊΡƒ, Π° ΠΏΠΎΠ½ΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ…ΠΎΡ‡Π΅Ρ‚ бизнСс, ΠΊΠ°ΠΊΠΈΠ΅ Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΊΠ°ΠΊ это Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ.

На ΠΌΠΎΠ΅ΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ β€” это сразу Π±ΡƒΠ΄Π΅Ρ‚ Π·Π°Π΄Π°Π²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΡƒ Π½Π° спСктрС интСрпрСтируСмости ΠΈ точности (Ρ‡Ρ‚ΠΎΠ±Ρ‹ это Π½Π΅ Π·Π½Π°Ρ‡ΠΈΠ»ΠΎ здСсь). А исходя ΠΈΠ· этого ΡƒΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π΄ΡƒΠΌΠ°Ρ‚ΡŒ ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… модСлирования Π·Π°Π΄Π°Ρ‡ΠΈ.

Π’ΠΈΠΏ самой Π·Π°Π΄Π°Ρ‡ΠΈ

Π”Π°Π»ΡŒΡˆΠ΅, послС Ρ‚ΠΎΠ³ΠΎ ΠΊΠ°ΠΊ ΠΌΡ‹ поняли, Ρ‡Ρ‚ΠΎ Ρ…ΠΎΡ‡Π΅Ρ‚ бизнСс β€” Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡƒ матСматичСскому Ρ‚ΠΈΠΏΡƒ Π·Π°Π΄Π°Ρ‡ машинного обучСния относится наша, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€

Π”Π°Π½Π½Ρ‹Π΅: ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ Π΄Π²Π° класса ΠΈ Π½Π°Π±ΠΎΡ€ записСй Π±Π΅Π· ΠΌΠ΅Ρ‚ΠΎΠΊ:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

И Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΈΡ‚ эти самыС Π΄Π°Π½Π½Ρ‹Π΅:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Или ΠΊΠ°ΠΊ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠΊ Π½Π΅Ρ‚ ΠΈ Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π΄Π΅Π»ΠΈΡ‚ΡŒ Π³Ρ€ΡƒΠΏΠΏΡ‹:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Как Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π²ΠΎΡ‚ здСсь:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ ΠΎΡ‚ΡΡŽΠ΄Π°.

А Π²ΠΎΡ‚ собствСнно ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ€Π°Π·Π½ΠΈΡ†Ρƒ ΠΌΠ΅ΠΆΠ΄Ρƒ двумя понятиями: классификация, ΠΊΠΎΠ³Π΄Π° N > 2 классов β€” multi class vs. multi label

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Взято ΠΎΡ‚ΡΡŽΠ΄Π°

Π’Ρ‹ ΡƒΠ΄ΠΈΠ²ΠΈΡ‚Π΅ΡΡŒ, Π½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ часто этот ΠΏΡƒΠ½ΠΊΡ‚ Ρ‚ΠΎΠΆΠ΅ стоит Π½Π°ΠΏΡ€ΡΠΌΡƒΡŽ ΠΏΡ€ΠΎΠ³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ с бизнСсом β€” это ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ Π²Π°ΠΌ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠ½ΠΎΠ³ΠΎ сил ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. НС ΡΡ‚Π΅ΡΠ½ΡΠΉΡ‚Π΅ΡΡŒ Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ ΠΈ Π΄Π°Π²Π°Ρ‚ΡŒ простыС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ (Π½ΠΎ Π½Π΅ слишком ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½Π½Ρ‹Π΅).

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΊΠ°ΠΊ ΠΎΠ½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π°

Начну с простого ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°, Ссли Π²Ρ‹ Π±Π°Π½ΠΊ ΠΈ Π²Ρ‹Π΄Π°Π΅Ρ‚Π΅ ΠΊΡ€Π΅Π΄ΠΈΡ‚, Ρ‚ΠΎ Π½Π° Π½Π΅ΡƒΠ΄Π°Ρ‡Π½ΠΎΠΌ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π΅ ΠΌΡ‹ тСряСм Π² ΠΏΡΡ‚ΡŒ Ρ€Π°Π· большС, Ρ‡Π΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ Π½Π° ΡƒΠ΄Π°Ρ‡Π½ΠΎΠΌ.

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ вопрос ΠΎΠ± ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠΈ качСства Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π΅Π½! Или ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Ρƒ вас присутствуСт сущСствСнный дисбаланс Π² Π΄Π°Π½Π½Ρ‹Ρ…, класс А = 10%, Π° class B = 90%, Ρ‚ΠΎΠ³Π΄Π° классификатор, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ просто Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ B всСгда ΡƒΠΌΠ΅Π΅Ρ‚ 90% Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ! Π‘ΠΊΠΎΡ€Π΅Π΅ всСго это Π½Π΅ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ, обучая модСль.

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΊΡ€ΠΈΡ‚ΠΈΡ‡Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Ρ:

Model post analysis

Часто приходится ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΡƒ Π½Π° основС самой ΠΌΠΎΠ΄Π΅Π»ΠΈ. НапримСр, ΠΊΠ°ΠΊΠΎΠΉ Π²ΠΊΠ»Π°Π΄ ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π² исходный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚: ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹Π΄Π°Ρ‚ΡŒ Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ ΠΏΠΎΡ…ΠΎΠΆΠ΅Π΅ Π½Π° Π²ΠΎΡ‚ это:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Однако, Ρ‡Ρ‚ΠΎ Ссли Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π·Π½Π°Ρ‚ΡŒ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ β€” большиС значСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° A ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‚ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ классу Z ΠΈΠ»ΠΈ Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚? НазовСм ΠΈΡ… Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Π½Ρ‹Π΅ feature importance β€” ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρƒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… (Ρ‡Π΅Ρ€Π΅Π· коэффициСнты Π½Π° Π½ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…)

Для ряда ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, основанных Π½Π° Π΄Π΅Ρ€Π΅Π²ΡŒΡΡ… ΠΈ бустингС β€” Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ SHapley Additive exPlanations.

Π­Ρ‚ΠΎ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π°Π½Π°Π»ΠΈΠ·Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ позволяСт Π·Π°Π³Π»ΡΠ½ΡƒΡ‚ΡŒ Β«ΠΏΠΎΠ΄ ΠΊΠ°ΠΏΠΎΡ‚Β» ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Он позволяСт ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ эффСкта:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠŸΡ€ΠΈΡ‡Π΅ΠΌ для Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² (ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… Π½Π° Π½ΠΈΡ… основанных) ΠΎΠ½ Ρ‚ΠΎΡ‡Π½Ρ‹ΠΉ. ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎΠ± этом Ρ‚ΡƒΡ‚.

Noise level β€” ΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ, линСйная Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ, outlier detection ΠΈ Ρ‚Π΄

Π£ΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ ΠΊ ΡˆΡƒΠΌΡƒ ΠΈ всС эти радости ΠΆΠΈΠ·Π½ΠΈ β€” это ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Π°Ρ Ρ‚Π΅ΠΌΠ° ΠΈ Π½ΡƒΠΆΠ½ΠΎ ΠΊΡ€Π°ΠΉΠ½Π΅ Π²Π½ΠΈΠΌΠ°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ ΡˆΡƒΠΌΠ°, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ΄Π±ΠΈΡ€Π°Ρ‚ΡŒ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹. Если Π²Ρ‹ ΡƒΠ²Π΅Ρ€Π΅Π½Ρ‹, Ρ‡Ρ‚ΠΎ Π² Π΄Π°Π½Π½Ρ‹Ρ… Π±ΡƒΠ΄ΡƒΡ‚ выбросы β€” Π½ΡƒΠΆΠ½ΠΎ ΠΈΡ… ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ качСствСнно Ρ‡ΠΈΡΡ‚ΠΈΡ‚ΡŒ ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ устойчивыС ΠΊ ΡˆΡƒΠΌΡƒ (высокий bias, рСгуляризация ΠΈ Ρ‚Π΄).

Π’Π°ΠΊΠΆΠ΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½Ρ‹ ΠΈ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ бСссмыслСнныС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ β€” Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎ-Ρ€Π°Π·Π½ΠΎΠΌΡƒ Π½Π° это Ρ€Π΅Π°Π³ΠΈΡ€ΡƒΡŽΡ‚. ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π½Π° классичСском датасСтС German Credit Data (UCI) ΠΈ Ρ‚Ρ€Π΅Ρ… простых (ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ) модСлях обучСния:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Как ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ просто модСль Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии, которая ΠΈΠΌΠ΅Π΅Ρ‚ высокий bias ΠΈ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π΄Π°ΠΆΠ΅ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ CatBoost β€” Ρ‚ΡƒΡ‚ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π½Π΅ слишком ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½Ρ‹Ρ…, поэтому ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΊ Π½ΠΈΠΌ устойчивы ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

Π•Ρ‰Π΅ ΠΏΡ€ΠΎ DT β€” Π° Ссли Ρ‡ΡƒΡ‚ΡŒ Ρ‡ΡƒΡ‚ΡŒ ΠΏΠΎΠΌΠ΅Π½ΡΡ‚ΡŒ датасСт? Feature importance ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ decision trees Π²ΠΎΠΎΠ±Ρ‰Π΅ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, Π΄Π°ΠΆΠ΅ ΠΊ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅ΡˆΠΈΠ²Π°Π½ΠΈΡŽ Π΄Π°Π½Π½Ρ‹Ρ….

Π’Ρ‹Π²ΠΎΠ΄: ΠΈΠ½ΠΎΠ³Π΄Π° ΠΏΡ€ΠΎΡ‰Π΅ β€” Π»ΡƒΡ‡ΡˆΠ΅ ΠΈ эффСктивнСС.

ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ

Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΠΈ Π²Π°ΠΌ Π½ΡƒΠΆΠ΅Π½ Spark ΠΈΠ»ΠΈ нСйросСти с ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π°ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²?

Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π½ΡƒΠΆΠ½ΠΎ Π·Π΄Ρ€Π°Π²ΠΎ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ объСм Π΄Π°Π½Π½Ρ‹Ρ…, ΡƒΠΆΠ΅ Π½Π΅ΠΎΠ΄Π½ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎ доводилось Π½Π°Π±Π»ΡŽΠ΄Π°Ρ‚ΡŒ массовоС использованиС спарка Π½Π° Π·Π°Π΄Π°Ρ‡Π°Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π»Π΅Π³ΠΊΠΎ ΡƒΠΌΠ΅Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΠΏΠ°ΠΌΡΡ‚ΡŒ ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠ°ΡˆΠΈΠ½Ρ‹.

Π‘ΠΏΠ°Ρ€ΠΊ услоТняСт ΠΎΡ‚Π»Π°Π΄ΠΊΡƒ, добавляСт overhead ΠΈ услоТняСт Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ β€” Π½Π΅ стоит Π΅Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Ρ‚Π°ΠΌ, Π³Π΄Π΅ Π½Π΅ Π½ΡƒΠΆΠ½ΠΎ. Классика.

Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π½ΡƒΠΆΠ½ΠΎ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ ΠΆΠ΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΡΠΎΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒ Π΅Π΅ с Π·Π°Π΄Π°Ρ‡Π΅ΠΉ. Если ваши ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚Ρ‹ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΈ Ρƒ Π½ΠΈΡ… Π±Π΅Π³Π°Π΅Ρ‚ RandomForest, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ стоит Π΄Π²Π°ΠΆΠ΄Ρ‹ ΠΏΠΎΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ Π½ΡƒΠΆΠ½Π° Π»ΠΈ Π²Π°ΠΌ Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ Π½Π° ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Ρ‹ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ².

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

И ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ ΠΆΠ΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ссли Ρƒ вас ΠΈ ΠΏΡ€Π°Π²Π΄Π° ΠΊΡ€ΡƒΠΏΠ½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, Ρ‚ΠΎ модСль Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ способной Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° Π½ΠΈΡ… β€” ΠΊΠ°ΠΊ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ ΠΏΠΎ Π±Π°Ρ‚Ρ‡Π°ΠΌ, Π»ΠΈΠ±ΠΎ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ распрСдСлСнного обучСния (ΠΈ Ρ‚Π΄). А Ρ‚Π°ΠΌ ΠΆΠ΅ Π½Π΅ слишком Ρ‚Π΅Ρ€ΡΡ‚ΡŒ Π² скорости ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ объСма Π΄Π°Π½Π½Ρ‹Ρ…. НапримСр, ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ kernel methods Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π° памяти для вычислСний Π² dual space β€” Ссли Π²Ρ‹ ΠΎΠΆΠΈΠ΄Π°Π΅Ρ‚Π΅ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π² 10 Ρ€Π°Π·, Ρ‚ΠΎ стоит Π΄Π²Π°ΠΆΠ΄Ρ‹ ΠΏΠΎΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ, Π° ΡƒΠΌΠ΅Ρ‰Π°Π΅Ρ‚Π΅ΡΡŒ Π»ΠΈ Π²Ρ‹ Π² ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ΡΡ рСсурсы.

НаличиС Π³ΠΎΡ‚ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ

Π•Ρ‰Π΅ ΠΎΠ΄Π½Π° ваТнСйшая Π΄Π΅Ρ‚Π°Π»ΡŒ β€” это поиск ΡƒΠΆΠ΅ Π½Π°Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎ-ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ, идСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚, Ссли:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Pre-trained ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊΠ°ΠΊ GPT-2 ΠΈ BERT ΠΌΠΎΠ³ΡƒΡ‚ сущСствСнно ΡƒΠΏΡ€ΠΎΡΡ‚ΠΈΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ вашСй Π·Π°Π΄Π°Ρ‡ΠΈ ΠΈ Ссли ΡƒΠΆΠ΅ Π½Π°Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ β€” ΠΊΡ€Π°ΠΉΠ½Π΅ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΡŽ Π½Π΅ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ ΠΌΠΈΠΌΠΎ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ этот шанс.

Feature interactions ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ

НСкоторыС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π»ΡƒΡ‡ΡˆΠ΅ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚, ΠΊΠΎΠ³Π΄Π° ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ (features) Π½Π΅Ρ‚ слоТных взаимодСйствий β€” Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ вСсь класс Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ β€” Generalized Additive Models. Π•ΡΡ‚ΡŒ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΠ΅ этих ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° случай взаимодСйствия Π΄Π²ΡƒΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ GA2M β€” Generalized Additive Models with Pairwise Interactions.

Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ Ρ‚Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π½Π° Ρ‚Π°ΠΊΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ΡΡ, ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ ΠΈ устойчивы ΠΊ ΡˆΡƒΠΌΡƒ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½ΠΎ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π½Π° Π½ΠΈΡ… Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Однако, Ссли ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ Π³Ρ€ΡƒΠΏΠΏΠ°ΠΌΠΈ большС 2, Ρ‚ΠΎ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡƒΠΆΠ΅ Π½Π΅ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Ρ‚Π°ΠΊΠΈΡ… Ρ…ΠΎΡ€ΠΎΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

Package and model support

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

МногиС ΠΊΡ€ΡƒΡ‚Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ· статСй Π±Ρ‹Π²Π°ΡŽΡ‚ ΠΎΡ„ΠΎΡ€ΠΌΠ»Π΅Π½Ρ‹ Π² Π²ΠΈΠ΄Π΅ модуля ΠΈΠ»ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚Π° для python, R ΠΈ Ρ‚Π΄. Π‘Ρ‚ΠΎΠΈΡ‚ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ Π΄Π²Π°ΠΆΠ΄Ρ‹ ΠΏΠΎΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ Π² долгосрочной пСрспСктивС ΠΏΠΎΠ»Π°Π³Π°Ρ‚ΡŒΡΡ Π½Π° Ρ‚Π°ΠΊΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ (это я Π³ΠΎΠ²ΠΎΡ€ΡŽ, ΠΊΠ°ΠΊ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ написавший Π½Π΅ΠΌΠ°Π»ΠΎ статСй ΠΏΠΎ ML с Ρ‚Π°ΠΊΠΈΠΌ ΠΊΠΎΠ΄ΠΎΠΌ). Π’Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‡Π΅Ρ€Π΅Π· Π³ΠΎΠ΄ Π±ΡƒΠ΄Π΅Ρ‚ нулСвая ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° β€” ΠΎΡ‡Π΅Π½ΡŒ высок, ΠΈΠ±ΠΎ Π°Π²Ρ‚ΠΎΡ€Ρƒ скорСС всСго сСйчас Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π·Π°Π½ΠΈΠΌΠ°Ρ‚ΡŒΡΡ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°ΠΌΠΈ Π½Π΅Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΠΈ Π½ΠΈΠΊΠ°ΠΊΠΈΡ… incentives Π²ΠΊΠ»Π°Π΄Ρ‹Π²Π°Ρ‚ΡŒΡΡ Π² Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ модуля ΠΈΠ»ΠΈ рСпозитория.

Π’ этом ΠΏΠ»Π°Π½Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ Π°-ля scikit learn Ρ…ΠΎΡ€ΠΎΡˆΠΈ ΠΈΠΌΠ΅Π½Π½ΠΎ Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ Π½ΠΈΡ… фактичСски Π΅ΡΡ‚ΡŒ гарантированная Π³Ρ€ΡƒΠΏΠΏΠ° энтузиастов Π²ΠΎΠΊΡ€ΡƒΠ³ ΠΈ Ссли Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½ΠΎ ΠΏΠΎΠ»ΠΎΠΌΠ°Π½ΠΎ β€” это Ρ€Π°Π½ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎΠ·Π΄Π½ΠΎ пофиксят.

Biases and Fairness

ВмСстС с автоматичСскими принятиями Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΊ Π½Π°ΠΌ Π² Тизнь приходят люди Π½Π΅Π΄ΠΎΠ²ΠΎΠ»ΡŒΠ½Ρ‹Π΅ Ρ‚Π°ΠΊΠΈΠΌΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΠΌΠΈ β€” ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ какая-Ρ‚ΠΎ систСма ранТирования заявок Π½Π° ΡΡ‚ΠΈΠΏΠ΅Π½Π΄ΠΈΡŽ ΠΈΠ»ΠΈ Π³Ρ€Π°Π½Ρ‚ исслСдоватСля Π² ΡƒΠ½ΠΈΠ²Π΅Ρ€Π΅. Π£Π½ΠΈΠ²Π΅Ρ€ Ρƒ нас Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΉ β€” Π² Π½Π΅ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π΄Π²Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹ студСнтов: историки ΠΈ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ. Если Π²Π΄Ρ€ΡƒΠ³ систСма Π½Π° основС своих Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π»ΠΎΠ³ΠΈΠΊΠΈ Π²Π΄Ρ€ΡƒΠ³ Ρ€Π°Π·Π΄Π°Π»Π° всС Π³Ρ€Π°Π½Ρ‚Ρ‹ историкам ΠΈ Π½ΠΈ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΡƒ ΠΈΡ… Π½Π΅ присудила β€” это ΠΌΠΎΠΆΠ΅Ρ‚ нСслабо Ρ‚Π°ΠΊ ΠΎΠ±ΠΈΠ΄Π΅Ρ‚ΡŒ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΎΠ². Они Π½Π°Π·ΠΎΠ²ΡƒΡ‚ Ρ‚Π°ΠΊΡƒΡŽ систСму прСдвзятой. БСйчас ΠΎΠ± это Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π»Π΅Π½ΠΈΠ²Ρ‹ΠΉ Π½Π΅ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚, Π° ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΠΈ люди судятся ΠΌΠ΅ΠΆΠ΄Ρƒ собой.

Условно, ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅ ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½Π½ΡƒΡŽ модСль, которая просто считаСт цитирования статСй ΠΈ ΠΏΡƒΡΡ‚ΡŒ историки Π΄Ρ€ΡƒΠ³ Π΄Ρ€ΡƒΠ³Π° Ρ†ΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‚ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ β€” срСднСС 100 Ρ†ΠΈΡ‚Π°Ρ‚, Π° ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ Π½Π΅Ρ‚, Ρƒ Π½ΠΈΡ… срСднСС 20 β€” ΠΈ ΠΏΠΈΡˆΡƒΡ‚ Π²ΠΎΠΎΠ±Ρ‰Π΅ ΠΌΠ°Π»ΠΎ, Ρ‚ΠΎΠ³Π΄Π° систСма распознаСт всСх историков, ΠΊΠ°ΠΊ Β«Ρ…ΠΎΡ€ΠΎΡˆΠΈΡ…Β» ΠΈΠ±ΠΎ Ρ†ΠΈΡ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ высокая 100 > 60 (срСднСС), Π° ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΎΠ², ΠΊΠ°ΠΊ Β«ΠΏΠ»ΠΎΡ…ΠΈΡ…Β» ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Ρƒ Π½ΠΈΡ… Ρƒ всСх Ρ†ΠΈΡ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ ΠΊΡƒΠ΄Π° Π½ΠΈΠΆΠ΅ срСднСго 20

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’ Ρ‡Ρ‘ΠΌ ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ Π±ΡƒΠ΄Π΅ΠΌ? Как Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ML-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΏΠΎΠ΄ Π·Π°Π΄Π°Ρ‡ΠΈ бизнСса

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

БСгодня ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· Π³Π»Π°Π²Π½Ρ‹Ρ… прСпятствий Π½Π° ΠΏΡƒΡ‚ΠΈ внСдрСния машинного обучСния Π² бизнСс являСтся Π½Π΅ΡΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ML ΠΈ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΎΠΏΠ΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚ΠΎΠΏ-ΠΌΠ΅Π½Π΅Π΄ΠΆΠΌΠ΅Π½Ρ‚. Аналитик ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ±Ρ‹Π»ΠΈ? Но вСдь Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ, Π² ΠΊΠ°ΠΊΠΈΡ… случаях ΠΏΡ€ΠΈΡ‡ΠΈΠ½ΠΎΠΉ увСличСния станСт ΠΈΠΌΠ΅Π½Π½ΠΎ машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, Π° Π² ΠΊΠ°ΠΊΠΈΡ… β€” ΠΏΡ€ΠΎΡ‡ΠΈΠ΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹. Π£Π²Ρ‹, Π½ΠΎ довольно часто ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ML Π½Π΅ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ росту ΠΏΡ€ΠΈΠ±Ρ‹Π»ΠΈ. К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅ ΠΈΠ½ΠΎΠ³Π΄Π° ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚Π°ΠΊΠΎΠ²Π°, Ρ‡Ρ‚ΠΎ Π΄Π°ΠΆΠ΅ ΠΎΠΏΡ‹Ρ‚Π½Ρ‹Π΅ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ нСльзя ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим, ΠΊΠ°ΠΊΠΈΠ΅ Π±Ρ‹Π²Π°ΡŽΡ‚ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ML ΠΈ ΠΊΠΎΠ³Π΄Π° ΠΈΡ… цСлСсообразно ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ. Π Π°Π·Π±Π΅Ρ€Ρ‘ΠΌ Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Π΅ ошибки, Π° Ρ‚Π°ΠΊΠΆΠ΅ расскаТСм ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊΠΈΠ΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ постановки Π·Π°Π΄Π°Ρ‡ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠ΄ΠΎΠΉΡ‚ΠΈ для машинного обучСния ΠΈ бизнСса.

ML-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ: Π·Π°Ρ‡Π΅ΠΌ ΠΈΡ… Ρ‚Π°ΠΊ ΠΌΠ½ΠΎΠ³ΠΎ?

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ машинного обучСния вСсьма спСцифичны ΠΈ часто вводят Π² Π·Π°Π±Π»ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅, показывая Ρ…ΠΎΡ€ΠΎΡˆΡƒΡŽ ΠΌΠΈΠ½Ρƒ ΠΏΡ€ΠΈ ΠΏΠ»ΠΎΡ…ΠΎΠΉ ΠΈΠ³Ρ€Π΅ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ для ΠΏΠ»ΠΎΡ…ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΈΡ… ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½ΠΈΡ Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, которая Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½ΠΎ ΠΎΡ‚Ρ€Π°ΠΆΠ°Π΅Ρ‚ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΈ способы Π΅Ρ‘ измСрСния. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ тСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…. И ΠΊΠ°ΠΊ Π²Ρ‹ ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚Π΅, Π²Ρ‹Π±ΠΎΡ€ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ β€” Π·Π°Π΄Π°Ρ‡Π° слоТная.

КакиС Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‡Π°Ρ‰Π΅ всСго Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ машинного обучСния? Π’ ΠΏΠ΅Ρ€Π²ΡƒΡŽ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ это рСгрСссия, классификация ΠΈ кластСризация. ΠŸΠ΅Ρ€Π²Ρ‹Π΅ Π΄Π²Π΅ β€” Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ: Π΅ΡΡ‚ΡŒ Π½Π°Π±ΠΎΡ€ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π° основС ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Ρ‚ΠΎ ΠΎΠΏΡ‹Ρ‚Π° Π½ΡƒΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π·Π°Π΄Π°Π½Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅. РСгрСссия β€” это прСдсказаниС ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Ρ‚ΠΎ значСния: Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π½Π° ΠΊΠ°ΠΊΡƒΡŽ сумму ΠΊΡƒΠΏΠΈΡ‚ ΠΊΠ»ΠΈΠ΅Π½Ρ‚, ΠΊΠ°ΠΊΠΎΠ²Π° ΠΈΠ·Π½ΠΎΡΠΎΡΡ‚ΠΎΠΉΠΊΠΎΡΡ‚ΡŒ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Π°, сколько ΠΊΠΈΠ»ΠΎΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΏΡ€ΠΎΠ΅Π΄Π΅Ρ‚ Π°Π²Ρ‚ΠΎΠΌΠΎΠ±ΠΈΠ»ΡŒ Π΄ΠΎ ΠΏΠ΅Ρ€Π²ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΌΠΊΠΈ.

ΠšΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΡ β€” это ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ структуры Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ выдСлСния кластСров (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ²), ΠΏΡ€ΠΈΡ‡Ρ‘ΠΌ Ρƒ нас Π½Π΅Ρ‚ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΎΠ± этих кластСрах. Π­Ρ‚ΠΎΡ‚ Ρ‚ΠΈΠΏ Π·Π°Π΄Π°Ρ‡ ΠΌΡ‹ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ Π½Π΅ Π±ΡƒΠ΄Π΅ΠΌ.

Алгоритмы машинного обучСния ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ (вычисляя Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ) ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ β€” Ρ€Π°Π·Π½ΠΎΡΡ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ прСдсказаниСм ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ истинным Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ. Но Ссли ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° прСдставляСт собой сумму ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ, Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠΌ количСствС ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ Π² ΠΎΠ±Π΅ стороны эта сумма Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π²Π½Π° Π½ΡƒΠ»ΡŽ, ΠΈ ΠΌΡ‹ просто Π½Π΅ ΡƒΠ·Π½Π°Π΅ΠΌ ΠΎ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ошибки. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΡΡ€Π΅Π΄Π½ΡŽΡŽ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΡƒΡŽ (сумма Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ) ΠΈΠ»ΠΈ ΡΡ€Π΅Π΄Π½ΡŽΡŽ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΊΡƒ (сумма ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ ΠΎΡ‚ истинного значСния). Иногда Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ ΡƒΡΠ»ΠΎΠΆΠ½ΡΡŽΡ‚: Π±Π΅Ρ€ΡƒΡ‚ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌ ΠΈΠ»ΠΈ ΠΈΠ·Π²Π»Π΅ΠΊΠ°ΡŽΡ‚ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΊΠΎΡ€Π΅Π½ΡŒ ΠΈΠ· этих сумм. Благодаря этим ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ качСства вычислСний ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΎ для этого ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π½ΡƒΠΆΠ½ΠΎ с Ρ‡Π΅ΠΌ-Ρ‚ΠΎ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ.

C этим Π½Π΅ Π²ΠΎΠ·Π½ΠΈΠΊΠ½Π΅Ρ‚ слоТностСй, Ссли ΡƒΠΆΠ΅ Π΅ΡΡ‚ΡŒ построСнная модСль, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. А Ρ‡Ρ‚ΠΎ Ссли Π²Ρ‹ Π² ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Ρ€Π°Π· создали модСль? Π’ этом случаС часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ коэффициСнт Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ†ΠΈΠΈ, ΠΈΠ»ΠΈ R2. ΠšΠΎΡΡ„Ρ„ΠΈΡ†ΠΈΠ΅Π½Ρ‚ Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ†ΠΈΠΈ выраТаСтся ΠΊΠ°ΠΊ:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Π“Π΄Π΅:
R^2 β€” коэффициСнт Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ†ΠΈΠΈ,
et^2 β€” срСдняя квадратичная ошибка,
yt β€” Π²Π΅Ρ€Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅,
yt с ΠΊΡ€Ρ‹ΡˆΠΊΠΎΠΉ β€” срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅.

Π•Π΄ΠΈΠ½ΠΈΡ†Π° минус ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ срСднСй ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠΉ ошибки ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ срСднСй ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠΉ ошибкС срСднСго значСния тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

Π’ΠΎ Π΅ΡΡ‚ΡŒ коэффициСнт Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ†ΠΈΠΈ позволяСт ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ прСдсказания модСлью.

Иногда Π±Ρ‹Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ошибка Π² ΠΎΠ΄Π½Ρƒ сторону Π½Π΅Ρ€Π°Π²Π½ΠΎΠ·Π½Π°Ρ‡Π½Π° ошибкС Π² Π΄Ρ€ΡƒΠ³ΡƒΡŽ. НапримСр, Ссли модСль прСдсказываСт Π·Π°ΠΊΠ°Π· Ρ‚ΠΎΠ²Π°Ρ€Π° Π½Π° склад ΠΌΠ°Π³Π°Π·ΠΈΠ½Π°, Ρ‚ΠΎ Π²ΠΏΠΎΠ»Π½Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡˆΠΈΠ±ΠΈΡ‚ΡŒΡΡ ΠΈ Π·Π°ΠΊΠ°Π·Π°Ρ‚ΡŒ Ρ‡ΡƒΡ‚ΡŒ большС, Ρ‚ΠΎΠ²Π°Ρ€ доТдётся своСго часа Π½Π° складС. А Ссли модСль ΠΎΡˆΠΈΠ±Ρ‘Ρ‚ΡΡ Π² Π΄Ρ€ΡƒΠ³ΡƒΡŽ сторону ΠΈ Π·Π°ΠΊΠ°ΠΆΠ΅Ρ‚ мСньшС, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»Π΅ΠΉ. Π’ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… случаях ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΊΠ²Π°Π½Ρ‚ΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΊΡƒ: ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ отклонСния ΠΎΡ‚ истинного значСния ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ с Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ вСсами.

Π’ Π·Π°Π΄Π°Ρ‡Π΅ классификации модСль машинного обучСния распрСдСляСт ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΏΠΎ Π΄Π²ΡƒΠΌ классам: ΡƒΠΉΠ΄Π΅Ρ‚ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ с сайта ΠΈΠ»ΠΈ Π½Π΅ ΡƒΠΉΠ΄Π΅Ρ‚, Π±ΡƒΠ΄Π΅Ρ‚ Π΄Π΅Ρ‚Π°Π»ΡŒ Π±Ρ€Π°ΠΊΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΈΠ»ΠΈ Π½Π΅Ρ‚, ΠΈ Ρ‚.Π΄. Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ прСдсказания часто ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ ΠΊΠ°ΠΊ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ количСства Π²Π΅Ρ€Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… классов ΠΊ ΠΎΠ±Ρ‰Π΅ΠΌΡƒ количСству прСдсказаний. Однако эту характСристику Ρ€Π΅Π΄ΠΊΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½Ρ‹ΠΌ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠΌ.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Рис. 1. ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок для Π·Π°Π΄Π°Ρ‡ΠΈ прСдсказания возвращСния ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°

ΠŸΡ€ΠΈΠΌΠ΅Ρ€: Ссли ΠΈΠ· 100 застрахованных Π·Π° Π²ΠΎΠ·ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ΠΌ ΠΎΠ±Ρ€Π°Ρ‰Π°ΡŽΡ‚ΡΡ 7 Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ, Ρ‚ΠΎ модСль, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰Π°Ρ отсутствиС страхового случая, Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ 93%, Π½Π΅ имСя Π½ΠΈΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ силы.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Рис. 2. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ зависимости фактичСской ΠΏΡ€ΠΈΠ±Ρ‹Π»ΠΈ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΠΎΡ‚ точности ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² случаС разбалансированных классов

Для ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ Π·Π°Π΄Π°Ρ‡ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Ρ‹ (количСство ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² класса срСди всСх ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² этого класса) ΠΈ точности (количСство ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² класса срСди всСх ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ модСль отнСсла ΠΊ этому классу). Если Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΏΠΎΠ»Π½ΠΎΡ‚Ρƒ ΠΈ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ срСднСС гармоничСскоС ΠΌΠ΅ΠΆΠ΄Ρƒ этими Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π°ΠΌΠΈ (F1-ΠΌΠ΅Ρ€Π°).

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ этих ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π½ΠΎΠ΅ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ ΠΏΠΎ классам. ΠŸΡ€ΠΈ этом ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌΡƒ классу. Π‘ этой Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ³ вСроятности, ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ элСмСнты Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΡΠ²Π°ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ классу (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ссли ΠΊΠ»ΠΈΠ΅Π½Ρ‚ ΡƒΠΉΠ΄Ρ‘Ρ‚ с Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ 60 %, Ρ‚ΠΎ Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΎΡΡ‚Π°ΡŽΡ‰ΠΈΠΌΠΈΡΡ). Если ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΉ ΠΏΠΎΡ€ΠΎΠ³ Π½Π΅ Π·Π°Π΄Π°Π½, Ρ‚ΠΎ для ΠΎΡ†Π΅Π½ΠΊΠΈ эффСктивности ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π³Ρ€Π°Ρ„ΠΈΠΊ зависимости ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΎΡ‚ Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (ROC-кривая ΠΈΠ»ΠΈ PR-кривая), взяв Π² качСствС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΊΡ€ΠΈΠ²ΠΎΠΉ.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Рис. 3. PR-кривая

БизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ

Π’Ρ‹Ρ€Π°ΠΆΠ°ΡΡΡŒ аллСгоричСски, бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ β€” это слоны: ΠΈΡ… Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π½Π΅ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, ΠΈ Π² ΠΎΠ΄Π½ΠΎΠΌ Ρ‚Π°ΠΊΠΎΠΌ «слонС» ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒΡΡ большоС количСство Β«ΠΏΠΎΠΏΡƒΠ³Π°Π΅Π²Β» машинного обучСния. ΠžΡ‚Π²Π΅Ρ‚ Π½Π° вопрос, ΠΊΠ°ΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ML позволят ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠ±Ρ‹Π»ΡŒ, зависит ΠΎΡ‚ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ. По сути, бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Ρ‚Π°ΠΊ ΠΈΠ»ΠΈ ΠΈΠ½Π°Ρ‡Π΅ привязаны ΠΊ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΡŽ ΠΏΡ€ΠΈΠ±Ρ‹Π»ΠΈ, ΠΎΠ΄Π½Π°ΠΊΠΎ Π½Π°ΠΌ ΠΏΠΎΡ‡Ρ‚ΠΈ Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ удаётся Π½Π°ΠΏΡ€ΡΠΌΡƒΡŽ ΡΠ²ΡΠ·Π°Ρ‚ΡŒ с Π½ΠΈΠΌΠΈ ΠΏΡ€ΠΈΠ±Ρ‹Π»ΡŒ. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€:

ΠŸΠ΅Ρ€Π²Π°Ρ слоТнСС, Π΅Ρ‘ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ вторая. Ошибки Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ прСдсказания Π²Ρ‹Π½ΡƒΠΆΠ΄Π°ΡŽΡ‚ Π·Π°ΠΊΠ»Π°Π΄Ρ‹Π²Π°Ρ‚ΡŒ больший запас Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, поэтому оптимизируСмая сумма ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€: Ρ‡Π΅ΠΌ Π½ΠΈΠΆΠ΅ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ прСдсказания повСдСния ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ»ΠΈ вСроятности ΠΏΡ€ΠΎΠΌΡ‹ΡˆΠ»Π΅Π½Π½ΠΎΠ³ΠΎ Π±Ρ€Π°ΠΊΠ°, Ρ‚Π΅ΠΌ мСньшС ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² удаётся ΡƒΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ ΠΈ Ρ‚Π΅ΠΌ мСньшС ΠΎΠ±ΡŠΡ‘ΠΌ сэкономлСнных ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ².

ΠžΠ±Ρ‰Π΅ΠΏΡ€ΠΈΠ½ΡΡ‚Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΡΡ‚ΠΈ бизнСса (EBITDA ΠΈ Π΄Ρ€.) Ρ€Π΅Π΄ΠΊΠΎ получаСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈ постановках Π·Π°Π΄Π°Ρ‡ ML. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ приходится Π³Π»ΡƒΠ±ΠΎΠΊΠΎ ΠΈΠ·ΡƒΡ‡Π°Ρ‚ΡŒ спСцифику ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, принятыС Π² Ρ‚ΠΎΠΉ сфСрС, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΡ‹ внСдряСм машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ (срСдний Ρ‡Π΅ΠΊ, ΠΏΠΎΡΠ΅Ρ‰Π°Π΅ΠΌΠΎΡΡ‚ΡŒ ΠΈ Ρ‚.Π΄.).

Врудности ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Π°

По ΠΈΡ€ΠΎΠ½ΠΈΠΈ ΡΡƒΠ΄ΡŒΠ±Ρ‹ ΡƒΠ΄ΠΎΠ±Π½Π΅Π΅ всСго ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ прСдставитСлям бизнСса. Как ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ опрСдСлСния Ρ‚ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ коммСнтария соотносится с ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΌ Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ Π²Ρ‹Ρ€ΡƒΡ‡ΠΊΠΈ? Π‘ этой Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния ΠΏΠ΅Ρ€Π΅Π΄ бизнСсом Π²ΡΡ‚Π°ΡŽΡ‚ Π΄Π²Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ: ΠΊΠ°ΠΊ ΠΈΠ·ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ ΠΈ ΠΊΠ°ΠΊ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ эффСкт ΠΎΡ‚ внСдрСния машинного обучСния?

ΠŸΠ΅Ρ€Π²Π°Ρ Π·Π°Π΄Π°Ρ‡Π° ΠΏΡ€ΠΎΡ‰Π΅ Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ, Ссли Ρƒ вас Π΅ΡΡ‚ΡŒ рСтроспСктивныС Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΏΡ€ΠΈ этом ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΌΠΎΠΆΠ½ΠΎ Π½ΠΈΠ²Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ ΠΈΠ·ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ. Π’ΠΎΠ³Π΄Π° Π½ΠΈΡ‡Ρ‚ΠΎ Π½Π΅ ΠΌΠ΅ΡˆΠ°Π΅Ρ‚ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ значСния с Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½Ρ‹ΠΌΠΈ рСтроспСктивными Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Но Π΅ΡΡ‚ΡŒ ΠΎΠ΄Π½Π° ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ: Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Π° ΠΈ ΠΏΡ€ΠΈ этом максимально ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Ρ‚Ρƒ, с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ Π°ΠΏΡ€ΠΎΠ±ΠΈΡ€ΡƒΠ΅ΠΌ модСль.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€: Π½ΡƒΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ самых ΠΏΠΎΡ…ΠΎΠΆΠΈΡ… ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ, увСличился Π»ΠΈ Ρƒ Π½ΠΈΡ… срСдний Ρ‡Π΅ΠΊ. Но ΠΏΡ€ΠΈ этом Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ достаточно большой, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ всплСсков ΠΈΠ·-Π·Π° нСстандартного повСдСния. Π­Ρ‚Ρƒ Π·Π°Π΄Π°Ρ‡Ρƒ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ создания достаточно большой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΠΎΡ…ΠΎΠΆΠΈΡ… ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ Π½Π° Π½Π΅ΠΉ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ своих усилий.

Однако Π²Ρ‹ спроситС: ΠΊΠ°ΠΊ пСрСвСсти Π²Ρ‹Π±Ρ€Π°Π½Π½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ (ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΈ занимаСтся модСль) для машинного обучСния. Π‘ наскока эту Π·Π°Π΄Π°Ρ‡Ρƒ Π½Π΅ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ: Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ°ΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈ придётся Π³Π»ΡƒΠ±ΠΎΠΊΠΎ Π²Π½ΠΈΠΊΠ½ΡƒΡ‚ΡŒ Π² бизнСс-процСссы. Но Ссли ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, которая зависит ΠΎΡ‚ бизнСса, качСство ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ сразу вырастаСт. Π‘ΠΊΠ°ΠΆΠ΅ΠΌ, Ссли модСль прСдсказываСт, ΠΊΠ°ΠΊΠΈΠ΅ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Ρ‹ ΡƒΠΉΠ΄ΡƒΡ‚, Ρ‚ΠΎ Π² Ρ€ΠΎΠ»ΠΈ бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π³Ρ€Π°Ρ„ΠΈΠΊ, Π³Π΄Π΅ ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΉ оси ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½ΠΎ количСство уходящих, ΠΏΠΎ мнСнию ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², Π° ΠΏΠΎ Π΄Ρ€ΡƒΠ³ΠΎΠΉ оси β€” ΠΎΠ±Ρ‰ΠΈΠΉ ΠΎΠ±ΡŠΡ‘ΠΌ срСдств Ρƒ этих ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ². Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π³Ρ€Π°Ρ„ΠΈΠΊΠ° бизнСс-Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊ ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΡƒΠ΄ΠΎΠ±Π½ΡƒΡŽ для сСбя Ρ‚ΠΎΡ‡ΠΊΡƒ ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π½Π΅ΠΉ. Если с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ свСсти Π³Ρ€Π°Ρ„ΠΈΠΊ ΠΊ PR-ΠΊΡ€ΠΈΠ²ΠΎΠΉ (ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΉ оси Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, ΠΏΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΉ ΠΏΠΎΠ»Π½ΠΎΡ‚Π°), Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ с бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Рис. 4. ΠšΡ€ΠΈΠ²Π°Ρ Π΄Π΅Π½Π΅ΠΆΠ½ΠΎΠ³ΠΎ эффСкта

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

ΠŸΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ для машинного обучСния ΠΈ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ модСль, Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Ρ€Π°Π·ΡƒΠΌΠ½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ. Если Π²Ρ‹ ΡΠΎΠ±ΠΈΡ€Π°Π΅Ρ‚Π΅ΡΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ модСль, Ρ‚ΠΎ Π² качСствС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ошибок ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ΄Π½Ρƒ ΠΈΠ· стандартных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ согласуйтС с Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊΠΎΠΌ Π²Ρ‹Π±Ρ€Π°Π½Π½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, Π΅Ρ‘ вСса ΠΈ ΠΏΡ€ΠΎΡ‡ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π² бизнСс-ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ ML. По Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ это ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ сравнимо с Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΎΠΉ самой ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΎ Π±Π΅Π· этого Π½Π΅ ΠΈΠΌΠ΅Π΅Ρ‚ смысла ΠΏΡ€ΠΈΡΡ‚ΡƒΠΏΠ°Ρ‚ΡŒ ΠΊ Ρ€Π°Π±ΠΎΡ‚Π΅. Если ΠΏΡ€ΠΈΠ²Π»Π΅Ρ‡ΡŒ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΎΠ² ΠΊ ΠΈΠ·ΡƒΡ‡Π΅Π½ΠΈΡŽ бизнСс-процСссов, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ сильно ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ошибок Π² ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°Ρ…. ЭффСктивная оптимизация ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Π° Π±Π΅Π· понимания ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области ΠΈ совмСстной постановки Π·Π°Π΄Π°Ρ‡ΠΈ Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ бизнСса ΠΈ статистики. И ΡƒΠΆΠ΅ послС провСдСния всСх расчётов Π²Ρ‹ смоТСтС ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ ΠΏΡ€ΠΈΠ±Ρ‹Π»ΡŒ (ΠΈΠ»ΠΈ экономию) Π² зависимости ΠΎΡ‚ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Николай КнязСв (iRumata), Ρ€ΡƒΠΊΠΎΠ²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒ Π³Ρ€ΡƒΠΏΠΏΡ‹ машинного обучСния Β«Π˜Π½Ρ„ΠΎΡΠΈΡΡ‚Π΅ΠΌΡ‹ Π”ΠΆΠ΅Ρ‚Β»

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π·Π°Π΄Π°Ρ‡ классификации Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Абрамов Π ΠΎΠΌΠ°Π½,
Data Scientist

Π’ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ машинного обучСния ставится вопрос ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π‘Π΅Π· Π²Π²Π΅Π΄Π΅Π½Π½Ρ‹Ρ… ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠ΅Π², Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ Π½ΠΈ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ β€œΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΡΡ‚ΡŒβ€ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ собой Π΄Π²Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°. ИмСнно поэтому Π²Π°ΠΆΠ½ΠΎ ΡƒΡ‡Π΅ΡΡ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΉ Π²Ρ‹Π±ΠΎΡ€ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ для поставлСнной Π·Π°Π΄Π°Ρ‡ΠΈ, хотя мноТСство ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°ΠΏΡƒΡ‚Π°Ρ‚ΡŒ ΠΈ, Π² ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΌ счСтС, привСсти ΠΊ Π½Π΅ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ.

НСсмотря Π½Π° ΠΏΠΎΠΏΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ машинного обучСния, Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… Π΅Ρ‘ сфСрах Π΄ΠΎ сих ΠΏΠΎΡ€ Π½Π΅ ΡΡ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ Сдиная тСорСтичСская концСпция. Π˜ΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ΠΌ Π½Π΅ стала ΠΈ рассматриваСмая ΠΎΠ±Π»Π°ΡΡ‚ΡŒ. Π₯ΠΎΡ‚ΡŒ ΠΈ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Ρ‰ΠΈΠ΅ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ для Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π»Π΅ΠΆΠΈΡ‚ Π½Π° ΠΏΠ»Π΅Ρ‡Π°Ρ… Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ°.

Бинарная классификация

Π’ΠΎΠ·ΡŒΠΌΡ‘ΠΌ ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ Π·Π°Π΄Π°Ρ‡Ρƒ выявлСния подозрСния Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ΅ Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠ΅. Если Ρƒ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π° ΠΎΠ½ΠΎ Π΅ΡΡ‚ΡŒ, Ρ‚ΠΎ это Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ классом. Если Π½Π΅Ρ‚ – ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ – слСдуСт Π»ΠΈ Β«Π·Π°ΠΏΠΎΠ΄ΠΎΠ·Ρ€ΠΈΡ‚ΡŒΒ» Ρƒ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π° ΠΊΠ°ΠΊΠΎΠΉ-Ρ‚ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΉ Π΄ΠΈΠ°Π³Π½ΠΎΠ· (Ρ‚ΠΎΠ³Π΄Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ = true) ΠΈΠ»ΠΈ Π½Π΅Ρ‚ (Ρ‚ΠΎΠ³Π΄Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ = false).

ΠŸΡƒΡΡ‚ΡŒ ΠΊΠ°ΠΊΠΎΠΉ-Ρ‚ΠΎ Π½Π°Π±ΠΎΡ€ мСдицинских Π΄Π°Π½Π½Ρ‹Ρ… Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π΅Π½ для Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π΄ΠΈΠ°Π³Π½ΠΎΠ·Π°. Если наша модСль Π²Π΅Ρ€Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ»Π° ΠΈ поставила ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ класс, Ρ‚ΠΎΠ³Π΄Π° это истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ исход, Ссли ΠΆΠ΅ модСль ставит ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΌΠ΅Ρ‚ΠΊΡƒ класса, Ρ‚ΠΎΠ³Π΄Π° это Π»ΠΎΠΆΠ½ΠΎ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ исход. Π’ случаС отсутствия Π΄ΠΈΠ°Π³Π½ΠΎΠ·Π° Ρƒ рассматриваСмого Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… исходы ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΡΡ‚Π°ΡŽΡ‚ΡΡ Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½Ρ‹ΠΌΠΈ. Π’ΠΎΠ³Π΄Π° Ссли модСль относит запись ΠΊ классу ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ, Ρ‚ΠΎ ΠΌΡ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌ ΠΎ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ исходС (модСль «сказала» Ρ‡Ρ‚ΠΎ Π΄ΠΈΠ°Π³Π½ΠΎΠ· Π΅ΡΡ‚ΡŒ, Π½ΠΎ Π½Π° самом Π΄Π΅Π»Π΅ Π΅Π³ΠΎ Π½Π΅Ρ‚), ΠΈ Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚, Ссли модСль опрСдСлят запись ΠΊΠ°ΠΊ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ класс, Ρ‚ΠΎ это β€” истинно ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ исход.

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Рисунок 1: ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° сопряТСнности Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации

Accuracy

Одной ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ простых, Π° поэтому ΠΈ распространСнной ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ являСтся Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ. Она ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ количСство ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ проставлСнных ΠΌΠ΅Ρ‚ΠΎΠΊ класса (истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈ истинно ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ…) ΠΎΡ‚ ΠΎΠ±Ρ‰Π΅Π³ΠΎ количСства Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ считаСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ [Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation]:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Однако, эта простота являСтся Ρ‚Π°ΠΊΠΆΠ΅ ΠΈ ΠΏΡ€ΠΈΡ‡ΠΈΠ½ΠΎΠΉ, ΠΏΠΎΡ‡Π΅ΠΌΡƒ Π΅Ρ‘ часто ΠΊΡ€ΠΈΡ‚ΠΈΠΊΡƒΡŽΡ‚ ΠΈ ΠΏΠΎΡ‡Π΅ΠΌΡƒ ΠΎΠ½Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎ Π½Π΅ ΠΏΠΎΠ΄ΠΎΠΉΡ‚ΠΈ ΠΏΠΎΠ΄ Ρ€Π΅ΡˆΠ°Π΅ΠΌΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ. Она Π½Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Π»ΠΎΠΆΠ½Ρ‹Ρ… срабатываний ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ критичСским, особСнно Π² мСдицинской сфСрС, ΠΊΠΎΠ³Π΄Π° стоит Π·Π°Π΄Π°Ρ‡Π° Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Ρ‚ΡŒ всС истинныС случаи Π΄ΠΈΠ°Π³Π½ΠΎΠ·Π°.

ВСрнСмся ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ с ΠΏΠΎΠ΄ΠΎΠ·Ρ€Π΅Π½ΠΈΠ΅ΠΌ Π½Π° Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠ΅. Если наша Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Ρ€Π°Π²Π½Π° 80%, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² срСднСм ΠΈΠ· 100 Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ ΠΎΠ½Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ ΠΈΠ»ΠΈ отсутствиС Π΄ΠΈΠ°Π³Π½ΠΎΠ·Π° лишь Ρƒ 80 Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Π΅Ρ‰Ρ‘ 20 Π±ΡƒΠ΄ΡƒΡ‚ Π»ΠΈΠ±ΠΎ Π»ΠΎΠΆΠ½ΠΎ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π»ΠΈΠ±ΠΎ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ.

Π‘Ρ‚ΠΎΠΈΡ‚ ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ всСх ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² с Π΄ΠΈΠ°Π³Π½ΠΎΠ·ΠΎΠΌ ΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π΄Π°ΠΆΠ΅ ΠΏΡ€Π΅Π½Π΅Π±Ρ€Π΅Ρ‡ΡŒ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ исходами, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΡ‚ΡΠ΅ΡΡ‚ΡŒΡΡ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… стадиях исслСдования (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, послС ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½ΠΎΠΉ сдачи Π°Π½Π°Π»ΠΈΠ·ΠΎΠ²), Ρ‚ΠΎΠ³Π΄Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊ этой ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅ Π΅Ρ‰Ρ‘ ΠΎΠ΄Π½Ρƒ, которая ΠΌΠΎΠ³Π»Π° Π±Ρ‹ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ‚Ρ€Π΅Π±ΡƒΠ΅ΠΌΡ‹ΠΉ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚.

Precision

НСсмотря Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ английскиС названия ΠΈ Ρ€Π°Π·Π½Ρ‹Π΅ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρ‹ подсчСта, русский ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ этой ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Ρ‚Π°ΠΊΠΆΠ΅ закрСпился ΠΊΠ°ΠΊ Β«Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΒ», Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹Π·Π²Π°Ρ‚ΡŒ Π½Π΅Π΄ΠΎΡƒΠΌΠ΅Π½ΠΈΠ΅ ΠΈ ΠΊΠΎΠ½Ρ„ΡƒΠ·, поэтому слСдуСт ΡƒΡ‚ΠΎΡ‡Π½ΡΡ‚ΡŒ, ΠΎ Ρ‡Π΅ΠΌ ΠΈΠΌΠ΅Π½Π½ΠΎ Π²Ρ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚Π΅. Π­Ρ‚Π° Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ количСство истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… исходов ΠΈΠ· всСго Π½Π°Π±ΠΎΡ€Π° ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠΊ ΠΈ считаСтся ΠΏΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅ [Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation]:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
Π’Π°ΠΆΠ½ΠΎΡΡ‚ΡŒ этой ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ опрСдСляСтся Ρ‚Π΅ΠΌ, насколько высока для рассматриваСмой Π·Π°Π΄Π°Ρ‡ΠΈ Β«Ρ†Π΅Π½Π°Β» Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°. Если, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ дальнСйшСй ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ наличия заболСвания Ρƒ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π° высока ΠΈ ΠΌΡ‹ просто Π½Π΅ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ всС Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, Ρ‚ΠΎ стоит ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, вСдь ΠΏΡ€ΠΈ Precision = 50% ΠΈΠ· 100 ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ… Π΄ΠΈΠ°Π³Π½ΠΎΠ· Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ лишь 50 ΠΈΠ· Π½ΠΈΡ….

Recall (true positive rate)

Π’ русском языкС для этого Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ слово Β«ΠΏΠΎΠ»Π½ΠΎΡ‚Π°Β» ΠΈΠ»ΠΈ Β«Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΒ». Π­Ρ‚Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° опрСдСляСт количСство истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… срСди всСх ΠΌΠ΅Ρ‚ΠΎΠΊ класса, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Ρ‹ ΠΊΠ°ΠΊ Β«ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉΒ» ΠΈ вычисляСтся ΠΏΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅ [The relationship between Precision-Recall and ROC curves ].

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния
НСобходимо ΡƒΠ΄Π΅Π»ΠΈΡ‚ΡŒ особоС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ этой ΠΎΡ†Π΅Π½ΠΊΠ΅, ΠΊΠΎΠ³Π΄Π° Π² поставлСнной Π·Π°Π΄Π°Ρ‡Π΅ ошибка нСраспознания ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса высока, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈ выставлСнии Π΄ΠΈΠ°Π³Π½ΠΎΠ·Π° ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ ΡΠΌΠ΅Ρ€Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π±ΠΎΠ»Π΅Π·Π½ΠΈ.

F1-Score

Π’ Ρ‚ΠΎΠΌ случаС, Ссли Precision ΠΈ Recall ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ Π·Π½Π°Ρ‡ΠΈΠΌΡ‹ΠΌΠΈ, ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… срСднСС гармоничСскоС для получСния ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² [On extending f-measure and g-mean metrics to multi-class problems]:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Помимо Ρ‚ΠΎΡ‡Π΅Ρ‡Π½Ρ‹Ρ… ΠΎΡ†Π΅Π½ΠΎΠΊ, сущСствуСт Ρ†Π΅Π»Ρ‹ΠΉ ряд графичСских ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², способных ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство классификации.

ROC (receiver operating characteristic) – Π³Ρ€Π°Ρ„ΠΈΠΊ, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π²Π΅Ρ€Π½ΠΎ классифицируСмых ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса ΠΎΡ‚ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ классифицируСмых ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ класса. Π˜Π½Ρ‹ΠΌΠΈ словами, ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ True Positive Rate (Recall) ΠΈ False Positive Rate (Рисунок 2). ΠŸΡ€ΠΈ этом, False Positive Rate (FPR) рассчитываСтся ΠΏΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅ [Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation]:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Рисунок 2: ROC кривая

Рисунок 2 содСрТит ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π΄Π²ΡƒΡ… ROC – ΠΊΡ€ΠΈΠ²Ρ‹Ρ…. ИдСальноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π³Ρ€Π°Ρ„ΠΈΠΊΠ° находится Π² Π²Π΅Ρ€Ρ…Π½Π΅ΠΉ Π»Π΅Π²ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ (TPR = 1, a FPR = 0). ΠŸΡ€ΠΈ этом, кривая, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π°Ρ FPR = TPR являСтся случайным Π³Π°Π΄Π°Π½ΠΈΠ΅ΠΌ, Π° Ссли Π³Ρ€Π°Ρ„ΠΈΠΊ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ»ΠΈ Ρ‚ΠΎΡ‡ΠΊΠ° находятся Π½ΠΈΠΆΠ΅ этого ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ°, Ρ‚ΠΎ это Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ лишь ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ΄Π±Ρ€Π°ΡΡ‹Π²Π°Ρ‚ΡŒ ΠΌΠΎΠ½Π΅Ρ‚ΠΊΡƒ, Ρ‡Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ эту модСль. ΠŸΡ€ΠΈ этом говорят, Ρ‡Ρ‚ΠΎ кривая X Π΄ΠΎΠΌΠΈΠ½ΠΈΡ€ΡƒΠ΅Ρ‚ Π½Π°Π΄ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΊΡ€ΠΈΠ²ΠΎΠΉ Y, Ссли X Π² любом Ρ‚ΠΎΡ‡ΠΊΠ΅ находится Π»Π΅Π²Π΅Π΅ ΠΈ Π²Ρ‹ΡˆΠ΅ Y [Using AUC and accuracy in evaluating learning algorithms ], Ρ‡Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ прСвосходство ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ классификатора Π½Π°Π΄ Π²Ρ‚ΠΎΡ€Ρ‹ΠΌ.

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ROC β€” ΠΊΡ€ΠΈΠ²ΠΎΠΉ, ΠΌΠΎΠΆΠ½ΠΎ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ для поиска Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ (с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния tpr ΠΈ fpr) ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ. Π’ этом случаС ищСтся компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ количСством Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ…, ΠΌΠ΅Ρ‚ΠΊΠ° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π±Ρ‹Π»Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΠΈ количСством Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ…, ΠΌΠ΅Ρ‚ΠΊΠ° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π±Ρ‹Π»Π° Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ.

AUC (Area Under Curve)

Π’ качСствС числСнной ΠΎΡ†Π΅Π½ΠΊΠΈ ROC ΠΊΡ€ΠΈΠ²ΠΎΠΉ принято Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ, которая являСтся Π½Π΅ΠΏΠ»ΠΎΡ…ΠΈΠΌ Β«ΠΈΡ‚ΠΎΠ³ΠΎΠΌΒ» для ΠΊΡ€ΠΈΠ²ΠΎΠΉ. Если ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΡ€ΠΈΠ²Ρ‹ΠΌΠΈ X ΠΈ Y сущСствуСт Π΄ΠΎΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠ΅Ρ€Π²ΠΎΠΉ Π½Π°Π΄ Π²Ρ‚ΠΎΡ€ΠΎΠΉ, Ρ‚ΠΎ AUC (X) > AUC (Y), ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ΅ Π½Π΅ всСгда Π²Π΅Ρ€Π½ΠΎ. Но AUC ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ Ρ‚Π°ΠΊ ΠΆΠ΅ ΠΈ статистичСским смыслом: ΠΎΠ½Π° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ экзСмпляр Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ класса Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ мСньшС Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π±Ρ‹Ρ‚ΡŒ распознанным ΠΊΠ°ΠΊ ΠΏΠΎΠ·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ класс, Ρ‡Π΅ΠΌ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ·ΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ класс [Using AUC and accuracy in evaluating learning algorithms].

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

Рисунок 3.Π”Π²Π° классификатора ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, Π½ΠΎ Ρ€Π°Π·Π½Ρ‹ΠΉ AUC

ΠœΡƒΠ»ΡŒΡ‚ΠΈ-классификация

ВсС рассмотрСнныС Π²Ρ‹ΡˆΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΎΡ‚Π½ΠΎΡΠΈΠ»ΠΈΡΡŒ лишь ΠΊ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅, Π½ΠΎ, Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ, классов большС, Ρ‡Π΅ΠΌ Π΄Π²Π°. Π­Ρ‚ΠΎ обуславливаСт Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π² ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠΈ рассмотрСнных ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ. Одним ΠΈΠ· Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… способов являСтся вычислСниС срСднСго ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΏΠΎ всСм классам [On extending f-measure and g-mean metrics to multi-class problems]. Π’ΠΎΠ³Π΄Π° Π² качСствС Β«ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎΒ» класса бСрСтся вычисляСмый, Π° всС ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ β€” Π² качСствС Β«ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎΒ».

Π’ этом случаС Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρ‹ для ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π±ΡƒΠ΄ΡƒΡ‚ Π²Ρ‹Π³Π»ΡΠ΄Π΅Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния

ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π² ΠΏΡ€Π΅Π΄ΠΈΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ΅ для здравоохранСния

Π˜Π·ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ Ρ‚Π΅ΠΎΡ€ΠΈΡŽ всСгда слСдуСт ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠΈΡ‚ΡŒ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΎΠΉ. Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС, ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Ρ‚Π΅Ρ… ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ для Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡, связанных с использованиСм ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния Π² Π·Π΄Ρ€Π°Π²ΠΎΠΎΡ…Ρ€Π°Π½Π΅Π½ΠΈΠΈ. Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв рСкомСндуСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ AUC ΠΈ F-Score, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ Π² сСбя ΡˆΠΈΡ€ΠΎΠΊΠΈΠΉ список Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… исходов ΠΈ, ΠΊΠ°ΠΊ Π±Ρ‹Π»ΠΎ Π·Π°ΠΌΠ΅Ρ‡Π΅Π½ΠΎ Ρ€Π°Π½Π΅Π΅, AUC прСвосходит ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ Accuracy, Π½ΠΎ спор насчСт этого вСдётся Π΄ΠΎ сих ΠΏΠΎΡ€.

Основной Π·Π°Π΄Π°Ρ‡Π΅ΠΉ ΠΏΡ€Π΅Π΄ΠΈΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΈ для здравоохранСния являСтся прСдсказаниС Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… событий. Π­Ρ‚Π° Ρ‚Π΅ΠΌΠ° довольно Π½Π΅ΠΏΠ»ΠΎΡ…ΠΎ ΠΈΠ·ΡƒΡ‡Π΅Π½Π° для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ ΠΈ сцСнариСв использования, поэтому сущСствуСт мноТСство Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π΅Ρ‘ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. Π”Π°Π½Π½Ρ‹ΠΉ Ρ‚ΠΈΠΏ Π·Π°Π΄Π°Ρ‡ оцСниваСтся всСми рассмотрСнными ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ для классификации, Π½ΠΎ Ρ‡Π°Ρ‰Π΅ ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ Accuracy благодаря Π΅Ρ‘ простотС. НапримСр, Π² Disease prediction by machine learning over big data from healthcare communities Π°Π²Ρ‚ΠΎΡ€Ρ‹ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ мСдицинскиС записи с Ρ†Π΅Π»ΡŒΡŽ прСдсказания возмоТности появлСния ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Π»ΠΈΠ±ΠΎ заболСвания ΠΈ Ρƒ Π½ΠΈΡ… получаСтся это Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ 70% для Accuracy, Precision, Recall ΠΈ F1. Π’ Intelligent heart disease prediction system using data mining techniques ΠΈ Heart disease prediction system using naive Bayes ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Accuracy достигаСт ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ 90-95%, Π½ΠΎ Π½Π° это сказываСтся Ρ€Π°Π·ΠΌΠ΅Ρ€ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π» использован для исслСдования.

Π‘Ρ€Π΅Π΄ΠΈ всСго списка Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ ΠΎΡΠΎΠ±ΡƒΡŽ Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠΌΠ΅ΡŽΡ‚ сСрдСчно сосудистыС заболСвания (Π‘Π‘Π—). ΠœΠ½ΠΎΠΆΠ΅ΡΡ‚Π²ΠΎ исслСдований, посвящСнных ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡŽ Π‘Π‘Π— Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ Ρ‚ΠΎ, Ρ‡Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Π² этой области благодаря ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ. Π—Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ здСсь ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° AUC для сравнСния качСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. НапримСр Π² A data-driven approach to predicting diabetes and cardiovascular disease with machine learning Π°Π²Ρ‚ΠΎΡ€Ρ‹ Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ с Π±Π°Π·ΠΎΠΉ, которая ΡΠΎΠ±ΠΈΡ€Π°Π»Π°ΡΡŒ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ 20 Π»Π΅Ρ‚, содСрТащСй Π±ΠΎΠ»Π΅Π΅ ста ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². ЦСлью являлось прСдсказаниС Ρ€Π°Π½Π½ΠΈΡ… стадий Π‘Π‘Π—, ΠΏΡ€Π΅Π΄ΠΈΠ°Π±Π΅Ρ‚Π° ΠΈ Π΄ΠΈΠ°Π±Π΅Ρ‚Π°, ΠΎΠ½ΠΈ добились ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ Ρ€Π°Π²Π½Ρ‹Ρ… 0.957, 0.802 ΠΈ 0.839 ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ. Π’ Development and verification of prediction models for preventing cardiovascular diseases Π°Π²Ρ‚ΠΎΡ€Ρ‹ исслСдовали Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… исходов (ΡΠΌΠ΅Ρ€Ρ‚ΡŒ, госпитализация ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅), связанных с Π‘Π‘Π—. ΠΠ°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ AUC Π±Ρ‹Π» Ρ€Π°Π²Π΅Π½ 0.96. Π’ ΠŸΠ΅Ρ€ΡΠΏΠ΅ΠΊΡ‚ΠΈΠ²Ρ‹ использования ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² машинного обучСния для прСдсказания сСрдСчно-сосудистых Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ исслСдуСтся Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ прСдсказания Π‘Π‘Π— с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² машинного обучСния ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… мСдицинских Π΄Π°Π½Π½Ρ‹Ρ…. Для Accuracy, Precision, Recall ΠΈ AUC Π±Ρ‹Π»ΠΈ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Ρ‹ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ 78%, 0.79, 0.67 ΠΈ 0.84 соотвСтствСнно.

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

РассмотрСнныС ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ лишь основными ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для Π·Π°Π΄Π°Ρ‡ΠΈ классификации. БущСствуСт Π΅Ρ‰Ρ‘ мноТСство Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… областСй, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ каТдая Π·Π°Π΄Π°Ρ‡Π° ΠΈΠΌΠ΅ΡŽΡ‚ свою спСцифику ΠΈ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Ρ‹. НСвозмоТно Π΄Π°Ρ‚ΡŒ ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ Ρ‡Π΅Ρ‚ΠΊΠΈΡ… Π³Π°Ρ€Π°Π½Ρ‚ΠΈΠΉ ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, какая ΠΈΠ· ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π»ΡƒΡ‡ΡˆΠ΅, Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΈ ΠΎΡ‚Π΄Π°Π²Π°Ρ‚ΡŒ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚Π΅Π½ΠΈΠ΅ стоит лишь исходя ΠΈΠ· ΠΎΠΏΡ‹Ρ‚Π° своСго ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… исслСдоватСлСй.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *