Жасанды интеллект модельдері дегеніміз не? Терең зерттеу.

Түнгі сағат 2-де өзіңізден жасанды интеллект модельдері деген не және неге бәрі олар туралы сиқырлы дуалар сияқты айтады деп сұраған кезіңіз болды ма? Дәл солай. Бұл мақала менің «ештеңе білмеймін» дегеннен «кешкі ас кештерінде қауіпті сенімділікке» жету үшін тым ресми емес, кейде біржақты нұсқаулық. Біз мыналарға тоқталамыз: олар не, оларды шынымен пайдалы (тек жарқыраған емес), оларды қалай жаттықтырады, шешім қабылдамай қалай таңдау керек және ауырғаннан кейін ғана білетін бірнеше тұзақтар.

Осыдан кейін оқуға болатын мақалалар:

🔗 Жасанды интеллект арбитражы дегеніміз не: танымал сөздің астарында жатқан шындық
Жасанды интеллект арбитражын, оның танымалдылығын және нақты мүмкіндіктерін түсіндіреді.

🔗 Символдық жасанды интеллект дегеніміз не: білуіңіз керек барлық нәрсе
Символдық жасанды интеллектті, оның әдістерін және қазіргі заманғы қолданыстарын қамтиды.

🔗 Жасанды интеллект үшін деректерді сақтау талаптары: Сіз не білуіңіз керек
Жасанды интеллекттің деректерді сақтау қажеттіліктері мен практикалық ойларын бөлшектейді.

Сонымен... шын мәнінде, жасанды интеллект модельдері дегеніміз не? 🧠

Ең қарапайым түрде: жасанды интеллект моделі - бұл тек үйренілген функция. Сіз оған кіріс деректерін бересіз, ол шығыс деректерін шығарады. Мәселе мынада, ол көптеген мысалдарды мұқият қарап шығып, әр жолы өзін «аз қателесетіндей» етіп өзгерту арқылы қалай екенін анықтайды . Мұны жеткілікті түрде қайталаңыз, сонда ол сіз тіпті онда бар екенін білмеген үлгілерді анықтай бастайды.

Егер сіз сызықтық регрессия, шешім ағаштары, нейрондық желілер, трансформаторлар, диффузиялық модельдер немесе тіпті k-ең жақын көршілер сияқты атауларды естіген болсаңыз - иә, олардың барлығы бір тақырыптағы рифтер: деректер енгізіледі, модель картаға түсіруді үйренеді, нәтиже шығады. Әртүрлі костюмдер, бір шоу.

Ойыншықтарды нақты құралдардан не ерекшелендіреді ✅

Көптеген модельдер демонстрацияда керемет көрінеді, бірақ өндірісте сәтсіздікке ұшырайды. Әдетте, есінде қалғандары ересектерге тән қасиеттердің қысқа тізіміне ие:

Жалпылау - ешқашан көрінбейтін деректерді бөлшектенбей өңдейді.
Сенімділік - енгізулер оғаш болған кезде тиын лақтыру сияқты әрекет етпейді.
Қауіпсіздік және қорғаныс - ойнау немесе дұрыс пайдаланбау қиынырақ.
Түсіндірмелілік - әрқашан айқын емес, бірақ кем дегенде қателерді түзетуге болады.
Құпиялылық және әділдік - деректер шекараларын құрметтейді және біржақтылыққа жол бермейді.
Тиімділік - ауқымды жұмыс істеу үшін жеткілікті қолжетімді.

Бұл негізінен кір жуу тізімінің реттеушілері мен тәуекел құрылымдары, сондай-ақ жарамдылық, қауіпсіздік, есеп беру, ашықтық, әділдік және басқа да ең жақсы нәтижелерді жақсы көреді. Бірақ шынымды айтсам, бұлар жақсы сатып алуға болатын заттар емес; егер адамдар сіздің жүйеңізге тәуелді болса, олар үстел басындағы ставкалар.

Жылдам ақыл-ой тексеруі: модельдер мен алгоритмдер және деректер 🤷

Міне, үш бөлікке бөліну:

Модель – кірістерді шығыстарға түрлендіретін үйренілген «зат».
Алгоритм - модельді жаттықтыратын немесе іске қосатын рецепт (градиенттік түсуді, сәулелік іздеуді ойлаңыз).
Деректер - модельге қалай әрекет ету керектігін үйрететін шикі мысалдар.

Сәл ебедейсіз метафора: деректер – ингредиенттер, алгоритм – рецепт, ал модель – торт. Кейде ол дәмді болады, ал кейде тым ерте қарап қалғандықтан ортасына батып кетеді.

Сіз шынымен кездестіретін жасанды интеллект модельдерінің отбасылары 🧩

Санаттар шексіз, бірақ міне, практикалық тізім:

Сызықтық және логистикалық модельдер - қарапайым, жылдам, түсіндірілетін. Кестелік деректер үшін әлі де ең жақсы базалық сызықтар.
Ағаштар мен ансамбльдер - шешім ағаштары «егер» және «онда» екіге бөлінеді; орманды біріктіріңіз немесе оларды күшейтіңіз, сонда олар таңқаларлықтай күшті болады.
Конволюциялық нейрондық желілер (CNN) - кескін/бейнені танудың негізі. Сүзгілер → жиектер → пішіндер → нысандар.
Тізбектілік модельдері: мәтін, сөйлеу, ақуыздар, код үшін RNN және трансформаторлар. Трансформаторлардың өзіне назар аударуы ойын ережесін өзгертті [3].
Диффузиялық модельдер - генеративті, кездейсоқ шуды біртіндеп когерентті кескіндерге айналдырыңыз [4].
Графтық нейрондық желілер (ГНТ) - желілер мен қатынастар үшін жасалған: молекулалар, әлеуметтік графиктер, алаяқтық сақиналары.
Күшейтілген оқыту (КҮ) - марапаттауды оңтайландыратын сынақ және қателік агенттері. Робототехниканы, ойындарды, тізбекті шешімдерді ойлаңыз.
Ескі сенімді деректер: kNN, Naive Bayes - кеше жауап қажет болған кезде, әсіресе мәтіндік хабарламалар үшін жылдам бастапқы деректер .

Қосымша ескерту: кестелік деректерде оны тым күрделендірмеңіз. Логистикалық регрессия немесе күшейтілген ағаштар көбінесе терең торларды жауып тастайды. Трансформаторлар керемет, бірақ барлық жерде емес.

Жабық жаттығу қандай көрінеді 🔧

Қазіргі заманғы модельдердің көпшілігі градиенттік төмендеудің қандай да бір түрі арқылы шығын функциясын азайту арқылы үйренеді . Кері таралу түзетулерді кері итереді, сондықтан әрбір параметр қалай қозғалу керектігін біледі. Ерте тоқтату, реттеу немесе ақылды оңтайландырулар сияқты амалдарды қосыңыз, сонда ол хаосқа ұласып кетпейді.

Жұмыс үстеліңіздің үстіне жазып алуға тұрарлық шындықты тексерулер:

Деректер сапасы > модель таңдау. Шынымен де.
Әрқашан қарапайым нәрсемен базалық сызық жасаңыз. Егер сызықтық модель тиімді болса, деректер құбырыңыз да тиімді болуы мүмкін.
Валидацияны бақылаңыз. Егер жаттығу шығыны азайса, бірақ валидация шығыны артса - сәлем, шамадан тыс сәйкестендіру.

Модельдерді бағалау: дәлдік жатыр 📏

Дәлдік жақсы естіледі, бірақ бұл өте нашар бір сан. Тапсырмаңызға байланысты:

Дәлдік - сіз оң пікір айтқан кезде қаншалықты жиі дұрыс айтасыз?
Еске түсіріңіз - барлық нақты оң жақтарының ішінен қаншасын таптыңыз?
F1 - дәлдік пен еске түсіруді теңестіреді.
PR қисықтары - әсіресе теңгерімсіз деректерде, ROC-қа қарағанда әлдеқайда шынайы [5].

Бонус: калибрлеуді (ықтималдықтардың мағынасы бар ма?) және дрейфті (енгізілген деректеріңіз аяғыңыздың астында ауысып жатыр ма?) тексеріңіз. Тіпті «тамаша» модель де ескіреді.

Басқару, тәуекел, жол ережелері 🧭

Модель адамдарға әсер еткеннен кейін, сәйкестік маңызды. Екі үлкен тіреуіш:

NIST-тің жасанды интеллект RMF-і - ерікті, бірақ практикалық, өмірлік цикл қадамдарымен (басқару, картаға түсіру, өлшеу, басқару) және сенімділік шелектерімен [1].
ЕО жасанды интеллект туралы заңы - тәуекелге негізделген реттеу, 2024 жылдың шілдесіндегі заң, жоғары тәуекелді жүйелерге және тіпті кейбір жалпы мақсаттағы модельдерге қатаң міндеттер белгілейді [2].

Прагматикалық қорытынды: не жасағаныңызды, оны қалай сынақтан өткізгеніңізді және қандай қауіптерді тексергеніңізді құжаттаңыз. Түн ортасындағы жедел қоңырауларды кейінірек қайтаруға мүмкіндік береді.

Ақылдан адаспай модель таңдау 🧭➡️

Қайталанатын процесс:

Шешімді анықтаңыз - жақсы қате мен жаман қатенің айырмашылығы неде?
Аудит деректері - мөлшері, тепе-теңдігі, тазалығы.
Шектеулерді белгілеңіз - түсіндіру мүмкіндігі, кідіріс, бюджет.
Негізгі сызықтарды іске қосыңыз - сызықтық/логистикалық немесе шағын ағаштан бастаңыз.
Ақылды түрде қайталаңыз - мүмкіндіктерді қосыңыз, реттеңіз, содан кейін тұрақтылыққа қол жеткізсеңіз, отбасыларды ауыстырыңыз.

Зеріктіретін, бірақ мұнда зеріктіретін жақсы.

Салыстырмалы сурет 📋

Модель түрі	Аудитория	Бағасы жоғары	Неліктен жұмыс істейді
Сызықтық және логистикалық	талдаушылар, ғалымдар	төмен-орташа	түсіндірілетін, жылдам, кестелік қуат көзі
Шешім ағаштары	аралас командалар	төмен	адам оқи алатын бөлулер, сызықтық емес өңдеу
Кездейсоқ орман	өнім топтары	орташа	ансамбльдер дисперсияны азайтады, күшті жалпылаушылар
Градиентпен күшейтілген ағаштар	деректер ғалымдары	орташа	Кестелік SOTA, шатастыратын мүмкіндіктері бар күшті
CNN арналары	көреген адамдар	орташа-жоғары	иірім → кеңістіктік иерархиялар
Трансформерлері	НЛП + мультимодальды	жоғары	өзіне назар аудару әдемі түрде масштабталады [3]
Диффузия модельдері	шығармашылық топтар	жоғары	Шуды азайту генеративті сиқырды береді [4]
GNN-дер	графикалық білімділер	орташа-жоғары	хабарлама жіберу қатынастарды кодтайды
kNN / Наив Байес	асығыс хакерлер	өте төмен	қарапайым негізгі сызықтар, лезде орналастыру
Күшейту бойынша оқыту	зерттеуге көп көңіл бөлетін	орташа-жоғары	тізбекті әрекеттерді оңтайландырады, бірақ оларды бағындыру қиынырақ

Тәжірибедегі «мамандықтар» 🧪

Суреттер → CNN жергілікті үлгілерді үлкенірек үлгілерге біріктіру арқылы керемет нәтижелерге қол жеткізеді.
Тіл → Трансформерлер өздеріне назар аудара отырып, ұзақ контексті өңдейді [3].
Графиктер → Байланыстар маңызды болған кезде GNN жарқырайды.
Генеративті орта → Диффузия модельдері, сатылы шуды азайту [4].

Деректер: тыныш MVP 🧰

Модельдер дұрыс емес деректерді сақтай алмайды. Негізгі мәліметтер:

Деректер жиынтығын дұрыс бөлу (ағып кету жоқ, уақытты құрметтеу).
Тепе-теңдікті бұзуды (қайта іріктеу, салмақтар, табалдырықтар) өңдеу.
Инженерлік мүмкіндіктерді мұқият қарастырыңыз - тіпті терең модельдер де пайда көреді.
Ақыл-есі дұрыстығын тексеру үшін айқас тексеру.

Өзіңізді алдамай-ақ табысты өлшеу 🎯

Көрсеткіштерді нақты шығындармен сәйкестендіріңіз. Мысал: қолдау билеттерін сұрыптау.

Қайтарып алу шұғыл билетпен ұстау көрсеткішін арттырады.
Дәлдік агенттердің шуылға батуына жол бермейді.
F1 екеуін де теңестіреді.
Жүйенің үнсіз шіріп кетпеуі үшін дрейф пен калибрлеуді бақылаңыз.

Тәуекел, әділдік, дәрігерлер - ертерек жасаңыз 📝

Құжаттаманы бюрократиялық кедергі емес, сақтандыру деп ойлаңыз. Біржақтылықты тексеру, сенімділік сынақтары, деректер көздері - жазып алыңыз. Жасанды интеллект RMF [1] және ЕО Жасанды интеллект туралы заңы [2] сияқты заңдар бәрібір үстел басына айналып барады.

Жылдам бастаушының жол картасы 🚀

Шешім мен көрсеткішті нақтылаңыз.
Таза деректер жиынтығын жинаңыз.
Сызықтық/ағаштан тұратын негізгі сызық.
Модель үшін дұрыс отбасына өтіңіз.
Тиісті көрсеткіштермен бағалаңыз.
Жеткізу алдында тәуекелдерді құжаттаңыз.

Жиі қойылатын сұрақтар: найзағай раунды⚡

Тағы да айта кетейін, жасанды интеллект моделі дегеніміз не?
Кірістерді шығыстармен салыстыру үшін деректерге үйретілген функция. Сиқыр - жаттау емес, жалпылау.
Үлкен модельдер әрқашан жеңіске жете ме?
Кестелік ағаштарда емес, олар әлі де басымдыққа ие. Мәтін/суреттерде, иә, өлшем көбінесе көмектеседі [3][4].
Түсіндірмелілік пен дәлдік пе?
Кейде ымыраға келу. Гибридті стратегияларды қолданыңыз.
Нақтылау немесе жедел инженерлік жұмыс?
Бюджет пен тапсырма көлеміне байланысты. Екеуінің де өз орны бар.

TL;DR 🌯

Жасанды интеллект модельдері - деректерден үйренетін функциялар. Оларды пайдалы ететін нәрсе - тек дәлдік қана емес, сонымен қатар сенімділік, тәуекелдерді басқару және ойластырылған орналастыру. Қарапайымнан бастаңыз, маңызды нәрселерді өлшеңіз, жағымсыз бөліктерді құжаттаңыз, содан кейін (тек содан кейін ғана) сәнділікке көшіңіз.

Егер сіз тек бір сөйлемді сақтасаңыз: жасанды интеллект модельдері үйренілген функциялар, оңтайландырумен үйретілген, контекстке тән көрсеткіштермен бағаланған және қоршаулармен орналастырылған. Мәселе осында.

Сілтемелер

NIST - Жасанды интеллект тәуекелдерін басқару құрылымы (AI RMF 1.0)
NIST AI RMF 1.0 (PDF)
ЕО жасанды интеллект туралы заңы - Ресми журнал (2024/1689, 2024 жылғы 12 шілде)
EUR-Lex: Жасанды интеллект туралы заң (Ресми PDF)
Трансформерлер / Өзіне назар аудару - Васвани және т.б., Сізге тек назар аудару керек (2017).
arXiv:1706.03762 (PDF)
Диффузия модельдері - Хо, Джайн, Аббил, Шуды азайту диффузиясының ықтималдық модельдері (2020).
arXiv:2006.11239 (PDF)
Тепе-теңдіктің бұзылуы бойынша PR және ROC - Сайто және Ремсмейер, PLOS ONE (2015).
DOI: 10.1371/journal.pone.0118432

Ресми AI көмекші дүкенінен ең соңғы AI-ді табыңыз

Біз туралы

Блогқа оралу