Нейрондық желілер жұмбақ болып естіледі, бірақ олар жұмбақ болып көрінбейді. Егер сіз жасанды интеллекттегі нейрондық желі дегеніміз не және ол тек математикалық есеп пе, соны білгіңіз келсе, сіз дұрыс жердесіз. Біз оны практикалық түрде сақтаймыз, кішкене айналма жолдармен және иә - бірнеше эмодзимен бөлісеміз. Сіз бұл жүйелердің не екенін, олардың не үшін жұмыс істейтінін, қай жерде істен шығатынын және олар туралы қол бұлғамай қалай сөйлесу керектігін біліп кетесіз.
Осыдан кейін оқуға болатын мақалалар:
🔗 AI бейімділігі дегеніміз не
Жасанды интеллект жүйелеріндегі бейтараптықты түсіну және әділдікті қамтамасыз ету стратегиялары.
🔗 Болжамды жасанды интеллект дегеніміз не
Болжамды жасанды интеллект болашақ нәтижелерді болжау үшін үлгілерді қалай пайдаланады.
🔗 Жасанды интеллект жаттықтырушысы дегеніміз не
Жасанды интеллектті оқытатын мамандардың рөлі мен міндеттерін зерттеу.
🔗 Жасанды интеллектте компьютерлік көру дегеніміз не
Жасанды интеллект компьютерлік көру арқылы визуалды деректерді қалай түсіндіреді және талдайды.
Жасанды интеллекттегі нейрондық желі дегеніміз не? 10 секундтық жауап ⏱️
Нейрондық желі – сандарды алға жіберетін, жаттығу кезінде байланыс күшін реттейтін және деректердегі заңдылықтарды біртіндеп үйренетін нейрондар деп аталатын қарапайым есептеу бірліктерінің жиынтығы. Терең оқытуды , бұл әдетте көптеген қабатталған қабаттары бар нейрондық желіні білдіреді, функцияларды сіз оларды қолмен кодтаудың орнына автоматты түрде үйренеді. Басқаша айтқанда: ақылды түрде орналастырылған, пайдалы болғанша деректер бойынша жаттыққан көптеген ұсақ математикалық бөліктер [1].
Нейрондық желіні пайдалы ететін не? ✅
-
Көрсету күші : Дұрыс архитектура мен өлшеммен желілер өте күрделі функцияларды жуықтай алады (Әмбебап жуықтау теоремасын қараңыз) [4].
-
Толық оқыту : Модель қолмен инженерлік мүмкіндіктердің орнына оларды ашады [1].
-
Жалпылау : Жақсы реттелген желі тек жаттап қана қоймайды - ол жаңа, көрінбейтін деректермен жұмыс істейді [1].
-
Масштабталу : Үлкен деректер жиынтығы мен үлкенірек модельдер көбінесе нәтижелерді жақсартады... есептеу және деректер сапасы сияқты практикалық шектеулерге дейін [1].
-
Ауыстыру мүмкіндігі : бір тапсырмада үйренілген мүмкіндіктер екіншісіне көмектесе алады (ауыстыру арқылы оқыту және жетілдіру) [1].
Кішкентай өріс жазбасы (мысал сценарийі): Шағын өнімді жіктеу тобы қолмен жасалған мүмкіндіктерді ықшам CNN-ге ауыстырады, қарапайым толықтырулар қосады (аударады/қиып алады) және валидация қатесінің төмендеуін бақылайды - бұл желі «сиқырлы» болғандықтан емес, ол пайдалы мүмкіндіктерді пикселдерден тікелей үйренгендіктен.
«Жасанды интеллекттегі нейрондық желі дегеніміз не?» қарапайым ағылшын тілінде, түсініксіз метафорамен 🍞
Наубайхана кезегін елестетіп көріңіз. Құрамы кіреді, жұмысшылар рецептті өзгертеді, дәм сынаушылар шағымданады, ал команда рецептті қайтадан жаңартады. Желіде кірістер қабаттар арқылы ағып өтеді, шығын функциясы шығысты бағалайды, ал градиенттер салмақты келесі жолы жақсырақ жұмыс істеуге итермелейді. Метафора ретінде мінсіз емес - нан сараланбайды - бірақ ол сақталады [1].
Нейрондық желінің анатомиясы 🧩
-
Нейрондар : салмақталған қосынды мен активация функциясын қолданатын кішкентай калькуляторлар.
-
Салмақ және ауытқулар : Сигналдардың қалай біріктірілетінін анықтайтын реттелетін тұтқалар.
-
Қабаттар : Кіріс қабаты деректерді қабылдайды, жасырын қабаттар оны түрлендіреді, ал шығыс қабаты болжам жасайды.
-
Белсендіру функциялары : ReLU, сигма тәрізді, тань және софтмакс сияқты сызықтық емес бұрылыстар оқуды икемді етеді.
-
Шығын функциясы : болжамның қаншалықты қате екенін көрсететін балл (жіктеу үшін айқаспалы энтропия, регрессия үшін MSE).
-
Оңтайландырғыш : SGD немесе Adam сияқты алгоритмдер салмақтарды жаңарту үшін градиенттерді пайдаланады.
-
Регуляризация : Модельдің шамадан тыс сәйкес келуіне жол бермеу үшін салмақты азайту немесе салмақты азайту сияқты әдістер.
Егер сіз ресми өңдеуді қаласаңыз (бірақ әлі де оқылатын болса), ашық Deep Learning толық ақпарат берілген: математика негіздері, оңтайландыру және жалпылау [1].
Белсендіру функциялары, қысқаша, бірақ пайдалы ⚡
-
ReLU : Теріс сандар үшін нөл, оң сандар үшін сызықтық. Қарапайым, жылдам, тиімді.
-
Сигмоид : 0 мен 1 арасындағы мәндерді басады - пайдалы, бірақ қанықтыра алады.
-
Тан : Сигма тәрізді, бірақ нөлдің айналасында симметриялы.
-
Softmax : Шикі ұпайларды сыныптар бойынша ықтималдықтарға айналдырады.
Әрбір қисық пішінін жаттап алудың қажеті жоқ - тек компромисстер мен жиі кездесетін әдепкі мәндерді біліңіз [1, 2].
Оқу іс жүзінде қалай жүреді: артқы тіреуіш, бірақ қорқынышты емес 🔁
-
Алға өту : Деректер болжам жасау үшін қабат-қабат ағып отырады.
-
Шығынды есептеу : Болжамды шындықпен салыстырыңыз.
-
Кері таралу : Тізбек ережесін пайдаланып, әрбір салмаққа қатысты шығын градиенттерін есептеңіз.
-
Жаңарту : Оңтайландырғыш салмақтарды аздап өзгертеді.
-
Қайталау : Көптеген дәуірлер. Модель біртіндеп үйренеді.
Көрнекіліктер мен кодқа байланысты түсіндірмелермен практикалық интуицияны алу үшін артқы проп және оңтайландыру туралы классикалық CS231n жазбаларын қараңыз [2].
Нейрондық желілердің негізгі отбасылары, қысқаша 🏡
-
Кері байланыс желілері (КТЖ) : Ең қарапайым түрі. Деректер тек алға жылжиды.
-
Конволюциялық нейрондық желілер (CNN) : Шеттерін, текстураларын, пішіндерін анықтайтын кеңістіктік сүзгілердің арқасында кескіндер үшін тамаша [2].
-
Қайталанатын нейрондық желілер (RNN) және нұсқалар : Мәтін немесе уақыттық қатарлар сияқты тізбектер үшін реттілік сезімін сақтау арқылы жасалған [1].
-
Трансформаторлар : Тілде және одан тыс жерлерде басым болатын тізбектегі позициялар арасындағы қатынастарды бірден модельдеуге назар аударыңыз [3].
-
Графтық нейрондық желілер (ГНЖ) : Графтың түйіндері мен шеттерінде жұмыс істеу - молекулалар, әлеуметтік желілер үшін пайдалы, ұсыныс [1].
-
Автокодерлер және VAE : Сығылған көріністерді үйреніңіз және вариацияларды жасаңыз [1].
-
Генеративтік модельдер : GAN-нан диффузиялық модельдерге дейін, кескіндер, аудио, тіпті код үшін қолданылады [1].
CS231n жазбалары CNN үшін әсіресе қолайлы, ал Transformer қағазы назар аударуға негізделген модельдер үшін негізгі дереккөз болып табылады [2, 3].
Салыстыру кестесі: кең таралған нейрондық желі түрлері, олар кімге арналған, баға вибрациялары және олардың неліктен жұмыс істейтіні 📊
| Құрал / Түрі | Аудитория | Бағасы жоғары | Неліктен жұмыс істейді |
|---|---|---|---|
| Алға бағытталған кері байланыс (MLP) | Жаңадан бастаушылар, талдаушылар | Төмен-орташа | Қарапайым, икемді, лайықты негіздер |
| CNN | Көру топтары | Орташа | Жергілікті үлгілер + параметрлерді ортақ пайдалану |
| RNN / LSTM / GRU | Sequence people | Орташа | Уақытша жад тәрізді... тәртіпті сақтайды |
| Трансформатор | НЛП, мультимодальды | Орташа-жоғары | Назар тиісті қарым-қатынастарға аударылады |
| GNN | Ғалымдар, recsys | Орташа | Графтарға жіберілген хабарлама құрылымды көрсетеді |
| Автокодер / VAE | Зерттеушілер | Төмен-орташа | Қысылған көріністерді үйренеді |
| GAN / Диффузия | Шығармашылық зертханалар | Орташа-жоғары | Қарсылас немесе итеративті шуды басатын сиқыр |
Ескертпелер: баға есептеу және уақытқа байланысты; жүріп өткен жолыңыз әртүрлі. Бір немесе екі ұяшық әдейі әдейі сөйлеседі.
«Жасанды интеллекттегі нейрондық желі дегеніміз не?» классикалық машиналық оқыту алгоритмдерімен салыстырғанда ⚖️
-
Функцияларды инженериялау : Классикалық машиналық оқыту көбінесе қолмен басқарылатын функцияларға сүйенеді. Нейрондық желілер функцияларды автоматты түрде үйренеді - бұл күрделі деректер үшін үлкен жеңіс [1].
-
Деректерге деген құштарлық : Желілер көбінесе көбірек деректермен жарқырайды; шағын деректер қарапайым модельдерге қолайлы болуы мүмкін [1].
-
Есептеу : Желілер GPU сияқты үдеткіштерді жақсы көреді [1].
-
Өнімділік шегі : Құрылымдалмаған деректер (кескіндер, аудио, мәтін) үшін терең желілер басым болады [1, 2].
Іс жүзінде жұмыс істейтін жаттығу процесі 🛠️
-
Мақсатты анықтаңыз : жіктеу, регрессия, рейтинг, генерация - сәйкес келетін шығынды таңдаңыз.
-
Деректерді талқылау : Тренинг/тексеру/сынақ бөлімдеріне бөлінеді. Функцияларды қалыпқа келтіру. Теңгерім кластары. Кескіндер үшін аударымдар, кесінділер, шағын шу сияқты үлкейтулерді қарастырыңыз.
-
Архитектураны таңдау : Қарапайымнан бастаңыз. Сыйымдылықты тек қажет болған кезде ғана қосыңыз.
-
Оқыту циклі : Деректерді топтастыру. Алға өту. Шығынды есептеу. Артқы тіреуіш. Жаңарту. Журнал көрсеткіштері.
-
Қалыптастыру : салмақ жоғалту, салмақ жоғалту, ерте тоқтату.
-
Бағалау : Гиперпараметрлер үшін валидация жиынтығын пайдаланыңыз. Соңғы тексеру үшін сынақ жиынтығын ұстаңыз.
-
Кеме мұқият ауытқуын бақылаңыз, ауытқуларды тексеріңіз, кері қайтуды жоспарлаңыз.
Толық теориясы бар, кодқа бағытталған оқулықтар үшін ашық оқулық және CS231n жазбалары сенімді тірек болып табылады [1, 2].
Шамадан тыс сәйкестендіру, жалпылау және басқа да гремлиндер 👀
-
Шамадан тыс сәйкестендіру : Модель жаттығу ерекшеліктерін жаттап алады. Көбірек деректермен, күштірек регуляризациямен немесе қарапайым архитектуралармен түзетіледі.
-
Сәйкес келмеуі : Модель тым қарапайым немесе жаттығу кезінде тым ұялшақ. Сыйымдылығын арттырыңыз немесе ұзағырақ жаттықтырыңыз.
-
Деректердің ағып кетуі : Тест жинағынан алынған ақпарат жаттығуға жасырын түрде енеді. Бөлінулеріңізді үш рет тексеріңіз.
-
Нашар калибрлеу : сенімді, бірақ қателесетін модель қауіпті. Калибрлеуді немесе салмақ жоғалтуды қарастырыңыз.
-
Тарату ығысуы : нақты әлемдегі деректер қозғалысы. Бақылау және бейімдеу.
Жалпылау және регуляризация теориясы үшін стандартты сілтемелерге сүйеніңіз [1, 2].
Қауіпсіздік, түсіндіру мүмкіндігі және жауапты орналастыру 🧭
Нейрондық желілер маңызды шешімдер қабылдай алады. Олардың көшбасшылар тақтасында жақсы жұмыс істеуі жеткіліксіз. Өмірлік цикл бойынша басқару, өлшеу және азайту қадамдары қажет. NIST AI тәуекелдерді басқару құрылымы командаларға тәуекелдерді басқаруды жобалау мен орналастыруға біріктіруге көмектесу үшін практикалық функцияларды - БАСҚАРУ, КАРТАЛАУ, ӨЛШЕУ, БАСҚАРУ - сипаттайды [5].
Бірнеше жылдам кеңестер:
-
Қателіктерді тексеру : Қажетті және заңды болған жағдайда демографиялық бөліктерді бағалау.
-
Түсіндіру : Айқындық немесе ерекшеліктерді көрсету сияқты әдістерді қолданыңыз. Олар жетілмеген, бірақ пайдалы.
-
Мониторинг : кенеттен метрикалық төмендеулер немесе деректер ауытқуы туралы ескертулерді орнатыңыз.
-
Адамдардың бақылауы : Адамдарды маңызды шешімдер қабылдау кезінде хабардар етіп отырыңыз. Батырлық жасамаңыз, тек гигиенаны сақтаңыз.
Сізден жасырын түрде жиі қойылатын сұрақтар 🙋
Нейрондық желі негізінен ми ма?
Мидан шабыттанған, иә - бірақ жеңілдетілген. Желілердегі нейрондар - математикалық функциялар; биологиялық нейрондар - күрделі динамикасы бар тірі жасушалар. Ұқсас тербелістер, мүлдем басқа физика [1].
Маған қанша қабат қажет?
Кішкентайдан бастаңыз. Егер сіз жеткіліксіз болса, енін немесе тереңдігін қосыңыз. Егер сіз шамадан тыс артық болсаңыз, сыйымдылықты реттеңіз немесе азайтыңыз. Сиқырлы сан жоқ; тек валидация қисықтары мен шыдамдылық бар [1].
Маған әрқашан графикалық процессор қажет пе?
Әрқашан емес. Шағын модельдер шағын деректермен жұмыс істейтін процессорларды қолдана алады, бірақ кескіндер, үлкен мәтіндік модельдер немесе үлкен деректер жиынтықтары үшін үдеткіштер көп уақытты үнемдейді [1].
Неліктен адамдар назар аударудың күші бар деп айтады?
Өйткені назар модельдерге қатаң ретпен жүрмей, кірістің ең маңызды бөліктеріне назар аударуға мүмкіндік береді. Ол жаһандық қатынастарды көрсетеді, бұл тілдік және мультимодальды тапсырмалар үшін маңызды [3].
«Жасанды интеллекттегі нейрондық желі дегеніміз не?» «Терең оқыту дегеніміз не?» ұғымынан өзгеше ме?
Терең оқыту – терең нейрондық желілерді қолданатын кеңірек тәсіл. Сондықтан, жасанды интеллектте нейрондық желі дегеніміз не? басты кейіпкер туралы сұраумен бірдей; терең оқыту – бұл бүкіл фильм [1].
Практикалық, аздап пікірге негізделген кеңестер 💡
-
қарапайым негізгі сызықтарға артықшылық беріңіз . Тіпті кішкентай көп қабатты перцептронның өзі деректердің үйренуге болатындығын анықтай алады.
-
Деректер құбырын қайталанатындай етіп сақтаңыз . Егер оны қайта іске қоса алмасаңыз, оған сене алмайсыз.
-
Оқу жылдамдығы сіз ойлағаннан да маңызды. Кестені қолданып көріңіз. Жылыту жаттығулары көмектесе алады.
-
Партия көлемі бойынша компромисстер бар. Үлкен партиялар градиенттерді тұрақтандырады, бірақ басқаша жалпылауы мүмкін.
-
Шатасқан кезде, жоғалту қисықтары мен салмақ нормаларын . Жауаптың графиктерде қаншалықты жиі кездесетініне таң қаласыз.
-
Болжамдарды құжаттаңыз. Болашақта сіз заттарды тез ұмытасыз [1, 2].
Терең ой жүгірту: деректердің рөлі немесе неге қоқыс әлі де қоқысты шығаруды білдіреді 🗑️➡️✨
Нейрондық желілер ақаулы деректерді сиқырлы түрде түзете алмайды. Қисық белгілер, аннотация қателері немесе тар іріктеу модель арқылы жаңғырық табады. Саралаңыз, аудит жасаңыз және толықтырыңыз. Егер сізге көбірек деректер немесе жақсырақ модель қажет пе екеніне сенімді болмасаңыз, жауап көбінесе тітіркендіргіш қарапайым: екеуі де - бірақ деректер сапасынан бастаңыз [1].
«Жасанды интеллекттегі нейрондық желі дегеніміз не?» - қайта пайдалануға болатын қысқаша анықтамалар 🧾
-
Нейрондық желі - градиент сигналдарын пайдаланып салмақтарды реттеу арқылы күрделі үлгілерді үйренетін қабатты функция жуықтаушысы [1, 2].
-
Бұл шығынды азайтуға үйретілген, бірізді сызықтық емес қадамдар арқылы кірістерді шығыстарға түрлендіретін жүйе [1].
-
Бұл кескіндер, мәтін және аудио сияқты құрылымдалмаған енгізулерде дамып келе жатқан икемді, деректерге бай модельдеу тәсілі [1, 2, 3].
Тым ұзақ, оқылмады және қорытынды ескертулер 🎯
Егер біреу сізден жасанды интеллекттегі нейрондық желі дегеніміз не деп сұраса, міне, негізгі ой: нейрондық желі – деректерді біртіндеп түрлендіретін, шығынды азайту және градиенттерді ұстану арқылы түрлендіруді үйренетін қарапайым бірліктер жиынтығы. Олар масштабталатындықтан, мүмкіндіктерді автоматты түрде үйренетіндіктен және өте күрделі функцияларды көрсете алатындықтан күшті [1, 4]. Егер сіз деректер сапасын, басқаруды немесе мониторингті елемесеңіз, олар қауіпті [5]. Және олар сиқыр емес. Тек математика, есептеу және жақсы инженерия – аздап талғаммен.
Мұқият таңдалған қосымша оқу материалдары (дәйексөзсіз қосымша материалдар)
-
Stanford CS231n ескертпелері - қолжетімді және практикалық: https://cs231n.github.io/
-
DeepLearningBook.org - канондық сілтеме: https://www.deeplearningbook.org/
-
NIST жасанды интеллект тәуекелдерін басқару құрылымы - жауапты жасанды интеллект бойынша нұсқаулық: https://www.nist.gov/itl/ai-risk-management-framework
-
«Назар аудару – сізге қажет нәрсе» – Transformer мақаласы: https://arxiv.org/abs/1706.03762
Сілтемелер
[1] Гудфеллоу, И., Бенджио, Ю., және Курвилл, А. Терең оқыту . MIT баспасы. Тегін онлайн нұсқасы: толығырақ оқыңыз
[2] Stanford CS231n. Көрнекі тануға арналған конволюциялық нейрондық желілер (курс ескертпелері): толығырақ оқыңыз
[3] Васвани, А., Шазир, Н., Пармар, Н. және т.б. (2017). Сізге тек назар аудару керек . NeurIPS. arXiv: толығырақ оқу
[4] Цибенко, Г. (1989). Сигмоидальды функцияның суперпозициялары арқылы жуықтау . Басқару, сигналдар және жүйелер математикасы , 2, 303–314. Springer: толығырақ оқу
[5] NIST. Жасанды интеллект тәуекелдерін басқару құрылымы (ЖИ RMF) : толығырақ оқу