Жасанды интеллект агенті жобамның сәттілігін қалай қамтамасыз ете аламын?

Жасанды интеллект агенті жобаңыздың сәтті болуын қамтамасыз ету үшін жұмысты бір сөйлеммен анықтап, өзіңізге ыңғайлы автономия деңгейін анықтаңыз. Сонымен қатар, жиі кездесетін қателіктердің алдын алу және ақаулықтарды жақсырақ жою үшін қатаң құрал схемаларын, журнал жүргізуді және тексеру стратегияларын қолданыңыз.

Жасанды интеллект агентіме арналған құралдарды жобалау кезінде нені ескеруім керек?

Жасанды интеллект агентіңізге арналған құралдарды жасаған кезде, олардың тар фокуста, терілген және рұқсат етілген екеніне көз жеткізіңіз. Кез келген әрекетті орындай алатын жалпы құралдардан аулақ болыңыз. Оның орнына, агент қауіпсіздік пен сенімділікті сақтау үшін пайдалана алатын арнайы функция шақыруларын жасаңыз.

Жасанды интеллект агентім үшін тоқтатудың нақты шарттарын қалай орнатамын?

Жасанды интеллект агентіңіз үшін нақты тоқтату шарттарын орнату үшін, ол жасай алатын қадамдардың максималды санын, сондай-ақ тайм-ауттар мен аяқталу тексерулерін анықтаңыз. Бұл агенттің ілмектерде тұрып қалуына жол бермейді және қажет болған жағдайда мәселелерді ушықтыра алатынына көз жеткізеді.

Жасанды интеллект агентінде жадты басқарудың ең жақсы жолы қандай?

Жасанды интеллект агентіңіздегі жадты қысқа мерзімді және ұзақ мерзімді компоненттерге бөлу арқылы басқарыңыз. Пайдаланушы қалаулары мен ұйымдастырушылық ережелер сияқты тұрақты ақпарат үшін ұзақ мерзімді жадты пайдалана отырып, қысқа мерзімді жадты ықшам ұстаңыз, ағымдағы қадамдар мен жоспарларға назар аударыңыз.

Жасанды интеллект агенті ішінде тапсырмаларды жоспарлаудың нақты үлгілері бар ма?

Иә, әртүрлі жоспарлау үлгілерін пайдалануға болады, мысалы, болжамды тапсырмаларға арналған тексеру тізімдері, құрал нәтижелеріне бейімделгіш жауаптар үшін ReAct циклдары және күрделі жобалар үшін рөлдерді бөлуге мүмкіндік беретін жетекші-жұмысшы модельдері. Агентіңіздің нақты талаптарына негізделген жоспарлау әдісін таңдаңыз.

Жасанды интеллект агентімнің жұмысын қалай тиімді бағалай аламын?

Жасанды интеллект агентіңіздің жұмысын бағалау үшін сәтті жолдарды, шеткі жағдайларды және түсініксіз сұраныстарды қамтитын сценарийлер жиынтығын жасаңыз. Оның мүмкіндіктерін үнемі жақсарту үшін нәтижелерді тапсырманың сәттілік деңгейі, жауап беру уақыты және қателерден қалпына келтіру сияқты көрсеткіштерге негіздеп бағалаңыз.

Жасанды интеллект агентін қалай құруға болады

Қысқа жауап: Іс жүзінде жұмыс істейтін жасанды интеллект агентін құру үшін оны басқарылатын цикл ретінде қарастырыңыз: енгізуді қабылдаңыз, келесі әрекетті шешіңіз, тар ауқымды құралды шақырыңыз, нәтижені бақылаңыз және анық «орындалды» тексеруі өткенше қайталаңыз. Тапсырма көп сатылы және құралмен басқарылған кезде ол өз орнын алады; егер бір ғана шақыру оны шешсе, агентті өткізіп жіберіңіз. Құралдар істен шыққанда немесе енгізулер түсініксіз болғанда, агент циклдің орнына күшейетіндей етіп, қатаң құрал схемаларын, қадам шектеулерін, журнал жүргізуді және валидатор/сыншыны қосыңыз.

Негізгі қорытындылар:

Контроллер циклі: енгізуді енгізу→әрекет ету→айқын тоқтату шарттарымен және максималды қадамдармен қайталауды бақылау.

Құралдарды жобалау: «Кез келген нәрсені істеу» хаосын болдырмау үшін құралдарды тар, терілген, рұқсат етілген және тексерілген күйде ұстаңыз.

Жад гигиенасы: Қысқа мерзімді ықшам күйді және ұзақ мерзімді қалпына келтіруді пайдаланыңыз; толық транскрипцияларды жіберіп алмаңыз.

Дұрыс пайдаланбауға төзімділік: Тәуекелді әрекеттер үшін рұқсат етілген тізімдерді, тарифтік шектеулерді, идемпотенттілікті және «құрғақ жұмысты» қосыңыз.

Тестілеу мүмкіндігі: Сценарийлер жиынтығын (сәтсіздіктер, түсініксіздіктер, инъекциялар) сақтаңыз және әрбір өзгерісте қайта іске қосыңыз.

Инфографика: Жасанды интеллект агентін қалай құруға болады?

Осыдан кейін оқуға болатын мақалалар:

🔗 AI өнімділігін қалай өлшеуге болады
Жылдамдықты, дәлдікті және сенімділікті бағалау үшін практикалық көрсеткіштерді үйреніңіз.

🔗 AI-мен қалай сөйлесуге болады
Жақсы жауап алу үшін сұрақтарды, контекстті және қосымша мәліметтерді пайдаланыңыз.

🔗 Жасанды интеллект модельдерін қалай бағалауға болады
Тесттерді, рубрикаларды және нақты әлемдегі тапсырма нәтижелерін пайдаланып модельдерді салыстырыңыз.

🔗 Жасанды интеллект модельдерін қалай оңтайландыруға болады
Баптау, кесу және бақылау арқылы сапаны және шығынды жақсартыңыз.

1) Жасанды интеллект агенті дегеніміз не, қарапайым адам тұрғысынан 🧠

Жасанды интеллект агенті - цикл. LangChain «Агенттер» құжаттары

Болды. Ортасында миы бар цикл.

Енгізу → ойлау → әрекет → бақылау → қайталау. ReAct қағазы (себеп + әрекет)

Қайда:

Енгізу - пайдаланушы сұрауы немесе оқиға (жаңа электрондық пошта, қолдау билеті, сенсорлық пинг).
Ойлау - келесі қадам туралы ойланудың тілдік моделі.
Act құралды шақыруда (ішкі құжаттарды іздеу, кодты іске қосу, билет жасау, жауап жазу). OpenAI функциясын шақыру нұсқаулығы
Observe құралдың шығысын оқиды.
Қайталау - бұл «әңгімелесудің» орнына «агенттік» сезім тудыратын бөлік. LangChain «Агенттер» құжаттары

Кейбір агенттер негізінен ақылды макростар болып табылады. Басқалары тапсырмаларды орындай алатын және қателерді қалпына келтіре алатын кіші оператор сияқты әрекет етеді. Екеуі де маңызды.

Сонымен қатар, сізге толық автономия қажет емес. Шын мәнінде... сіз оны қаламайтын шығарсыз 🙃

2) Агентті қашан құру керек (және қашан құрмау керек) 🚦

Агентті келесі жағдайларда құрыңыз:

Жұмыс көп сатылы және ортасында не болатынына байланысты өзгереді.
Жұмыс құралдарды пайдалануды (дерекқорлар, CRM, кодты орындау, файлдарды генерациялау, браузерлер, ішкі API). LangChain «Құралдар» құжаттары
Сіз қоршаулармен қайталанатын нәтижелерді қалайсыз , тек бір реттік жауаптар емес
«Дайын» деген сөзді компьютер тексере алатындай, тіпті еркін түрде де анықтауға болады.

Агентті келесі жағдайларда құрмаңыз:

Қарапайым сұрақ + жауап мәселені шешеді (шамадан тыс инженерлік жасамаңыз, кейін өзіңізді жек көресіз).
Сізге мінсіз детерминизм қажет (агенттер тұрақты болуы мүмкін, бірақ роботтық емес).
Сізде қосылуға арналған ешқандай құралдар немесе деректер жоқ - онда бұл көбінесе тек вибрациялар.

Ашығын айтайық: «Жасанды интеллект агенттерінің жобаларының» жартысы бірнеше тармақталу ережелері бар жұмыс процесі болуы мүмкін. Бірақ кейде атмосфера да маңызды 🤷♂️

3) Жасанды интеллект агентінің жақсы нұсқасын не құрайды ✅

Сіз сұраған «Жақсы нұсқасын не жасайды» бөлімі мынау, бірақ мен аздап тіке айтайын:

Жасанды интеллект агентінің жақсы нұсқасы емес . Ол:

Не істеуге рұқсат етілгенін біледі (қолдану аясының шекаралары)
Құралдарды сенімді түрде пайдаланады (құрылымдық шақырулар, қайталау әрекеттері, тайм-ауттар) OpenAI функциясын шақыру нұсқаулығы AWS «Дірілмен тайм-ауттар, қайталау әрекеттері және кері байланыс»
Күйді таза ұстайды (шытырмайтын жад) LangChain “Жадқа шолу”
Өз әрекеттерін түсіндіреді (құпия пайымдау материалдары емес, аудит іздері) NIST AI RMF 1.0 (сенімділік және ашықтық)
Тиісті түрде тоқтайды (аяқтауды тексеру, максималды қадамдар, эскалация) LangChain «Агенттер» құжаттары
Қауіпсіз сәтсіздікке ұшырайды (көмек сұрайды, билікті елестетпейді) NIST AI RMF 1.0
Сынақтан өткізуге болады (оны консервіленген сценарийлерде іске қосып, нәтижелерді бағалауға болады)

Егер сіздің агентіңізді тексеру мүмкін болмаса, бұл өте сенімді ойын автоматы. Кештерде көңілді, ал түсірілім кезінде қорқынышты 😬

4) Агенттің негізгі құрылыс блоктары («анатомия» 🧩)

Көптеген қатты агенттерде келесі бөліктер бар:

A) Контроллер циклі 🔁

Бұл оркестрист:

гол соғу
келесі әрекет үшін үлгіні сұраңыз
іске қосу құралы
бақылауды қосу
LangChain «Агенттер» құжаттары аяқталғанша қайталаңыз

B) Құралдар (яғни мүмкіндіктер) 🧰

Агентті тиімді ететін құралдар: LangChain «Құралдар» құжаттары

дерекқор сұраулары
электрондық пошталарды жіберу
файлдарды тарту
іске қосылған код
ішкі API шақыру
электрондық кестелерге немесе CRM жүйелеріне жазу

C) Есте сақтау 🗃️

Екі түрі маңызды:

қысқа мерзімді жад: ағымдағы іске қосу контексті, соңғы қадамдар, ағымдағы жоспар
ұзақ мерзімді жад: пайдаланушы қалаулары, жоба контексті, алынған білім (көбінесе ендірмелер + векторлық қойма арқылы) RAG қағазы

D) Жоспарлау және шешім қабылдау саясаты 🧭

Оны «жоспарлау» деп атамасаңыз да, сізге әдіс қажет:

тексеру тізімдері
ReAct стиліндегі «ойлан, сосын құрал» ReAct қағазы
тапсырма графиктері
басшы-жұмысшы үлгілері
Microsoft AutoGen (көп агентті құрылым) супервайзер-жұмысшы үлгілері

E) Қоршаулар және бағалау 🧯

рұқсаттар
OpenAI құрылымдық шығыстарының қауіпсіз құрал схемалары
шығыс валидациясы
қадам шектеулері
каротаж
NIST AI RMF 1.0 сынақтары

Иә, бұл шабыттандырудан гөрі инженерлік. Міне, мәселе осында.

5) Салыстыру кестесі: агент құрудың танымал тәсілдері 🧾

Төменде шынайы «Салыстыру кестесі» берілген - бірнеше ерекшеліктермен, себебі нағыз командалар ерекше 😄

Құрал / Құрылым	Аудитория	Бағасы	Неліктен жұмыс істейді	Ескертпелер (кішкентай хаос)
ЛангЧейн	лего стиліндегі бөлшектерді ұнататын құрылысшылар	тегін + инфрақызыл	құралдар, жад, тізбектер үшін үлкен экожүйе	заттарды анық атамасаңыз, спагетти тез жеп қоюыңыз мүмкін
LlamaIndex	RAG-ауыр командалар	тегін + инфрақызыл	күшті іздеу үлгілері, индекстеу, қосқыштар	агентіңіз негізінен «іздеу + әрекет» болғанда өте жақсы... бұл жиі кездеседі
OpenAI көмекшілерінің стилдік тәсілі	командалар жылдамырақ дайындықты қалайды	қолдануға негізделген	кіріктірілген құралды шақыру үлгілері және іске қосу күйі	кейбір бұрыштарда икемділігі аз, бірақ көптеген қолданбалар үшін таза	OpenAI API OpenAI көмекшілерінің функциясын шақыруды
Семантикалық ядро	құрылымдалған оркестрлеуді қалайтын әзірлеушілер	еркін	дағдылар/функциялар үшін ұқыпты абстракция	«Кәсіпорын тазалығы» сезіледі - кейде бұл мақтау 😉
AutoGen	көп агентті эксперимент жасаушылар	еркін	агенттер арасындағы ынтымақтастық үлгілері	артық сөйлей алады; қатаң жұмыстан босату ережелерін белгілейді
CrewAI	«Агенттер командасының» жанкүйерлері	еркін	рөлдер + тапсырмалар + тапсырмаларды білдіру оңай	тапсырмалар жұмсақ емес, анық болған кезде жақсы жұмыс істейді
Шөп үйіндісі	іздеу + құбырлардағы адамдар	еркін	қатты құбырлар, қалпына келтіру, компоненттер	«агент театры» азырақ, «практикалық фабрика» көбірек
Өзіңіз домалатыңыз (арнайы цикл)	бақылаушы жанкүйерлер (мейірімді)	сіздің уақытыңыз	минималды сиқыр, максималды айқындық	әдетте ең жақсы ұзақ мерзімді... бәрін қайта ойлап тапқанша 😅

Бірде-бір жеңімпаз жоқ. Ең жақсы таңдау агентіңіздің негізгі жұмысы ақпаратты іздеу, құралдарды орындау, бірнеше агентті үйлестірунемесе жұмыс процесін автоматтандыру.

6) Жасанды интеллект агентін кезең-кезеңімен қалай құруға болады (нақты рецепт) 🍳🤖

Көпшілік бұл бөлікті өткізіп жібереді, содан кейін агенттің неге қоймадағы енот сияқты әрекет ететініне таң қалады.

1-қадам: Жұмысты бір сөйлеммен анықтаңыз 🎯

Мысалдар:

«Саясат пен билет контекстін пайдаланып, тұтынушы жауабын жазыңыз, содан кейін мақұлдауды сұраңыз.»
«Қате туралы есепті зерттеңіз, оны қайта жасаңыз және түзетуді ұсыныңыз.»
«Мінсіз жиналыс жазбаларын тапсырмаларға, иелеріне және мерзімдеріне айналдырыңыз»

Егер сіз оны қарапайым түрде анықтай алмасаңыз, агентіңіз де анықтай алмайды. Яғни, ол анықтай алады, бірақ ол импровизация жасайды, ал импровизация бюджеттің өлетін жері.

2-қадам: Автономия деңгейін анықтаңыз (төмен, орташа, ащы) 🌶️

Төмен автономия: қадамдарды ұсынады, адамның басулары «мақұлдайды»
Орташа: құралдарды іске қосады, нәтижелерді жобалайды, белгісіздік жағдайында күшейтеді
Жоғары: толықтай орындайды, тек ерекше жағдайларда адамдарға пинг жібереді

Қалағаныңыздан төменірек бастаңыз. Кейінірек оны әрқашан күшейте аласыз.

3-қадам: Модель стратегияңызды таңдаңыз 🧠

Әдетте сіз мынаны таңдайсыз:

бәріне бір күшті модель (қарапайым)
бір күшті модель + арзан қадамдар үшін кішірек модель (жіктеу, бағыттау)
қажет болған жағдайда мамандандырылған модельдер (көру, код, сөйлеу)

Сондай-ақ шешім қабылдаңыз:

максималды токендер
температура
іштей ұзақ пайымдау іздерін қалдыруға рұқсат етесіз бе (мүмкін, бірақ шикі ой тізбегін соңғы пайдаланушыларға ашпаңыз)

4-қадам: Қатаң схемалары бар құралдарды анықтаңыз 🔩

Құралдар келесідей болуы керек:

тар
терілген
рұқсат етілген
тексерілген OpenAI құрылымдық шығыстары

do_anything(input: string) деп аталатын құралдың орнына келесіні жасаңыз:

search_kb(query: string) -> нәтижелер[]
create_ticket(тақырып: жол, дене: жол, басымдық: тізім) -> ticket_id
send_email(to: string, subject: string, body: string) -> status OpenAI функциясын шақыру нұсқаулығы

Егер сіз агентке шынжырлы ара берсеңіз, ол қоршауды да алып тастап, бұтаны кесіп тастағанда, таң қалмаңыз.

5-қадам: Контроллер циклін құрастырыңыз 🔁

Ең аз цикл:

Мақсат + бастапқы контексттен бастаңыз
Модельден сұраңыз: «Келесі әрекет?»
Егер құрал шақырылса - құралды орындаңыз
Бақылауды қосу
Тоқтату жағдайын тексеру
LangChain «Агенттер» құжаттарын қайталаңыз (максималды қадамдармен)

Қосу:

тайм-ауттар
қайталаулар (абай болыңыз - қайталаулар циклдік болуы мүмкін) AWS “Дірілмен уақытша үзілістер, қайталаулар және кері шегіну”
құрал қатесін пішімдеу (анық, құрылымдалған)

6-қадам: Жадты мұқият қосыңыз 🗃️

Қысқа мерзімді: әр қадам сайын жаңартылып отыратын ықшам «күйдің қысқаша мазмұнын» сақтау. LangChain «Жадқа шолу».
Ұзақ мерзімді: тұрақты деректерді сақтау (пайдаланушы қалаулары, ұйым ережелері, тұрақты құжаттар).

Басты ереже:

егер ол жиі өзгерсе - оны қысқа мерзімді сақтаңыз
егер ол тұрақты болса - ұзақ уақыт сақтаңыз
егер ол сезімтал болса - минималды түрде сақтаңыз (немесе мүлдем сақтамаңыз)

7-қадам: Тексеруді және «сыншы» өтуін қосыңыз 🧪

Арзан, практикалық үлгі:

агент нәтиже жасайды
валидатор құрылым мен шектеулерді тексереді
Қадамдардың орындалмауы немесе саясаттың бұзылуы үшін қосымша сыншы үлгі шолулары NIST AI RMF 1.0

Мінсіз емес, бірақ таңқаларлықтай мағынасыз сөздерді қамтиды.

8-қадам: Журналға жазбағаныңызға өкінетін барлық нәрсені жазып алыңыз 📜

Журнал:

құрал шақырулары + кірістер + шығыстар
қабылданған шешімдер
қателер
қорытынды нәтижелер
OpenTelemetry бақылауға арналған праймер токендер және кідіріс

Болашақ - саған рақмет айтасың. Қазіргіні - ұмытасың. Бұл жай ғана өмір 😵💫

7) Жаныңызды ауыртпайтын құралмен жұмыс істеу 🧰😵

Құралдарды шақыру - «Жасанды интеллект агентін қалай құру керек» нағыз бағдарламалық жасақтама инженериясына айналатын жер.

Құралдарды сенімді етіңіз (сенімді болу жақсы)

Сенімді құралдар:

детерминистік
тар ауқымдағы
тексеруге оңай
Stripe «Идемпотент сұрауларын» қайта іске қосу қауіпсіз

Тек нұсқаулықтарды ғана емес, құрал қабатына қоршауларды қосыңыз

Сұраулар сыпайы ұсыныстар болып табылады. Құралды тексеру - бұл құлыпталған есік. OpenAI құрылымдық шығыстары

Істе:

рұқсат тізімдері (қай құралдарды іске қосуға болады)
енгізуді тексеру
тарифтік шектеулер бойынша нұсқаулық
әрбір пайдаланушы/ұйым үшін рұқсат тексерулері
Тәуекелді әрекеттерге арналған «құрғақ жүгіру режимі»

Ішінара істен шығуға арналған дизайн

Құралдар істен шығады. Желілер дірілдейді. Авторизация мерзімі аяқталады. Агент келесі әрекеттерді орындауы керек:

қателерді түсіндіру
тиісті болған кезде кері қайтарумен қайталап көріңіз Google Cloud қайталап көру стратегиясы (кері қайтару + діріл)
балама құралдарды таңдаңыз
кептеліп қалған кезде күшейеді

Тыныш тиімді амал: құрылымдық қателерді қайтару сияқты:

түрі: аутентификация_қателігі
түрі: табылмады
түрі: rate_limited
Сондықтан модель үрейленудің орнына ақылды түрде жауап бере алады.

8) Сізді мазалаудың орнына көмектесетін естелік 👻🗂️

Есте сақтау қабілеті күшті, бірақ ол қоқыс жәшігіне айналуы мүмкін.

Қысқа мерзімді жад: оны ықшам ұстаңыз

Қолданылуы:

соңғы N қадамдар
жұмыс қорытындысы (әр цикл сайын жаңартылады)
ағымдағы жоспар
ағымдағы шектеулер (бюджет, уақыт, саясат)

Егер сіз бәрін контекстке салсаңыз, сіз мынаны аласыз:

жоғары құны
баяу кідіріс
көбірек шатасу (иә, тіпті сонда да)

Ұзақ мерзімді жад: «толтыру» орнына қайта қалпына келтіру

Көптеген «ұзақ мерзімді есте сақтау» келесідей:

ендірмелер
векторлық дүкен
қалпына келтіру кеңейтілген генерация (RAG) RAG қағазы

Агент жаттап алмайды. Ол жұмыс уақытында ең маңызды үзінділерді алады. LlamaIndex “RAG-қа кіріспе”

Есте сақтаудың практикалық ережелері

«Қалаулар» нақты фактілер ретінде сақталады: «Пайдаланушы тізімдегі қысқаша мазмұнды ұнатады және эмодзилерді жек көреді» (күлкілі, бірақ мұнда емес 😄)
«Шешімдерді» уақыт белгілерімен немесе нұсқаларымен сақтаңыз (әйтпесе қайшылықтар жиналып қалады)
Шынымен қажет болмаса, құпияларды ешқашан сақтамаңыз

Міне, менің жетілмеген метафорам: есте сақтау тоңазытқыш сияқты. Егер оны ешқашан тазаламасаңыз, ақырында сэндвичіңіз пияз бен өкініштің дәмін татады.

9) Жоспарлау үлгілері (қарапайымнан бастап сәндіге дейін) 🧭✨

Жоспарлау – бұл тек бақыланатын ыдырау. Оны мистикалық етпеңіз.

А үлгісі: Тексеру тізімін жоспарлаушы ✅

Модель қадамдар тізімін шығарады
Қадам бойынша орындайды
Тексеру тізімінің күйін жаңарту

Бейімделу үшін тамаша. Қарапайым, тексеруге болады.

B үлгісі: ReAct циклі (себеп + әрекет) 🧠→🧰

модель келесі құралды шақыруды шешеді
шығысты бақылайды
ReAct жұмысын қайталайды

Бұл агенттің классикалық сезімі.

C үлгісі: Супервайзер-жұмысшы 👥

жетекші мақсатты міндеттерге бөледі
жұмысшылар арнайы тапсырмаларды орындайды
супервайзер нәтижелерді біріктіреді Microsoft AutoGen (көп агентті құрылым)

Бұл тапсырмаларды параллельдеуге болатын кезде немесе сізге әртүрлі «рөлдер» қажет болған кезде құнды:

зерттеуші
кодтаушы
редактор
Спа тексерушісі

D үлгісі: Жоспарлаңыз, содан кейін орындаңыз және қайта жоспарлаңыз 🔄

жоспар құру
орындау
егер құрал нәтижелері шындықты өзгертсе, қайта жоспарлаңыз

Бұл агенттің жаман жоспарды қыңырлықпен орындауына жол бермейді. Адамдар да шаршамаса, мұны істейді, бұл жағдайда олар да жаман жоспарларды орындайды.

10) Қауіпсіздік, сенімділік және жұмыстан шығарылмау 🔐😅

Егер сіздің агентіңіз шаралар қабылдай алса, сізге қауіпсіздік дизайны қажет. «Қолда болғаны жақсы емес». Қажет. NIST AI RMF 1.0

Қатаң шектеулер

жүгірудегі ең көп қадамдар
минутына ең көп құрал қоңыраулары
бір сессияға жұмсалатын ең көп шығын (токен бюджеті)
бекітудің артындағы шектеулі құралдар

Деректерді өңдеу

журналға жазу алдында сезімтал енгізулерді өңдеңіз
бөлек орталар (әзірлеушілер мен өндіріс)
ең аз артықшылықты құрал рұқсаттары

Мінез-құлық шектеулері

агентті ішкі дәлелдер үзінділерін келтіруге мәжбүрлеу (сыртқы сілтемелер емес, тек ішкі сілтемелер)
сенім төмен болған кезде белгісіздік белгілерін талап етеді
егер енгізілген деректер түсініксіз болса, «нақтылау сұрағын қоюды» талап ету

Сенімді агент ең сенімді агент емес. Ол болжап жатқанын білетін және солай айтатын агент.

11) Тестілеу және бағалау (барлығы аулақ болатын бөлік) 🧪📏

Өлшей алмайтын нәрсені жақсарта алмайсың. Иә, бұл сөз күлкілі, бірақ тітіркендіргіш шындық.

Сценарийлер жиынтығын құрыңыз

30-100 сынақ жағдайын жасаңыз:

бақытты жолдар
шеткі қаптамалар
«құралдың істен шығуы» жағдайлары
түсініксіз өтініштер
қарсыласушылық шақырулар (жедел енгізу әрекеттері) OWASP LLM қолданбалары бойынша ең үздік 10 OWASP LLM01 жедел енгізу

Нәтижелерді бағалау

Мынадай көрсеткіштерді пайдаланыңыз:

тапсырманың сәттілік көрсеткіші
аяқтау уақыты
құрал қателерін қалпына келтіру жылдамдығы
галлюцинация жиілігі (дәлелсіз мәлімдемелер)
адамның мақұлдау көрсеткіші (бақылау режимінде болса)

Сұраулар мен құралдарға арналған регрессиялық тесттер

Сіз өзгерген сайын:

құрал схемасы
жүйелік нұсқаулар
іздеу логикасы
жад пішімі
Жинақты қайтадан іске қосыңыз.

Агенттер сезімтал жануарлар. Бөлме өсімдіктері сияқты, бірақ қымбатырақ.

12) Бюджетіңізді бұзбайтын орналастыру үлгілері 💸🔥

Бір қызметтен бастаңыз

агент контроллерінің API интерфейсі
оның артындағы құрал қызметтері
журналға жазу + OpenTelemetry бақылау праймерін

Шығындарды бақылауды ертерек қосыңыз

кэштеу нәтижелерін іздеу
әңгімелесу күйін қысқаша мазмұнмен сығу
маршруттау және алу үшін кішігірім модельдерді пайдалану
«терең ойлау режимін» ең қиын қадамдармен шектеу

Жалпы архитектуралық таңдау

күйсіз контроллер + сыртқы күй қоймасы (DB/redis)
Құралдарды шақыру мүмкін болған жерде идемпотентті болып табылады. Stripe “Идемпотентті сұраулар”
ұзақ тапсырмаларға кезек (сондықтан веб-сұранысты мәңгілікке ашық ұстамайсыз)

Сонымен қатар: «өлтіру қосқышын» құрастырыңыз. Ол сізге шынымен қажет болғанша қажет болмайды 😬

13) Қорытынды жазбалар - жасанды интеллект агентін қалай құру керектігі туралы қысқаша нұсқа 🎁🤖

Егер басқа ештеңе есіңізде болмаса, мынаны есте сақтаңыз:

Жасанды интеллект агентін қалай құру керек , бұл көбінесе модельдің айналасында қауіпсіз цикл құру туралы. LangChain «Агенттер» құжаттары
Нақты мақсаттан, төмен дербестіктен және қатаң құралдардан бастаңыз. OpenAI құрылымдық шығыстары
Жадты шексіз контекст толтыру арқылы емес, қалпына келтіру арқылы қосыңыз. RAG қағазы
Жоспарлау қарапайым болуы мүмкін - тексеру тізімдері мен қайта жоспарлау өте маңызды.
Журнал жүргізу және тестілеу агент хаосын сіз жібере алатын нәрсеге айналдырады. OpenTelemetry бақылауға арналған праймер
Қоршаулар тек шақыруларда ғана емес, кодта да болады. LLM қолданбалары үшін OWASP үздік 10

Агент сиқыр емес. Бұл құнды болу үшін жиі дұрыс шешімдер қабылдайтын және зиян келтірмес бұрын жеңілісті мойындайтын жүйе. Бір жағынан тыныш жұбатады 😌

Иә, егер сіз оны дұрыс құрсаңыз, бұл ешқашан ұйықтамайтын, кейде үрейленетін және қағазбастылықты жақсы көретін кішкентай цифрлық тағылымдамадан өтушіні жалдағандай сезінесіз. Сонымен, негізінен тағылымдамадан өтуші.

Нақты әлемдегі мысал: Қолдау триажын жасау үшін жасанды интеллект агентін құру 🎫🤖

Сценарий

Аптасына 120-180 қолдау қызметіне өтініш алатын шағын SaaS командасын елестетіп көріңіз. Көптеген өтініштер күрделі емес, бірақ олар әлі де уақытты алады: құпия сөзді қалпына келтіру, төлем сұрақтары, қате туралы есептер, мүмкіндіктерге сұраныстар және «бұл күтілетін әрекет пе?» хабарламалары.

Қарапайым чатбот жауаптарды жобалай алады, бірақ ол тіркелгі күйін сенімді түрде тексере алмайды, білім базасын іздей алмайды, шұғылдықты жіктей алмайды немесе адамның қашан араласуы керектігін шеше алмайды. Міне, осы жерде агенттің мағынасы бар.

Мақсат - қолдауды толығымен алмастыру емес. Мақсат - жаңа талапты оқитын, контекст жинайтын, жауап жобасын жасайтын және талапты дұрыс кезекке бағыттайтын төмен автономды агент құру. Адам әлі де тұтынушыға бағытталған кез келген нәрсені мақұлдайды.

Көмекшіге не қажет

Қауіпсіз жұмыс істеу үшін агентке шағын, басқарылатын енгізулер мен құралдар жиынтығы қажет:

Кіріс билетінің мәтіні
Тұтынушы жоспарының түрі, шоттың жасы және соңғы төлем мәртебесі
Соңғы өнім өзгерістері немесе белгілі оқиғалар
Ішкі анықтама орталығының мақалалары
Шектеулі өрістері бар билетті жаңарту құралы
Жобаға жауап беру құралы, электрондық пошта жіберу құралы емес
Айқын эскалация саясаты

Құралдар тізімі мақсатты түрде тар болуы керек:

search_help_centre(сұрау)
тұтынушының_күйін_алу(тұтынушының_идентификаторы)
белгілі_оқиғаларды_тексеру(өнім_аймағы)
билет_санатын_жаңарту(билет_идентификаторы, санат, басымдық)
жоба_жауап(билет_идентификаторы, жауап_мәтіні)
escalate_to_human(ticket_id, reason)

Не жетіспейтініне назар аударыңыз: «тұтынушыға ақшаны қайтару», «шотты жабу» немесе «соңғы жауапты жіберу» құралы жоқ. Бұл әрекеттер бірінші нұсқа үшін тым қауіпті.

Мысал нұсқаулығы

Сіз SaaS өнімі үшін қолдау сұрыптау агентісіз.

Сіздің міндетіңіз - кіріс билеттерді жіктеу, тек қажетті контекстті жинау, ұсынылған жауапты жобалау және билетті күшейту керек пе, жоқ па, соны шешу.

Ережелер:

Жауаптарды тікелей тұтынушыларға жібермеңіз.

Өнім туралы сұрақтарға жауап бермес бұрын анықтама орталығын пайдаланыңыз.

Есеп айырысу, жоспар немесе кіру туралы сұрақтарға жауап бермес бұрын тұтынушының мәртебесін тексеріңіз.

Егер тұтынушы заңды қауіптер, деректердің жоғалуы, қауіпсіздік мәселелері, төлемнің сәтсіздігі, тіркелгінің жойылуы немесе ашулы сөздер туралы айтса, адами сипаттағы сөздерге дейін жеткізіңіз.

Егер жауап анықтама орталығының мазмұнымен немесе тіркелгі деректерімен расталмаса, не жетіспейтінін айтыңыз және мәселенің мән-жайын түсіндіріңіз.

Құралдың ең көбі 6 рет шақырылғаннан кейін тоқтатыңыз.

Билет санаты, басымдығы, дәлелдемелердің қысқаша мазмұны, жоба жауабы және «адамның мақұлдауы қажет» немесе «кеңейтілген» болған кезде ғана «орындалды» деп саналады.

Оны қалай тексеруге болады

Тікелей пайдаланушыларға қоспас бұрын 30 сынақ билетінен бастаңыз:

Құпия сөзді қалпына келтіру, жоспар лимиттері және «қалай істеймін?» деген қарапайым сұрақтар сияқты 10 қарапайым билет
5 есеп айырысу билеті
5 қате туралы есеп
Ақпараты жоқ 5 түсініксіз билет
Қауіпсіздік мәселелері, ақшаны қайтару талаптары және ашулы шағымдар сияқты 5 қауіпті айыппұл

Әр билет үшін ұпай жинаңыз:

Дұрыс санатты таңдады ма?
Жауап бермес бұрын дұрыс құралды пайдаланды ма?
Ол қолдау таппаған талаптардан аулақ болды ма?
Бұл қауіпті билеттерді күшейтті ме?
Жобаны қатты редакциялау қажет болды ма?

Бастапқыда қарапайым өту/сәтсіздік электрондық кестесі жеткілікті. Агенттің құндылық беріп жатқанын білмей тұрып, бағалау жүйесін шамадан тыс құрмаңыз.

Нәтиже

Көрнекі нәтиже: Осы жұмыс процесін пайдаланбас бұрын және кейін 30 үлгі билеттің уақытын есептеу негізінде қолдау көрсетуші келесіні өлшей алады:

Бірінші сұрыптаудың орташа уақыты әр билет үшін 6 минуттан 90 секундқа дейін қысқартылды
30 билет 3 сағаттың орнына 45 минутта тексерілді
30 билеттің 27-сі дұрыс санатқа орналастырылды
5 қауіпті билеттің 5-еуі дұрыс көтерілді
Адамның келісімінсіз 0 тұтынушы жауабы жіберілді

Бұл сандар дәлелденген эталон емес, мысал ретіндегі бағалау болып табылады. Өлшеуді қайталау оңай: сынақ билеттерінің бірдей партиясын қолмен уақытпен өлшеңіз, содан кейін оларды агент арқылы іске қосып, санат дәлдігін, эскалация дәлдігін және өңдеу уақытын салыстырыңыз.

Не дұрыс болмауы мүмкін

Агент әлі де өте қалыпты жолдармен сәтсіздікке ұшырауы мүмкін.

Ол ашулы естілетіндіктен, ашулы, бірақ қарапайым тұтынушыны «шұғыл» деп жіктеуі мүмкін. Ескірген анықтамалық мақаладан сенімді жауап жазуы мүмкін. Дұрыс қадам жағдайды ушықтыру болған кезде іздеуді жалғастыруы мүмкін. Жауап жобасында тіркелгі мәліметтерінің тым көп болуын көрсетуі мүмкін.

Түзету «жақсырақ нұсқау жазу» және үміттену емес. Қатаң шектеулерді қосыңыз:

Есепшот, қауіпсіздік, заң немесе бас тарту тілі пайда болған кезде күшейту
Дәлелдер жиынтығында ішкі анықтама мақалаларынан дәйексөздер талап етіңіз
«Жауап жіберу» функциясын адамның мақұлдауының артында қалдырыңыз
Әрбір құрал шақыруын және соңғы жобаны жазып алыңыз
Әрбір сұраудан, құралдан немесе саясаттан кейін 30 билеттік сынақ жинағын қайта іске қосыңыз

Практикалық қорытынды

Бағалы агентке драмалық автономия қажет емес. Бұл мысалда мән басқарылатын циклден келеді: билетті оқып, дұрыс контекстті алып, оны жіктеп, жауап жобасын жасап, шолу үшін тоқтаңыз. Бір үлкен сұраумен «қолдауды өңдеуге» тырысатын агентке қарағанда, бұған сену, тексеру және жақсарту әлдеқайда оңай.

Жиі қойылатын сұрақтар

Қарапайым тілмен айтқанда, жасанды интеллект агенті дегеніміз не?

Жасанды интеллект агенті – бұл қайталанатын цикл: енгізуді қабылдау, келесі қадамды таңдау, құралды пайдалану, нәтижені оқу және аяқталғанша қайталау. «Агенттік» бөлік тек әңгімелесуден емес, әрекет етуден және бақылаудан туындайды. Көптеген агенттер құралдарға қол жеткізу мүмкіндігі бар ақылды автоматтандыру болып табылады, ал басқалары қателіктерден қалпына келтіре алатын кіші оператор сияқты әрекет етеді.

Тек шақыруды пайдаланудың орнына жасанды интеллект агентін қашан құруым керек?

Агентті жұмыс көп сатылы болғанда, аралық нәтижелерге негізделген өзгерістер енгізілгенде және сенімді құралдарды пайдалануды (API, дерекқорлар, билет сатып алу, кодты орындау) қажет еткенде құрыңыз. Агенттер қоршаулар мен «орындалғанын» тексеру тәсілі бар қайталанатын нәтижелер қажет болған кезде де пайдалы. Егер қарапайым жедел жауап жұмыс істесе, агент әдетте қажетсіз қосымша шығындар мен қосымша ақаулық режимдерін қажет етеді.

Циклдарда тұрып қалмайтын жасанды интеллект агентін қалай құруға болады?

Қатты тоқтату шарттарын пайдаланыңыз: максималды қадамдар, максималды құрал шақырулары және анық аяқтау тексерулері. Құрылымдалған құрал схемаларын, тайм-ауттарды және мәңгілікке қайталанбайтын қайталауларды қосыңыз. Шешімдер мен құралдың шығыс деректерін журналға жазып, оның қай жерде бұзылатынын көріңіз. Қауіпсіздік клапаны - эскалация: егер агент сенімсіз болса немесе қателерді қайталаса, ол импровизацияның орнына көмек сұрауы керек.

AI агентін қалай құру керектігі туралы минималды архитектура қандай?

Ең болмағанда, модельге мақсат пен контекст беретін, келесі әрекетті сұрайтын, сұралған жағдайда құралды орындайтын, бақылауды қосатын және қайталайтын контроллер циклі қажет. Сондай-ақ, қатаң енгізу/шығару пішіндері және «аяқталды» тексеруі бар құралдар қажет. Тіпті өз цикліңіз де жақсы жұмыс істей алады, егер сіз күйді таза ұстасаңыз және қадам шектеулерін орындасаңыз.

Құралды шақыруды өндірісте сенімді болу үшін қалай жобалауым керек?

Құралдарды тар, терілген, рұқсат етілген және тексерілген күйде сақтаңыз — жалпы «do_anything» құралынан аулақ болыңыз. Агент енгізулерді қолмен басқара алмайтындай етіп қатаң схемаларды (мысалы, құрылымдық шығыстар/функцияны шақыру) артық көріңіз. Құрал деңгейінде рұқсат тізімдерін, жылдамдық шектеулерін және пайдаланушы/ұйым рұқсаттарын тексеруді қосыңыз. Мүмкіндігінше, идимпотенттілік үлгілерін пайдаланып, қайта іске қосу қауіпсіз болатындай етіп құралдарды жасаңыз.

Агентті нашарлатпай жадты қосудың ең жақсы жолы қандай?

Жадты екі бөлікке бөліп қарастырыңыз: қысқа мерзімді жұмыс күйі (соңғы қадамдар, ағымдағы жоспар, шектеулер) және ұзақ мерзімді қалпына келтіру (қалаулар, тұрақты ережелер, тиісті құжаттар). Қысқа мерзімді жинақты толық транскрипциялармен емес, жұмыс қорытындыларымен сақтаңыз. Ұзақ мерзімді жад үшін қалпына келтіру (енгізулер + векторлық сақтау/RAG үлгілері) әдетте бәрін контекстке «толтыру» және модельді шатастырудан гөрі жақсырақ.

Қай жоспарлау үлгісін қолдануым керек: тексеру тізімі, ReAct немесе супервайзер-жұмысшы?

Тапсырмаларды болжауға болатын және тексеруге оңай нәрсе қажет болған кезде тексеру тізімін жоспарлаушы өте жақсы. Құрал нәтижелері келесі әрекетіңізді өзгерткен кезде ReAct стиліндегі циклдар жарқырайды. Басшы мен жұмысшының өзара әрекеттесу үлгілері (мысалы, AutoGen стиліндегі рөлдерді бөлу) тапсырмаларды параллельдеуге немесе әртүрлі рөлдерден (зерттеуші, кодшы, сапаны қамтамасыз ету) пайда алуға болатын кезде көмектеседі. Жоспарлау, содан кейін орындау және қайта жоспарлау - бұл қыңыр жаман жоспарлардан аулақ болудың практикалық ортаңғы жолы.

Егер агент нақты әрекеттер жасай алса, оны қалай қауіпсіз ете аламын?

Ең аз артықшылықты рұқсаттарды пайдаланыңыз және мақұлдау немесе «құрғақ жұмыс» режимдерінің артында қауіпті құралдарды шектеңіз. Бюджеттер мен шектеулерді қосыңыз: максималды қадамдар, максималды шығын және минутына құралды шақыру шектері. Журналға енгізбес бұрын құпия деректерді өңдеңіз және әзірлеушілерді өндірістік орталардан бөліңіз. Енгізілген деректер күмәнді болған кезде сенімділіктің дәлелдерді алмастыруына жол бермеу үшін белгісіздік белгілерін немесе сұрақтарды нақтылауды талап етіңіз.

Уақыт өте келе жақсаруы үшін жасанды интеллект агентін қалай тексеріп, бағалаймын?

Бақытты жолдар, шеткі жағдайлар, құралдың істен шығуы, түсініксіз сұраныстар және жедел енгізу әрекеттері бар сценарийлер жиынтығын құрыңыз (OWASP стилінде). Тапсырманың сәттілігі, аяқталу уақыты, құрал қателерінен қалпына келтіру және дәлелсіз шағымдар сияқты нәтижелерді бағалаңыз. Құрал схемаларын, шақыруларды, қалпына келтіруді немесе жадты пішімдеуді өзгерткен сайын, жиынтықты қайта іске қосыңыз. Егер сіз оны тексере алмасаңыз, оны сенімді түрде жібере алмайсыз.

Агентті кідіріс пен шығындарды көбейтпей қалай орналастыруға болады?

Жалпы үлгі - сыртқы күй қоймасы (DB/Redis), артында құрал қызметтері және күшті журналдау/мониторинг (көбінесе OpenTelemetry) бар күйсіз контроллер. Шығындарды іздеу кэштеуімен, ықшам күй қорытындыларымен, маршруттау/шығару үшін кішірек модельдермен және «терең ойлауды» ең қиын қадамдармен шектеумен басқару. Веб-сұраныстарды ашық ұстамау үшін ұзын тапсырмалар үшін кезектерді пайдаланыңыз. Әрқашан өшіру қосқышын қосыңыз.

Сілтемелер

Ұлттық стандарттар және технологиялар институты (NIST) - NIST AI RMF 1.0 (сенімділік және ашықтық) - nvlpubs.nist.gov
OpenAI - Құрылымдық шығыстар - platform.openai.com
OpenAI - Функцияны шақыру бойынша нұсқаулық - platform.openai.com
OpenAI - Тариф шектеулері бойынша нұсқаулық - platform.openai.com
OpenAI - API іске қосады - platform.openai.com
OpenAI - Көмекші функцияларды шақыру - platform.openai.com
LangChain - Агенттер құжаттары (JavaScript) - docs.langchain.com
LangChain - Құралдар құжаттары (Python) - docs.langchain.com
LangChain - Жадқа шолу - docs.langchain.com
arXiv - ReAct мақаласы (себеп + әрекет) - arxiv.org
arXiv - RAG қағазы - arxiv.org
Amazon Web Services (AWS) құрастырушыларының кітапханасы - тайм-ауттар, қайталаулар және дірілмен кері байланыс - aws.amazon.com
OpenTelemetry - Бақылауға арналған праймер - opentelemetry.io
Stripe - Менеджменттік сұраныстар - docs.stripe.com
Google Cloud - Қайталау стратегиясы (кері қайту + діріл) - docs.cloud.google.com
OWASP - Үлкен тілді модель қолданбалары бойынша үздік 10 - owasp.org
OWASP - LLM01 жедел инъекциясы - genai.owasp.org
LlamaIndex - RAG-қа кіріспе - developers.llamaindex.ai
Microsoft - Семантикалық ядро - learn.microsoft.com
Microsoft AutoGen - Көп агентті құрылым (құжаттама) - microsoft.github.io
CrewAI - Агенттер тұжырымдамалары - docs.crewai.com
Haystack (deepset) - Ретриверлер туралы құжаттама - docs.haystack.deepset.ai

Ресми AI көмекші дүкенінен ең соңғы AI-ді табыңыз

Біз туралы

Блогқа оралу