Жасанды интеллект жаттықтырушысы дегеніміз не?

Кейде жасанды интеллект сиқырлы амал сияқты сезіледі. Сіз кездейсоқ сұрақ қоясыз, ал бірнеше секунд ішінде тамаша, жетілдірілген жауап пайда болады. Бірақ мәселе мынада: әрбір «данышпан» машинаның артында оны түртіп, түзетіп, жол бойында қалыптастыратын нақты адамдар бар. Бұл адамдарды жасанды интеллект жаттықтырушылары, және олардың жұмысы көпшілік ойлағаннан да ерекше, күлкілі және шынымен де адамгершілікке толы.

Осы жаттықтырушылардың неліктен маңызды екенін, олардың күнделікті өмірі қандай болатынын және неге бұл рөл басқалар болжағаннан да тез дамып келе жатқанын қарастырайық.

Осыдан кейін оқуға болатын мақалалар:

🔗 Жасанды интеллект арбитражы дегеніміз не: танымал сөздің астарында жатқан шындық
Жасанды интеллект арбитражын, оның тәуекелдерін, артықшылықтарын және кең таралған қате түсініктерді түсіндіреді.

🔗 Жасанды интеллект үшін деректерді сақтау талаптары: Сіз шынымен білуіңіз керек нәрселер
Жасанды интеллект жүйелерінің сақтау қажеттіліктерін, масштабталуын және тиімділігін қамтиды.

🔗 ЖИ-дің атасы кім?
Жасанды интеллекттің алғашқы бастамашыларын және оның шығу тегін зерттейді.

Берік жасанды интеллект жаттықтырушысын не құрайды? 🏆

Бұл оңай жұмыс емес. Ең үздік жаттықтырушылар таланттардың өте ерекше қоспасына сүйенеді:

Шыдамдылық (көп нәрсе) - Модельдер бір уақытта үйренбейді. Жаттықтырушылар сол түзетулерді дұрыс түсінгенше қайталай береді.
Нәтижені байқау - сарказмды, мәдени контекстті немесе бейтараптықты байқау - адами кері байланыстың артықшылығын береді [1].
Қарапайым коммуникация - Жұмыстың жартысы - жасанды интеллект қате оқи алмайтын анық нұсқаулар жазу.
Қызығушылық + этика - Жақсы жаттықтырушы жауаптың «шын мәнінде дұрыс» екенін, бірақ әлеуметтік тұрғыдан түсінбейтінін сұрайды - бұл жасанды интеллектті қадағалаудың негізгі тақырыбы [2].

Қарапайым тілмен айтқанда: жаттықтырушы – жартылай мұғалім, жартылай редактор және аздаған этик маман.

Жасанды интеллект жаттықтырушысының рөлдеріне қысқаша шолу (кейбір ерекшеліктерімен 😉)

Рөл түрі	Кімге ең қолайлы	Әдеттегі төлем	Неліктен ол жұмыс істейді (немесе жұмыс істемейді)
Деректер белгілегіші	Ұсақ-түйек бөлшектерді жақсы көретін адамдар	Төмен-орташа $$	Өте маңызды; егер жапсырмалар абайсыз болса, бүкіл модель зардап шегеді [3] 📊
RLHF маманы	Жазушылар, редакторлар, талдаушылар	Орташа-Жоғары $$	Адамның күткендеріне сәйкес дыбыс пен анықтықты сәйкестендіру үшін жауаптарды бағалайды және қайта жазады [1]
Домен жаттықтырушысы	Заңгерлер, дәрігерлер, сарапшылар	Картаның барлық жерінде 💼	Салалық жүйелерге арналған тар жаргондар мен шеткі жағдайларды өңдейді
Қауіпсіздік шолушысы	Этикаға бейім адамдар	Орташа $$	Жасанды интеллект зиянды мазмұннан аулақ болу үшін нұсқауларды қолданады [2][5]
Шығармашылық жаттықтырушы	Суретшілер, әңгімешілер	Болжамсыз 💡	Қауіпсіз шектеулерде бола отырып, жасанды интеллектке қиялды жаңғыртуға көмектеседі [5]

(Иә, пішімдеу сәл шатастырылған - жұмыстың өзі сияқты.)

Жасанды интеллект жаттықтырушысының өмірінен бір күн

Сонымен, нақты жұмыс қалай көрінеді? Сәнді кодтауды емес, көбірек ойлаңыз:

Жасанды интеллектпен жазылған жауаптарды ең нашардан ең жақсысына қарай жіктеу (классикалық RLHF қадамы) [1].
Қателіктерді түзету (мысалы, модель Шолпанның Марс емес екенін ұмытып кеткен кезде).
Чатбот жауаптарын табиғирақ естілетіндей етіп қайта жазу.
Мәтін, кескін немесе аудио тауларын белгілеу - дәлдік шынымен маңызды жерде [3].
«Техникалық тұрғыдан дұрыс» дегеннің жеткілікті ме, әлде қауіпсіздік нұсқауларынан басым болуы керек пе деген пікірталас [2].

Бұл бір жағынан қиындық, бір жағынан жұмбақ. Шынымды айтсам, тотықұсқа тек сөйлеуді ғана емес, сөздерді сәл қате қолдануды тоқтатуды үйретуді елестетіп көріңізші - бұл атмосфера. 🦜

Неліктен жаттықтырушылар сіз ойлағаннан әлдеқайда маңызды

Адамдар басқармағанда, жасанды интеллект келесідей болар еді:

Қатты және роботтық естіледі.
Басқалардың пікірін бақылаусыз тарату (қорқынышты ой).
Әзілді немесе эмпатияны мүлдем сағынамын.
Сезімтал жағдайларда қауіпсіздікті төмендетіңіз.

Жаттықтырушылар - «лас адами нәрселерді» - жаргон, жылы сөздер, кейде ебедейсіз метафораларды - жасырын түрде енгізетіндер, сонымен қатар заттардың қауіпсіздігін қамтамасыз ету үшін қоршауларды қолданатындар [2][5].

Шын мәнінде маңызды дағдылар

PhD дәрежесі қажет деген аңызды ұмытыңыз. Ең көп көмектесетін нәрсе:

Жазу + редакциялау - Жылтыратылған, бірақ табиғи дыбысталған мәтін [1].
Аналитикалық ойлау - модельдегі қайталанатын қателіктерді анықтау және түзетулер енгізу.
Мәдени хабардарлық - сөз тіркестерінің қашан қате болуы мүмкін екенін білу [2].
Шыдамдылық - Себебі жасанды интеллект бірден түсінілмейді.

Көптілділік дағдылары немесе тар салалық сараптама үшін бонустық ұпайлар.

Жаттықтырушылар қайда келеді 🌍

Бұл жұмыс тек чатботтармен ғана шектелмейді - ол барлық салаларға енеді:

Денсаулық сақтау - Шекаралық жағдайларға аннотация жазу ережелері (денсаулық сақтау саласындағы жасанды интеллект бойынша нұсқаулықта қайталанады) [2].
Қаржы - Адамдарды жалған дабылдарға батырмай, алаяқтықты анықтау жүйелерін оқыту [2].
Бөлшек сауда - ассистенттерге бренд тонына сүйене отырып, жаргон сатып алушы тілін меңгеруді үйрету [5].
Білім беру - Репетиторлық боттарды қолдаудың орнына ынталандырушы етіп қалыптастыру [5].

Негізінен: егер жасанды интеллект үстел басында орындыққа ие болса, фонда жаттықтырушы жасырынып тұр.

Этика бөлімі (мұны өткізіп жіберуге болмайды)

Міне, осы жерде мәселе маңызды бола бастайды. Тексерілмесе, жасанды интеллект стереотиптерді, жалған ақпаратты немесе одан да жаманын қайталайды. Жаттықтырушылар мұны RLHF немесе үлгілерді пайдалы, зиянсыз жауаптарға бағыттайтын конституциялық ережелер сияқты әдістерді қолдану арқылы тоқтатады [1][5].

Мысал: егер бот жұмысқа қатысты біржақты ұсыныстарды ұсынса, жаттықтырушы оны белгілейді, ережелер жинағын қайта жазады және оның қайталанбауын қамтамасыз етеді. Бұл іс жүзіндегі қателік [2].

Онша қызық емес жағы

Бәрі бірдей жақсы емес. Жаттықтырушылар келесі мәселелермен айналысады:

Монотондылық - Шексіз таңбалау ескіреді.
Эмоционалдық шаршау - Зиянды немесе мазасыздық тудыратын мазмұнды шолу зиян келтіруі мүмкін; қолдау жүйелері өте маңызды [4].
Танылмау - Пайдаланушылар жаттықтырушылардың бар екенін сирек біледі.
Тұрақты өзгеріс - Құралдар үздіксіз дамып отырады, яғни жаттықтырушылар ілесе білуі керек.

Дегенмен, көптеген адамдар үшін технологияның «миын» қалыптастыру қызығы оларды қызықтырады.

Жасанды интеллекттің жасырын MVP-лері

Сонымен, жасанды интеллект жаттықтырушылары кімдер? Олар шикі алгоритмдер мен адамдар үшін жұмыс істейтін жүйелер арасындағы көпір . Оларсыз жасанды интеллект кітапханашысыз кітапхана сияқты болар еді - ақпарат өте көп, бірақ оны пайдалану мүмкін емес дерлік.

Келесі жолы чатбот сізді күлдіргенде немесе таңқаларлықтай «үйлесімді» сезінгенде, жаттықтырушыға алғыс айтыңыз. Олар машиналардың тек есептеуді ғана емес, сонымен қатар байланысуын қамтамасыз ететін тыныш фигуралар [1][2][5].

Сілтемелер

[1] Оуянг, Л. және т.б. (2022). Тілдік модельдерді адамдардың кері байланысымен нұсқауларды орындауға үйрету (InstructGPT). NeurIPS. Сілтеме

[2] NIST (2023). Жасанды интеллект тәуекелдерін басқару құрылымы (AI RMF 1.0). Сілтеме

[3] Норткатт, К. және т.б. (2021). Тест жиынтықтарындағы кең таралған белгі қателері машиналық оқыту эталондарын тұрақсыздандырады. NeurIPS деректер жиынтықтары және эталондары. Сілтеме

[4] ДДСҰ/ХЕҰ (2022). Жұмыс орнындағы психикалық денсаулық бойынша нұсқаулық. Сілтеме

[5] Бай, Ю. және т.б. (2022). Конституциялық жасанды интеллект: жасанды интеллект туралы кері байланыстан зиянсыздық. arXiv. Сілтеме

Ресми AI көмекші дүкенінен ең соңғы AI-ді табыңыз

Біз туралы

Блогқа оралу