AI жаттықтырушы дегеніміз не?

AI кейде сиқырлы трюк сияқты сезінеді. Сіз кездейсоқ сұрақты тересіз, ал бам - бірнеше секундтан кейін тегіс, жылтыратылған жауап пайда болады. Бірақ міне, қисық доп: әрбір «данышпан» машинаның артында оны итермелейтін, түзететін және жол бойында қалыптастыратын нақты адамдар бар. AI жаттықтырушылары деп атайды және олардың жұмысы көпшілік ойлағаннан да бейтаныс, күлкілі және шынын айтқанда адамдық.

Келіңіздер, бұл жаттықтырушылар неліктен маңызды екенін, олардың күнделікті өмірі қалай көрінетінін және бұл рөл неліктен кез келген адам болжағаннан тезірек көтерілетінін қарастырайық.

Осы мақаладан кейін оқығыңыз келетін мақалалар:

🔗 AI арбитраж дегеніміз не: бұл сөздің артындағы шындық
AI арбитражын, оның тәуекелдерін, артықшылықтарын және жалпы қате түсініктерді түсіндіреді.

🔗 AI үшін деректерді сақтау талаптары: Сіз шынымен нені білуіңіз керек
Жасанды интеллект жүйелері үшін сақтау қажеттіліктерін, ауқымдылығын және тиімділігін қамтиды.

🔗 AI әкесі кім?
AI пионерлері мен жасанды интеллекттің пайда болуын зерттейді.

Қатты AI жаттықтырушыны не етеді? 🏆

Бұл түймені басу жұмысы емес. Үздік жаттықтырушылар таланттардың өте оғаш қоспасына сүйенеді:

Шыдамдылық (көп) - модельдер бір кадрда үйренбейді. Жаттықтырушылар сол түзетулерді жабысып қалғанша соғады.
Байқау нюансы - сарказм, мәдени контекст немесе біржақтылықты сезіну адамның кері байланысын қамтамасыз етеді [1].
Тікелей байланыс - жұмыстың жартысы AI қате оқи алмайтын нақты нұсқаулар жазу.
Қызығушылық + этика - Жақсы жаттықтырушы жауаптың «шын мәнінде дұрыс» екенін, бірақ әлеуметтік тұрғыдан саңырау екенін сұрайды - AI бақылауындағы басты тақырып [2].

Қарапайым тілмен айтсақ: жаттықтырушы – жартылай мұғалім, қосалқы редактор және этиканың бір бөлігі.

AI жаттықтырушы рөлдері бір қарағанда (кейбір ерекшеліктермен 😉)

Рөл түрі	Кім жақсы сәйкес келеді	Әдеттегі төлем	Неліктен ол жұмыс істейді (немесе жұмыс істемейді)
Деректер таңбалаушысы	Ұсақ бөлшектерді жақсы көретін адамдар	Төмен – Орташа $$	Абсолютті шешуші; егер жапсырмалар ұқыпсыз болса, бүкіл модель зардап шегеді [3] 📊
RLHF маманы	Жазушылар, редакторлар, талдаушылар	Орташа – Жоғары $$	Реңк пен анықтықты адам күткенімен сәйкестендіру үшін жауаптарды дәрежелейді және қайта жазады [1]
Домен жаттықтырушысы	Заңгерлер, дәрігерлер, сарапшылар	Бүкіл картада 💼	Арнайы салалық жүйелерге арналған тауашалық жаргонды және жиектерді өңдейді
Қауіпсіздік шолушысы	Әдепті адамдар	Орташа $$	AI зиянды мазмұнды болдырмау үшін нұсқауларды қолданады [2][5]
Шығармашылық жаттықтырушы	Суретшілер, әңгімешілер	Болжау мүмкін емес 💡	Қауіпсіз шектерде бола отырып, AI қиялын жаңғыруға көмектеседі [5]

(Иә, пішімдеу сәл ретсіз - жұмыстың өзі сияқты.)

AI жаттықтырушысының өміріндегі бір күн

Сонымен, нақты жұмыс қалай көрінеді? Аз әсем кодтауды және т.б. ойланыңыз:

AI-жазбаша жауаптарды ең нашардан жақсыға қарай рейтингтеу (классикалық RLHF қадамы) [1].
Араласуды түзету (модель Венераның Марс емес екенін ұмытып кетуі сияқты).
Чатбот жауаптарын қайта жазу, олар табиғи естіледі.
Мәтіннің, кескіндердің немесе аудионың тауларын таңбалау – дәлдік шынымен маңызды [3].
«Техникалық тұрғыдан дұрыс» жеткілікті ме, әлде қауіпсіздік нұсқаулары бас тарту керек пе [2] деген пікірталас.

Бұл жартылай ұнтақтау, жартылай пазл. Шынымды айтсам, попугаяға жай ғана сөйлеуге емес, сөздерді сәл қате қолдануды тоқтатуға үйреткеніңізді елестетіп көріңіз - бұл виб. 🦜

Неліктен жаттықтырушылар сіз ойлағаннан да маңыздырақ?

Адамдардың басқаруынсыз AI:

Дыбыс қатты және роботталған.
Бақылаусыз таралу (қорқынышты ой).
Әзілді немесе эмпатияны мүлде сағындым.
Сезімтал контексттерде қауіпсіз болыңыз.

Жаттықтырушылар – «адамның беймаза нәрселеріне» - жаргон, жылылық, анда-санда ыңғайсыз метафора - сонымен бірге заттарды қауіпсіз сақтау үшін қоршауларды қолданатындар [2][5].

Іс жүзінде есептелетін дағдылар

Сізге PhD докторы керек деген мифті ұмытыңыз. Ең көп көмектесетіні:

Жазу + өңдеу котлеттері - жылтыратылған, бірақ табиғи дыбысталған мәтін [1].
Аналитикалық ойлау - Қайталанатын үлгі қателерін анықтау және түзету.
Мәдени хабардарлық - сөз тіркесінің қате болуы мүмкін екенін білу [2].
Шыдамдылық - өйткені AI бірден қабылданбайды.

Көптілді дағдылар немесе тауаша сараптамасы үшін бонус ұпайлары.

Жаттықтырушылар қай жерде 🌍

Бұл жұмыс тек чат-боттар туралы ғана емес, ол әр секторға жасырын түрде енеді:

Денсаулық сақтау - Шекаралық жағдайларға аннотация ережелерін жазу (денсаулық AI нұсқаулығында қайталанады) [2].
Қаржы – жалған дабылда адамдарды суға батырмай, алаяқтықты анықтау жүйелерін оқыту [2].
Бөлшек сауда – Көмекшілерге брендтің үнін ұстанып, сатып алушының жалаң сөзін алуға үйрету [5].
Білім беру - репетиторлық боттарды патронизациялаудың орнына ынталандыратын етіп қалыптастыру [5].

Негізінде: егер AI үстелде отырса, онда жаттықтырушы фонда жасырынып тұрады.

Этика бит (бұны өткізіп жіберуге болмайды)

Міне, оның салмағы да осында. Тексерілмесе, AI стереотиптерді, жалған ақпаратты немесе одан да жаманын қайталайды. Жаттықтырушылар мұны RLHF немесе пайдалы, зиянсыз жауаптарға бағыттайтын конституциялық ережелер сияқты әдістерді қолдану арқылы тоқтатады [1][5].

Мысал: егер бот біржақты жұмыс ұсыныстарын итерсе, жаттықтырушы оны белгілейді, ережелер кітабын қайта жазады және оның қайталанбауын қадағалайды. Бұл әрекеттегі қадағалау [2].

Көңілді емес жағы

Мұның бәрі жылтыр емес. Жаттықтырушылар айналысады:

Монотондылық - шексіз таңбалау ескіреді.
Эмоционалды шаршау - Зиянды немесе мазасыздандыратын мазмұнды қарау шығынға ұшырауы мүмкін; қолдау жүйелері шешуші болып табылады [4].
Таныудың болмауы - Пайдаланушылар жаттықтырушылар бар екенін сирек түсінеді.
Тұрақты өзгеріс - Құралдар үздіксіз дамып отырады, яғни жаттықтырушылар ілесу керек.

Дегенмен, көптеген адамдар үшін технологияның «миын» қалыптастырудың толқуы оларды байланыстырады.

AI жасырын MVP

Сонымен, AI жаттықтырушылары кімдер? адамдар үшін жұмыс істейтін жүйелер арасындағы көпір Оларсыз AI кітапханашылары жоқ кітапхана сияқты болар еді - тонна ақпарат, бірақ оны пайдалану мүмкін емес.

Келесі жолы чатбот сізді күлдіреді немесе таңқаларлықтай «үйлесімді» сезінеді, жаттықтырушыға рахмет. Олар машиналарды тек есептеп қана қоймай, сонымен бірге [1][2][5] байланыстыратын тыныш фигуралар.

Анықтамалар

[1] Ouyang, L. et al. (2022). Адамның кері байланысы бар нұсқауларды орындау үшін тіл үлгілерін үйрету (InstructGPT). NeurIPS. Сілтеме

[2] NIST (2023). Жасанды интеллект тәуекелдерді басқару құрылымы (AI RMF 1.0). Сілтеме

[3] Northcutt, C. et al. (2021). Сынақ жинақтарындағы кең таралған жапсырма қателері машинада оқытудың эталондарын тұрақсыздандырады. NeurIPS деректер жинағы және салыстырулары. Сілтеме

[4] ДДҰ/ХЕҰ (2022). Жұмыстағы психикалық денсаулық бойынша нұсқаулар. Сілтеме

[5] Bai, Y. et al. (2022). Конституциялық AI: AI кері байланысының зиянсыздығы. arXiv. Сілтеме

Ресми AI Assistant дүкенінен соңғы AI табыңыз

Біз туралы

Блогқа оралу

Ел/аймақ