AI этикасы дегеніміз не?

Бұл термин жоғары естіледі, бірақ мақсат өте практикалық: AI жүйелерін адамдарға сене алатындай ету – өйткені олар адам құқықтарын құрметтейтін, зиянды азайтатын және нақты пайда әкелетін жолдармен жасалған, салынған және пайдаланылады. Міне, негізінен.

Осыдан кейін оқуға болатын мақалалар:

🔗 AI-дағы MCP дегеніміз не
Модульдік есептеу протоколын және оның АИ-дегі рөлін түсіндіреді.

🔗 Edge AI дегеніміз не
Шетке негізделген өңдеу жылдамырақ, жергілікті AI шешімдерін қабылдауға мүмкіндік береді.

🔗 Генеративті AI дегеніміз не
Мәтінді, кескіндерді және басқа түпнұсқа мазмұнды жасайтын үлгілерді таныстырады.

🔗 Агенттік AI дегеніміз не
Мақсатқа негізделген шешім қабылдауға қабілетті автономды AI агенттерін сипаттайды.

AI этикасы дегеніміз не? Қарапайым анықтама 🧭

Жасанды интеллект этикасы – бұл адам құқықтарын, әділдікті, есеп беруді, ашықтықты және әлеуметтік игілікті қолдау үшін AI-ны қалай жобалайтынымызды, дамытатынымызды, орналастыруды және басқаратынымызды басқаратын принциптер, процестер және қоршаулар жиынтығы. Мұны алгоритмдерге арналған күнделікті жол ережелері ретінде елестетіп көріңіз - бұл қате болуы мүмкін оғаш бұрыштарды қосымша тексеру.

Әлемдік тәжірибелер мұны растайды: ЮНЕСКО-ның Ұсынымында адам құқықтары, адами бақылау және әділеттілік басты назарда, ал ашықтық пен әділдік келіссөздер жүргізілмейтін мәселелер болып табылады [1]. ЭЫДҰ-ның ЖИ қағидаттары сенімді ЖИ-ге бағытталған [2].

Қысқасы, AI этикасы қабырғадағы плакат емес. Бұл командалар тәуекелдерді болжау, сенімділікті дәлелдеу және адамдарды қорғау үшін қолданатын ойын кітабы. NIST AI тәуекелдерін басқару құрылымы этиканы AI өмірлік циклі бойынша белсенді тәуекелдерді басқару сияқты қарастырады [3].

Жақсы AI этикасы нені білдіреді ✅

Міне, дөрекі нұсқасы. Жақсы AI этикасы бағдарламасы:

Ламинатталған емес, өмір сүреді - нақты инженерлік тәжірибелер мен шолуларды басқаратын саясат.
Мәселелерді шешуден басталады - егер мақсат өшірілсе, ешқандай әділетті түзету оны сақтай алмайды.
Құжаттардың шешімдері - неге бұл деректер, неге бұл модель, неге бұл шек.
Мәтінмәні бар сынақтар – жалпы дәлдік бойынша ғана емес, ішкі топтар бойынша бағалаңыз (NIST негізгі тақырыбы) [3].
Оның жұмысын көрсетеді - үлгі карталары, деректер жиынының құжаттамасы және анық пайдаланушы байланыстары [5].
Жауапкершілікті қалыптастырады - атаулы иелері, эскалация жолдары, аудиторлық.
Ашық келіссөздерді теңестіреді - қауіпсіздік пен қызметтік және құпиялылық, жазылған.
Заңға қосылады - әсер етумен бақылауды масштабтайтын тәуекелге негізделген талаптар (ЕО AI актісін қараңыз) [4].

Егер ол бір ғана өнім шешімін өзгертпесе, бұл этика емес, бұл декор.

Үлкен сұраққа жылдам жауап: AI этикасы дегеніміз не? 🥤

Командалар үш қайталанатын сұраққа осылай жауап береді:

Мұны салуымыз керек пе?
Егер солай болса, зиянды қалай азайтамыз және оны қалай дәлелдейміз?
Іс теріс кеткенде, кім жауап береді және одан кейін не болады?

Қызықсыз практикалық. Таңқаларлық қиын. Оған тұрарлық.

60 секундтық мини-кейс (тәжірибедегі тәжірибе) 📎

Финтех командасы алаяқтық үлгісін үлкен дәлдікпен жібереді. Екі аптадан кейін белгілі бір аймақтағы қолдау билеттері заңды төлемдерге тыйым салынады. Ішкі топты шолу сол тіл үшін қайта шақыру орташадан 12 ұпайға төмен екенін көрсетеді. Топ деректерді қамтуды қайта қарайды, жақсырақ көрсетумен қайта оқытады және өзгерісті, белгілі ескертулерді және пайдаланушының шағымдану жолын құжаттайтын жаңартылған үлгі картасын жариялайды. Дәлдік бір нүктеге төмендейді; тұтынушылардың сенімі артады. Бұл плакат емес, тәуекелдерді басқару және пайдаланушыны құрметтеу сияқты этика [3][5].

Сіз шынымен пайдалануға болатын құралдар мен фреймворктар 📋

(Мақсатқа байланысты кішігірім қиялдар - бұл шынайы өмір.)

Құрал немесе Framework	Аудитория	Бағасы	Неліктен жұмыс істейді	Ескертпелер
NIST AI тәуекелдерді басқару құрылымы	Өнім, тәуекел, саясат	Тегін	Таза функциялар-Басқару, Карта, Өлшеу, Басқару-топтарды туралау	Ерікті, кеңінен сілтеме [3]
ЭЫДҰ жасанды интеллект қағидаттары	Басшылар, саясаткерлер	Тегін	Сенімді AI үшін мәндер + практикалық нұсқаулар	Күшті басқарудың солтүстік жұлдызы [2]
ЕО AI актісі (қауіпке негізделген)	Заңдылық, сәйкестік, CTO	Тегін*	Тәуекел деңгейлері жоғары әсерлі пайдалану үшін пропорционалды басқару элементтерін орнатады	Сәйкестік шығындары әртүрлі [4]
Үлгі карталар	ML инженерлері, PM	Тегін	Модельдің не екенін, не істейтінін және қай жерде сәтсіздікке ұшырайтынын стандарттайды	Қағаз + мысалдар бар [5]
Деректер жиынының құжаттамасы («деректер парақтары»)	Деректер ғалымдары	Тегін	Деректердің шығу тегін, қамтуды, келісімді және тәуекелдерді түсіндіреді	Оны тағамдық жапсырма ретінде қарастырыңыз

Терең сүңгу 1 - Теорияда емес, қозғалыстағы принциптер 🏃

Әділдік - демографиялық және контекст бойынша өнімділікті бағалау; жалпы көрсеткіштер зиянды жасырады [3].
Жауапкершілік - Деректер, үлгілер және орналастыру шешімдері үшін иелерін тағайындаңыз. Шешім журналдарын сақтаңыз.
Мөлдірлік - Үлгі карталарды пайдалану; пайдаланушыларға шешімнің қалай автоматтандырылғанын және қандай ресурс бар екенін айтыңыз [5].
Адамның қадағалауы - адамдарды нақты тоқтату/қайтару күші бар жоғары тәуекелді шешімдер қабылдау цикліне енгізіңіз (ЮНЕСКО айқын түрде алға қойған) [1].
Құпиялылық және қауіпсіздік - Деректерді азайту және қорғау; қорытынды уақытының ағып кетуін және кейінгі дұрыс пайдаланбауды ескеру.
Бенефистілік - ұқыпты KPI ғана емес, әлеуметтік тиімділікті көрсетіңіз (ЭЫДҰ осы теңгерімді құрайды) [2].

Кішкентай ауытқу: командалар кейде нақты зиян туралы сұрақты елемей, метрикалық атаулар туралы сағаттар бойы дауласады. Бұл қалай болғаны қызық.

Deep dive 2 - Тәуекелдер және оларды қалай өлшеуге болады 📏

Зиянды өлшенетін тәуекел ретінде қарастырған кезде этикалық AI нақты болады:

Контексттік картаға түсіру - кімге тікелей және жанама түрде әсер етеді? Жүйе қандай шешім қабылдау құқығына ие?
Деректер жарамдылығы - көрсету, дрейф, таңбалау сапасы, келісім жолдары.
Үлгі әрекеті - Тарату ауысымындағы сәтсіздік режимдері, қарсылас шақырулар немесе зиянды енгізулер.
Әсерді бағалау - Ауырлық × ықтималдық, азайту шаралары және қалдық тәуекел.
Өмірлік циклды басқару элементтері - проблемалық жақтаудан бастап орналастырудан кейінгі бақылауға дейін.

NIST мұны командалар дөңгелекті қайта ойлап таппай қабылдай алатын төрт функцияға бөледі: Басқару, Карта, Өлшеу, Басқару [3].

Deep dive 3 - сізді кейінірек құтқаратын құжаттама 🗂️

Екі қарапайым артефакт кез келген ұраннан көп нәрсе жасайды:

Модельдік карталар - Модель не үшін, ол қалай бағаланды, қай жерде сәтсіздікке ұшырайды, этикалық ойлар және ескертулер - қысқа, құрылымды, оқылатын [5].
Деректер жиынтығының құжаттамасы («деректер кестелері») - бұл деректер неліктен бар, ол қалай жиналды, кім ұсынды, белгілі олқылықтар және ұсынылған пайдаланулар.

Модельдің неліктен дұрыс әрекет етпегенін реттеушілерге немесе журналистерге түсіндіруге тура келсе, мұны жазғаныңыз үшін бұрынғы өзіңізге алғыс айтасыз. Болашақ - сіз өткен кофені сатып аласыз.

Терең сүңгу 4 - шынымен тістеп алатын басқару 🧩

Тәуекел деңгейлерін анықтаңыз - Тәуекелге негізделген идеяны алыңыз, сондықтан жоғары әсер ету жағдайлары тереңірек зерттеледі [4].
Сахналық қақпалар - қабылдау кезінде, іске қосу алдындағы және іске қосудан кейінгі этикаға шолу. Он бес қақпа емес. Үшеуі көп.
Міндеттерді бөлу - әзірлеушілер ұсынады, тәуекелді серіктестер қарастырады, көшбасшылар қол қояды. Таза сызықтар.
Оқиғаға жауап - үлгіні кім тоқтатады, пайдаланушыларға қалай хабарланады, түзету қалай көрінеді.
Тәуелсіз аудиттер – Ішкі бірінші; сұранысқа ие болатын сыртқы.
Оқыту және ынталандыру - Мәселелерді жасырмай, ертерек ашылған марапат.

Шынын айтайық: егер басқару ешқашан «жоқ», онда ол басқару емес.

Deep dive 5 - реквизит ретінде емес, ілмектегі адамдар 👩⚖️

Адамның бақылауы құсбелгі емес - бұл дизайн таңдауы:

Адамдар шешім қабылдағанда - Адам қайта қарауы керек нақты шектерді, әсіресе жоғары тәуекелді нәтижелер үшін.
Шешім қабылдаушыларға түсінікті болу - адамға неге және белгісіздікті.
Пайдаланушы кері байланыс циклдері - пайдаланушыларға автоматтандырылған шешімдерді даулауға немесе түзетуге мүмкіндік беріңіз.
Қол жетімділік - әртүрлі пайдаланушылар түсінетін және нақты пайдалана алатын интерфейстер.

Бұл жерде ЮНЕСКО-ның нұсқауы қарапайым: адамның қадір-қасиеті мен қадағалау - бұл міндетті емес, негізгі болып табылады. Өнімді адамдар зиян келтірмес бұрын араласатындай етіп жасаңыз [1].

Бүйірлік ескерту - Келесі шекара: нейротех 🧠

Жасанды интеллект нейротехнологиямен қиылыса отырып, ақыл-ойдың құпиялылығы мен ойлау еркіндігі дизайнның нақты мәселелеріне айналады. Дәл осы оқу құралы қолданылады: құқыққа негізделген принциптер [1], сенімді дизайн бойынша басқару [2] және жоғары тәуекелді пайдалану үшін пропорционалды қауіпсіздік шаралары [4]. Оларды кейінірек бекітпей, ертерек қоршауларды жасаңыз.

Командалар қалай жауап береді? Жасанды интеллект этикасы дегеніміз не? Іс жүзінде - жұмыс процесі 🧪

Осы қарапайым циклды қолданып көріңіз. Бұл мінсіз емес, бірақ ол өте тиімді:

Мақсатты тексеру - Біз қандай адам мәселесін шешіп жатырмыз және кімге пайда немесе тәуекел?
Мәтінмәндік карта - Мүдделі тараптар, орталар, шектеулер, белгілі қауіптер.
Деректер жоспары - Дереккөздер, келісім, өкілдік, сақтау, құжаттама.
Қауіпсіздік үшін дизайн - қарсыластық тестілеу, қызыл команда, дизайн бойынша құпиялылық.
Әділдікті анықтаңыз - доменге сәйкес көрсеткіштерді таңдаңыз; құжат алмасу.
Түсіндірмелілік жоспары - не түсіндіріледі, кімге және қалай пайдалы екенін растайсыз.
Үлгі картасы - Жобаны ертерек жасаңыз, барған сайын жаңартыңыз, іске қосу кезінде жариялаңыз [5].
Басқару қақпалары - Жауапты иелерімен тәуекелдерді шолу; NIST функцияларын пайдалана отырып құрылымдау [3].
Іске қосудан кейінгі бақылау - метрикалар, дрейфтік ескертулер, оқиғаларды ойнату кітаптары, пайдаланушы өтініштері.

Қадам ауыр сезілсе, оны тәуекелге дейін масштабтаңыз. Бұл қулық. Емлені түзететін ботты шамадан тыс жасау ешкімге көмектеспейді.

Этика және сәйкестік - өткір, бірақ қажетті айырмашылық 🌶️

Этика сұрайды: бұл адамдар үшін дұрыс нәрсе ме?
Сәйкестік сұрайды: бұл ережеге сәйкес келе ме?

Саған екеуі де керек. ЕО-ның тәуекелге негізделген моделі сәйкестіктің негізі болуы мүмкін, бірақ сіздің этика бағдарламаңыз минимумдардан асып түсуі керек, әсіресе түсініксіз немесе жаңа пайдалану жағдайларында [4].

Жылдам (кемшілікті) метафора: сәйкестік - қоршау; этика – қойшы. Қоршау сізді шектейді; шопан сені дұрыс жолмен жалғастырады.

Жалпы қателіктер - және оның орнына не істеу керек 🚧

Шұңқыр: этика театры - ресурстарсыз сәнді принциптер.
Түзету: уақытты, иелерін және тексеру нүктелерін бөлу.
Қиындық: зиянның орташа мәні - үлкен жалпы көрсеткіштер ішкі топтың сәтсіздігін жасырады.
Түзету: әрқашан сәйкес субпопуляциялар бойынша бағалаңыз [3].
Қауіпсіздік: құпиялылық қауіпсіздік ретінде жасырылады - пайдаланушылардан мәліметтерді жасыру.
Түзету: мүмкіндіктерді, шектеулерді және ресурстарды қарапайым тілде ашыңыз [5].
Қиындық: соңында аудит - іске қосу алдында проблемаларды табу.
Түзету: дизайн мен деректерді жинаудың солға қарай этикасын өзгерту.
Қиындық: пайымдаусыз бақылау парақтары - келесі формалар, мағынасы жоқ.
Түзету: үлгілерді сарапшылық шолумен және пайдаланушы зерттеулерімен біріктіріңіз.

Жиі қойылатын сұрақтар – бәрібір сізден сұралатын нәрселер ❓

Жасанды интеллект этикасы инновацияға қарсы ма?
Жоқ. Бұл пайдалы инновация. Этика кері реакция немесе заңды қиындықтар тудыратын бейтарап жүйелер сияқты тұйық жолдардан аулақ болады. ЭЫДҰ тұжырымдамасы қауіпсіздікті қамтамасыз ететін инновацияны ашық түрде насихаттайды [2].

Біздің өніміміз тәуекелі төмен болса, бұл бізге қажет пе?
Иә, бірақ жеңілірек. Пропорционалды басқару элементтерін пайдаланыңыз. Бұл тәуекелге негізделген идея ЕО көзқарасында стандартты болып табылады [4].

Қандай құжаттар міндетті түрде болуы керек?
Кем дегенде: негізгі деректер жиынына арналған деректер жиынының құжаттамасы, әрбір үлгіге арналған үлгі картасы және шығарылым шешімдерінің журналы [5].

Жасанды интеллект этикасына кім иелік етеді?
Әркімнің мінез-құлқы бар, бірақ өнім, деректер ғылымы және тәуекел топтарына белгілі бір міндеттер жүктелуі керек. NIST функциялары жақсы негіз болып табылады [3].

Тым ұзақ оқымадым - Қорытынды ескерту 💡

Егер сіз мұның бәрін жай ғана оқып шықсаңыз, міне, негізгі ой: ЖИ этикасы дегеніміз не? Бұл адамдар сене алатын ЖИ құрудың практикалық тәртібі. Кеңінен қабылданған нұсқаулыққа - ЮНЕСКО-ның құқыққа бағытталған көзқарасына және ЭЫДҰ-ның сенімді ЖИ қағидаларына сүйеніңіз. Оны іске қосу үшін NIST тәуекелдер құрылымын пайдаланыңыз және таңдауларыңыз түсінікті болуы үшін үлгі карталарымен және деректер жиынтығының құжаттамасымен бірге жіберіңіз. Содан кейін пайдаланушыларды, мүдделі тараптарды, өзіңіздің бақылауыңызды тыңдап, реттеңіз. Этика бір реттік емес; бұл әдет.

Иә, кейде сіз түзететін боласыз. Бұл сәтсіздік емес. Бұл жұмыс. 🌱

Сілтемелер

ЮНЕСКО - Жасанды интеллект этикасы бойынша ұсыныс (2021). Сілтеме
ЭЫДҰ - ЖИ қағидаттары (2019). Сілтеме
NIST - Жасанды интеллект тәуекелдерін басқару құрылымы (AI RMF 1.0) (2023) (PDF). Сілтеме
EUR-Lex - 2024/1689 (Жасанды интеллект туралы заң) ережесі. Сілтеме
Митчелл және т.б. - «Үлгілік есеп беруге арналған үлгі карталары» (ACM, 2019). Сілтеме

Ресми AI көмекші дүкенінен ең соңғы AI-ді табыңыз

Біз туралы

Блогқа оралу