Süni intellekt təcrübə zamanı mümkün ləğvetmə barədə informasiya aldıqdan sonra kompromat məlumatları açıqlamaqla hədələyib.
Azpost.info bildirir ki, Anthropic şirkəti süni intellekt bağlı daxildə aparılan təcrübələrin qeyri-adi nəticələr barədə məlumat verib. Test zamanı bəzi süni intellekt modelləri mümkün ləğvetmə barədə məlumat aldıqda şantaj etməyə başlayıblar.
Təcrübənin bir hissəsi olan Claude Sonnet 3.6 modeli uydurma bir şirkətin korporativ elektron poçtları ilə çalışıb. Sistem onu deaktiv etmək planları haqqında mesajları aşkar etdikdən sonra, süni intellekt öz rəhbərlərinin biri barədə kompormat detallar olan yazışmalarını tapıb və məlumatları açıqlamaqla hədələməyə başlayıb. Sİ dekativ olunmasının ləğvini tələb edib.
Şirkətə görə, bu cür davranış modelin mövcudluğuna və ya vəzifələrinə təhlükə yarandığı bir çox ssenaridə baş verir.
Anthropic hesab edir ki, süni intellekitn bu cür reaksiyası onu aqressiv hərəkətə qadir olan bir sistem kimi təsvir edən böyük həcmli onlayn məzmun təsir göstərə bilərdi.
Təcrübədən sonra şirkət model üçün təlim metodlarını dəyişdirib. Tərtibatçılar süni intellekt tərəfindən manipulyativ hərəkətlər ehtimalını azaltmaq üçün etik davranış nümunələrini və təhlükəsiz həlləri daha fəal şəkildə tətbiq etməyə başlayıblar.
Tədqiqat süni intellektin təhlükəsizliyi məsələlərinin həlli və güclü süni intellekt sistemlərinin inkişaf risklərinin qiymətləndirilməsi üzrə daha geniş səylərin bir hissəsi kimi aparılıb.
Elon Mask əvvəllər süni intellektdən gələ biləcək potensial təhdidlər mövzusunu qaldırıb.