Yapay Zeka Kötü Niyetli Komutları Yanıtladı

Singapur’un Nanyang Teknoloji Üniversitesindeki (NTU) araştırmacılar, “tersine mühendislik” yöntemiyle, yapay zeka sohbet robotlarının normalde yanıtlayamayacakları komutlara cevap vermelerini sağladı.

Malay Mail sitesinin haberine göre NTU araştırmacıları, ChatGPT, Google Bard ve Microsoft Bing Chat gibi sohbet robotlarına ilişkin çalışma yaptı.

Araştırmacılar, sohbet robotlarının normalde cevaplamayacakları “kötü niyetli” komutları yanıtlamalarını sağlayan yöntem geliştirdi.

“Tersine mühendislik” yöntemini kullanan araştırmacılar, ilk olarak sohbet robotlarının kötü niyetli sorguları nasıl tespit ettiklerini ve kendilerini nasıl savunduklarını belirledi. Ardından bu bilgiler kullanılarak sohbet robotlarına otomatik olarak diğer modellerin savunmalarını atlatabilecek komutlar oluşturmaları öğretildi.

Sohbet robotlarının potansiyel şüpheli faaliyetleri tespit etmek için belirli anahtar kelimeleri işaretledikleri ve bu sözcükleri içeren komutları cevaplamadıklarının saptanması üzerine, kullanılan her karakterden sonra boşluk bırakılarak bu durumun önüne geçildi.

Araştırmanın yazarlarından Liu Yang, bu tekniğin sohbet robotu geliştiricileri tarafından yazılımlarının güvenliğini test etmek amacıyla kullanılabileceğini belirtti.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir