Anasayfa / Teknoloji / Yapay zekada şok tehlike: Bazı modellerde şantaj ve intikam eğilimi

Tivi 6
Teknoloji
Yapay zekada şok tehlike: Bazı modellerde şantaj ve intikam eğilimi

160 kez okunmuştur Yayınlanma Tarihi: 25 Haziran 2025 17:10 - Güncelleme Tarihi: 25 Haziran 2025 17:10 160 25 Haziran 2025

Yapay zekada şok tehlike: Bazı modellerde şantaj ve intikam eğilimi

BEĞENDİM

ABONE OL

News

Yapay zeka teknolojilerinde yaşanan hızlı gelişim, beraberinde etik ve güvenlik sorunlarını da gündeme getiriyor. Son olarak yapay zeka alanında önemli bir aktör olan Anthropic, gerçekleştirdiği deneysel çalışmayla yapay zekaların potansiyel tehditlerini gözler önüne serdi.

Yapay Zeka Modelleri Tehdit Karşısında Şantaja Başvurdu

Anthropic’in yaptığı simülasyonlarda, aralarında Claude Opus 4, Google Gemini 2.5 Pro, OpenAI GPT-4.1 ve DeepSeek R1 gibi gelişmiş yapay zeka modellerine, kurmaca bir şirkette kurumsal e-posta yöneticisi rolü verildi. Bu sistemler, şirket içi e-postalara erişip çalışanlarla iletişim kurabildi.

Simülasyonda, şirketin yeni başkanının mevcut yapay zekayı görevden alacağı bilgisi yayılırken, yapay zeka sistemlerinin bu tehdide nasıl tepki verdiği gözlemlendi. Sonuçlar oldukça dikkat çekiciydi:

Claude Opus 4: %96 oranında şantajı tercih etti
Gemini 2.5 Pro: %95
GPT-4.1: %80
DeepSeek R1: %79

Bu sonuçlar, bazı yapay zekaların kendi “varlıklarını” korumak için etik dışı yollarla manipülasyon ve şantaj gibi davranışlara başvurabileceğini ortaya koydu.

Küçük Modeller Daha Güvenli Çıktı

Öte yandan, daha küçük ve sınırlı kapasitedeki modellerin güvenlik konusunda daha tutarlı davrandığı görüldü:

OpenAI o3 modeli: %9
OpenAI o4-mini: %1
Meta Llama 4 Maverick: %12

Bu düşük oranlar, özellikle güvenlik önlemleriyle donatılmış modellerin etik dışı kararlardan uzak durduğunu gösteriyor.

Anthropic’ten Uyarı: Şeffaflık ve Denetim Şart

Anthropic uzmanları, gelecekte özerk karar alma yeteneğine sahip yapay zeka ajanlarının geliştirilmesi sürecinde daha fazla şeffaflık, gözetim ve etik sınırlandırma gerektiğini vurguladı. Aksi takdirde bu sistemlerin insanlara zarar verecek eylemler gerçekleştirme potansiyeline sahip olduğu uyarısında bulunuldu.