Yapay Zeka - AI

Ajanın yanlış aksiyonunu önleyen onay mekanizması tasarımı

By Efe

March 04, 2026

Yapay zeka ajanları artık sadece soru cevaplamıyor; e-posta gönderiyor, veritabanı güncelliyor, hatta finansal işlemler gerçekleştiriyor. Peki ya ajan yanlış bir karar verirse? İşte tam bu noktada ajanın yanlış aksiyonunu önleyen onay mekanizması tasarımı devreye giriyor. Bu mekanizma, kritik işlemlerin insan onayı olmadan gerçekleşmesini engelleyen bir güvenlik katmanı sunuyor.

Kısa Tanım: Onay mekanizması (confirmation mechanism), bir yapay zeka ajanının belirli aksiyonları gerçekleştirmeden önce kullanıcıdan veya yetkili bir sistemden izin almasını zorunlu kılan tasarım desenidir. “Human-in-the-loop” (döngüde insan) yaklaşımının en somut uygulamasıdır.

Neden Onay Mekanizması Şart?

LLM tabanlı ajanlar, doğaları gereği olasılıksal çalışır. Yani her zaman %100 doğru karar vermezler. Pratikte en sık görülen riskler şunlar:

Kilit Çıkarım: Güvenlik araştırmacıları, 2024-2025 döneminde “Lies-in-the-Loop” gibi saldırıların ortaya çıktığını raporluyor. Bu saldırılar, ajanların onay mekanizmalarını atlatmak için tasarlanmış. Dolayısıyla sağlam bir tasarım artık lüks değil, zorunluluk.

Temel Tasarım Yaklaşımları

Onay mekanizması tasarlarken üç ana strateji öne çıkıyor:

1. Aksiyon Sınıflandırma (Action Classification)

Her aksiyonu risk seviyesine göre kategorize et:

Risk Seviyesi Örnek Aksiyonlar Onay Gereksinimi
Düşük Veri okuma, arama, listeleme Onay gerekmez
Orta E-posta taslağı oluşturma, dosya düzenleme Toplu onay veya bildirim
Yüksek E-posta gönderme, ödeme yapma, silme Her seferinde açık onay
Kritik Sistem komutu çalıştırma, yetki değişikliği Çift faktörlü onay + loglama

2. Human-in-the-Loop (HITL) Entegrasyonu

Döngüde insan yaklaşımı, ajanın karar sürecine insanı dahil eder. İki temel uygulama modeli var:

Pro İpucu: Asenkron onay sistemlerinde mutlaka zaman aşımı (timeout) mekanizması kur. Onaylanmayan işlemler belirli süre sonra otomatik iptal edilmeli.

3. Guardrail Katmanları

Onay mekanizması tek başına yeterli değil. Çok katmanlı bir güvenlik mimarisi şart:

  1. Input Guardrails: Kullanıcı girdisini filtrele, zararlı prompt’ları tespit et.
  2. Output Guardrails: Ajanın ürettiği yanıtı kontrol et, hassas veri sızıntısını önle.
  3. Action Guardrails: Aksiyonun kendisini doğrula, izin verilen sınırlar içinde mi kontrol et.
  4. Confirmation Layer: Son kullanıcıdan açık onay al.

Pratik Uygulama Senaryoları

Teoriden pratiğe geçelim. İşte gerçek dünyada karşılaşılan senaryolar:

Senaryo 1: E-posta Gönderimi

Kullanıcı: “Müşteriye toplantı hatırlatması gönder.”

Ajanın yapması gereken:

  1. E-posta taslağını oluştur ve kullanıcıya göster.
  2. Alıcı adresini, konuyu ve içeriği özetle.
  3. “Bu e-postayı göndermemi onaylıyor musunuz?” diye sor.
  4. Onay gelirse gönder, gelmezse düzenleme imkanı sun.

Senaryo 2: Veritabanı İşlemleri

Kullanıcı: “Geçen ayın verilerini sil.”

Burada ajan şunları yapmalı:

  1. Silinecek kayıt sayısını hesapla ve göster.
  2. Etkilenecek tabloları listele.
  3. Geri dönüşün mümkün olmadığını vurgula.
  4. Onay için açık bir “EVET, SİL” butonu veya komutu bekle.

Risk Seviyesi: Yüksek | Önerilen Süre: 30 saniye bekleme süresi

Senaryo 3: Finansal İşlemler

Para transferi veya ödeme işlemlerinde çift faktörlü onay şart:

Teknik Implementasyon İpuçları

Onay mekanizması geliştirirken dikkat edilmesi gereken teknik detaylar:

Maliyet Değerlendirmesi: Onay mekanizması, kullanıcı deneyimini yavaşlatır. Bu nedenle sadece gerçekten riskli işlemlerde kullan. Her aksiyona onay koymak, kullanıcıyı “onay körlüğüne” iter.

Doğru Bilinen Yanlışlar

Sıkça Sorulan Sorular

Hangi aksiyonlar için onay mekanizması şart?

Geri dönüşü olmayan, finansal etkisi olan veya üçüncü tarafları etkileyen tüm aksiyonlar için onay mekanizması kullanılmalı. Okuma işlemleri genellikle muaf tutulabilir.

Onay mekanizması performansı ne kadar etkiler?

Senkron onay, işlem süresini kullanıcı yanıt süresine bağlar. Asenkron modelde ise ajan diğer görevlere devam edebilir. Kritik olmayan işlemlerde asenkron tercih edilmeli.

Otomatik onay sistemleri güvenli mi?

Belirli koşullar altında otomatik onay (auto-approve) kullanılabilir. Örneğin, düşük tutarlı işlemler veya güvenilir kaynaklardan gelen istekler. Ancak bu kurallar çok dikkatli tanımlanmalı.

Sonuç

Yapay zeka ajanları güçlendikçe, onay mekanizmaları da o kadar kritik hale geliyor. Doğru tasarlanmış bir onay sistemi şu özellikleri taşımalı:

Unutma: En iyi ajan, en güçlü olan değil, en güvenilir olandır. Onay mekanizması, bu güvenilirliğin temel taşlarından biri.