Yeni MIT Aracı, AI Model Yanıtlarının Doğrulanmasını İyileştiriyor

Image from Freepik

Yeni MIT Aracı, AI Model Yanıtlarının Doğrulanmasını İyileştiriyor

Okuma süresi: 3 dk.

Acele mi Ettiniz? İşte Önemli Bilgiler!

  • Araç, kullanıcıların AI tarafından üretilen çıktılardaki veri kaynaklarını izlemesine olanak sağlar.
  • SymGen, kullanıcı çalışmalarında doğrulama süresini yaklaşık %20 azalttı.
  • Gelecekteki geliştirmeler, tablo verilerinin ötesinde çeşitli metin türlerini desteklemeyi hedefliyor.

MIT’deki araştırmacılar yakın zamanda geliştirdikleri bir aracı, SymGen’i duyurdu. Bu araç, büyük dil modelleri (LLM’ler) tarafından oluşturulan yanıtların doğrulama sürecini iyileştirmeyi amaçlamaktadır. Bu sistem, kullanıcıların AI tarafından atıfta bulunulan verileri takip etmelerini sağlar, böylece çıktılarının güvenilirliği artabilir.

Gelişmiş yeteneklerine rağmen, LLM’ler genellikle doğru olmayan veya desteklenmeyen bilgiler üretir, bu durum “halüsinasyon” olarak bilinir.

Bu, sağlık ve finans gibi yüksek riskli alanlarda zorluklar yaratır, çünkü AI tarafından üretilen bilgileri doğrulamak için genellikle insan faktör kontrolcülerine ihtiyaç duyulur. Geleneksel doğrulama metotları, kullanıcıların uzun belgeleri incelemesi gerektiği için zaman alıcı ve hata yapmaya müsait olabilir, duyuruda belirtildiği gibi.

Bu, özellikle tıpta AI’ın artan önemi göz önüne alındığında son derece geçerlidir. Örneğin, NHS, röntgenlerde kırık tespitini geliştirmek için AI teknolojisini kullanmaya başlamak üzere yakın zamanda onay aldı.

SymGen, MIT basın bülteninde rapor edildiği gibi, bir veritabanındaki belirli hücrelere doğrudan atıflarla yanıtlar üretmeyi sağlayarak bu zorlukları ele alır.

Kullanıcılar, metnin o bölümünü bilgilendiren altta yatan verilere hızlıca erişebilmek için AI’nin yanıtındaki vurgulanan metnin üzerine gelerek fareyi hareket ettirebilirler. Bu özellik, kullanıcıların yanıtın hangi bölümlerinin daha fazla doğrulama gerektirdiğini belirlemelerine yardımcı olmayı amaçlamaktadır.

Elektrik mühendisliği ve bilgisayar bilimleri üzerine yüksek lisans öğrencisi olan Shannon Shen, SymGen üzerine yapılan çalışmanın ortak baş yazarlarından biri. Shannon, basın bülteninde, “İnsanlara metnin üzerinde daha çok endişelenmeleri gereken bölümlere seçici bir şekilde odaklanma yeteneği veriyoruz.” dedi.

Bu yetenek, sunulan bilgilerin daha yakından incelenmesine olanak sağlayarak, kullanıcıların modelin çıktılarına olan güvenini artırmayı amaçlamaktadır.

Kullanıcı çalışması, SymGen’in standart prosedürlere kıyasla doğrulama süresini yaklaşık %20 oranında azalttığını gösterdi. Bu verimlilik, klinik notlar oluşturma ve mali raporları özetleme dahil olmak üzere çeşitli bağlamlarda faydalı olabilir.

Mevcut doğrulama sistemleri genellikle alıntı oluşturmayı bir sonradan düşünme olarak kabul eder, bu da verimsizliklere yol açabilir. Shen, generatif AI’nin kullanıcı görevlerini kolaylaştırma amacı taşıdığını, ancak hantal doğrulama süreçlerinin kullanılabilirliğini azalttığını belirtti.

Araç, kullanıcıların ilgili istatistiklerle bir tablo gibi yapılandırılmış bir biçimde veri sağlamalarını gerektirerek çalışır. Bir yanıt oluşturmadan önce, model sembolik bir temsil oluşturur ve metnin bölümlerini kaynak verilerine bağlar.

Örneğin, “Portland Trail Blazers”ı anarken, model bilginin kaynağını izlemelerini sağlayan, giriş tablosundaki ilgili hücreyi belirtir, basın bülteninde belirtildiği gibi.

Ancak, makale, SymGen’in etkinliğinin kaynak verinin kalitesine bağlı olduğunu belirtiyor. Model yanlış değişkenlere başvurursa, insan doğrulayıcılar bu hataları tespit edemeyebilir.

Şu anda, sistem tablo verilere sınırlıdır, ancak araştırma ekibi, çeşitli metin formatları ve veri tiplerini ele alabilme yeteneklerini genişletme üzerine çalışmaktadır. Gelecek planları arasında, SymGen’in AI tarafından oluşturulan tıbbi özetlerdeki hataları belirleme potansiyelini değerlendirmek için klinik ortamlarda test etmek yer almaktadır.

Bu araştırma, AI teknolojilerinin çeşitli alanlara giderek daha fazla entegre olmalarıyla, bu teknolojilerin güvenilirliğini ve hesap verilebilirliğini arttırmaya yönelik süregelen çabalara katkıda bulunmayı hedeflemektedir.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Loader
Loader Devamını oku...