OpenAI, Yeni “Mantık Yürütme” Yapay Zeka Modelini, o1’i Yayınladı

Image by Ishmael Daro, from Flickr

OpenAI, Yeni “Mantık Yürütme” Yapay Zeka Modelini, o1’i Yayınladı

Okuma süresi: 3 dk.

OpenAI, bugün en son AI modeli o1’i duyurdu. Bu model, karmaşık problemleri daha hızlı ve daha doğru bir şekilde ele almak üzere tasarlanmış “mantık yürütme” modellerinin yeni bir ailesinin ilk üyesidir.

OpenAI, o1 ile birlikte daha küçük ve daha uygun fiyatlı bir versiyon olan o1-mini’yi de piyasaya sürüyor. Bu sürüm, teknolojinin hala erken aşamalarda olduğunu gösteren bir “önizleme” olarak tanımlanıyor.

Daha önce “Strawberry” kod adıyla bilinen o1, OpenAI’nin yayınlamayı planladığı “akıl yürütme” modellerinin ilki olarak TechCrunch tarafından belirtildi.

OpenAI’nin araştırma lideri Jerry Tworek, The Verge’ye o1’in eğitiminin, önceki modellerden önemli ölçüde farklı olduğunu belirtti, ancak şirket, detaylar konusunda belirsiz kaldı.

Önceki sürümlerinin aksine, eğitim verilerinden desenler taklit etmek üzere tasarlanmış olan o1, takviye öğrenme adı verilen bir yöntem kullanır. Bu yöntem, sistemlere ödüller ve cezalar aracılığıyla problemleri çözme yeteneğini öğretir.

o1’in en dikkat çekici özelliklerinden biri, önceki modellere kıyasla daha yüksek bir doğruluk derecesiyle çok adımlı problemleri çözebilme ve kod yazabilme yeteneğidir.

Örneğin, Uluslararası Matematik Olimpiyatları için bir eleme sınavında, o1, OpenAI’nin önceki GPT-4o modelini geride bırakarak, sorunların %83’ünü çözdü, GPT-4o’nun ise sadece %13’ünü çözebildi.

Bu performanstaki sıçrama, o1’in yeni eğitim sürecine atfedilir. Bu süreç, OpenAI’nin “düşünce zinciri” olarak adlandırdığı bir mekanizmayı içerir ve modelin sorunları adım adım parçalara ayırıp çözmesine izin verir.

Tworek, modelin “halüsinasyon” yani yanıltıcı bilgi sağlama eğilimini azalttığını belirtirken, bu sorunun tamamen çözülmediğini, The Verge’in bildirdiği gibi belirtiyor.

Matematiksel yeteneklerine ek olarak, o1 rekabetçi programlama yarışmalarında yüzde 89’luk dilime girdi, bu da geliştiriciler ve araştırmacılar için potansiyel bir araç olduğunu gösterdi.

The Verge’e göre, o1’in insan düşüncesini taklit etme şekli oldukça dikkat çekiciydi. “Merak ediyorum,” “Düşünüyorum,” ve “Bir bakayım” gibi ifadeler, modelin aslında düşünmediği halde, bir düşünme sürecinin illüzyonunu yaratıyordu. Peki, neden bunu yapmış gibi gösterilsin ki?

The Verge, Tworek’in bu arayüzün modelin sorunları daha derinlemesine işlemek ve keşfetmek için daha fazla zaman aldığını göstermek amacıyla tasarlandığını aktarıyor.

Bu ilerlemelere rağmen, OpenAI o1’in hala sınırları olduğunu kabul ediyor. Karmaşık problem çözümünde başarılı olmasına rağmen, dünya hakkında faktörel bilgiyi işlemekte daha az becerikli. Ayrıca, webi tarama veya dosya ve resimleri işleme yeteneği gibi GPT-4o’yu son derece çok yönlü yapan bazı özelliklere sahip değil.

Ayrıca, o1’in yeni yetenekleri bir maliyetle gelir. Model, GPT-4o’dan önemli ölçüde daha pahalıdır. OpenAI’in API’sinde, o1-önizleme, 1 milyon giriş belirteci başına 15 dolar ve 1 milyon çıktı belirteci başına 60 dolar maliyetlidir, bu da GPT-4o’nun maliyetinden üç ila dört kat daha yüksektir.

Teknoloji hala ilk aşamalarında olmasına rağmen, o1’in yayınlanması, AI’nın karmaşık görevlerle başa çıkmadaki yeteneğindeki sürekli ilerlemeleri vurgulamaktadır. Bu, gelişmiş problem çözme yeteneklerini gerektiren çeşitli alanlarda potansiyel faydalar sunmaktadır.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Devamını oku...