Google’dan Yenilikçi Yapay Zeka: Gemini 2.5 Computer Use Modeli Tanıtıldı
Google, web tarayıcılarını insan davranışlarını taklit edebilen yeni yapay zeka modeli Gemini 2.5 Computer Use’u tanıttı. Bu yenilikçi sistem, API erişimi olmayan verileri edinmek için kullanıcı gibi tarayıcıda tıklama, kaydırma ve metin girme yeteneklerine sahip.
Gemini 2.5, kullanıcıdan aldığı komutları, görsel anlama ve mantıksal çıkarım yeteneklerini kullanarak analiz eder ve istenen görevi adım adım yerine getirir. Örneğin, bu yapay zeka bir form doldurabilir veya bir web sitesinde belirli bir işlemi başarıyla tamamlayabilir. Google, bu özelliğin özellikle kullanıcı arayüzü testlerinde veya API bağlantısı bulunmayan hizmetlerde büyük fayda sağladığını belirtiyor.
Şirket, daha önceki projelerinde benzer teknolojileri denemişti. Örneğin, Gemini’nin "AI Mode" özelliği ve Project Mariner, yapay zekanın alışveriş listelerine göre ürünleri sepete eklemesi gibi otonom işlemleri gerçekleştirebilen sistemler olarak dikkat çekmişti.
Google, Gemini 2.5 Computer Use’un birçok web ve mobil benchmark testinde rakiplerinden daha üstün performans gösterdiğini vurguluyor. OpenAI’ın yeni "ChatGPT Agent" sistemi kullanıcı adına karmaşık görevleri yerine getirebilirken, Anthropic ise geçtiğimiz yıl Claude modelinin "computer use" yeteneğini tanıtmıştı.
Ancak, şu anda Gemini 2.5 Computer Use’un yalnızca web tarayıcısına erişimi bulunuyor; bilgisayar düzeyinde bir kontrol gerçekleştiremiyor. Model, şu anda 13 farklı eylemi destekleyerek tarayıcı açma, metin yazma, sürükle-bırak işlemleri gerçekleştirme ve sayfada gezinme gibi işler yapabiliyor.
-Kaynak: donanimhaber.com