USD44,90
%0.07
EURO52,91
%-0.06
EURO/USD1,18
%-0.2
BIST14.463,76
%-0.15
Petrol94,91
%-0.6
GR. ALTIN6.919,43
%-0.49
BTC3.627.869,41
%0.51
  1. Haberler
  2. Teknoloji
  3. OpenAI, ses teknolojisinde çığır açtı! Gerçek zamanlı konuşma ve çeviri yapabilen yeni modeller geliştiricilerin kullanımına sunuldu.

OpenAI, ses teknolojisinde çığır açtı! Gerçek zamanlı konuşma ve çeviri yapabilen yeni modeller geliştiricilerin kullanımına sunuldu.

featured
0
Paylaş

Bu Yazıyı Paylaş

veya linki kopyala

OpenAI, Yeni Ses Zekası Modelleri ile Geliştiricilere Yepyeni Fırsatlar Sunuyor

OpenAI, API’sine eklediği yeni ses zekası özellikleriyle geliştiricilere daha etkileşimli uygulamalar yaratma imkânı tanıdı. Artık, kullanıcılarla konuşabilen, konuşmaları metne dönüştürebilen ve çeviri yapabilen uygulamalar geliştirmek mümkün hale geldi.

Yeni ses modeli olan GPT-Realtime-2, kullanıcılarla doğal bir şekilde sohbet edebilme kabiliyetiyle tasarlandı. Önceki versiyon olan GPT-Realtime-1.5’e göre önemli farklılıklar gösteren bu model, GPT-5 sınıfı akıl yürütme yetenekleri ile donatıldı. OpenAI, bu gelişmenin kullanıcıların daha karmaşık taleplerine yanıt verebilme kapasitesini artırdığını vurguluyor. Ayrıca, modelin Big Bench Audio testlerinden yüzde 15,2 daha yüksek bir başarı elde ettiğini belirtiyor.

Bağlam penceresi 32K’dan 128K’ya çıkarılan GPT-Realtime-2, uzun ve karmaşık sesli oturumları sürdürebilme kabiliyeti ile dikkat çekiyor. Model aynı anda birden fazla işlem gerçekleştirme yeteneğine sahip. Kullanıcıya süreç hakkında bilgi verecek şekilde “takvimi kontrol ediyorum” veya “şu anda bunu araştırıyorum” gibi ara geri bildirimlerde bulunabiliyor.

Bunun yanı sıra, OpenAI yeni bir özellik olan GPT-Realtime-Translate’i de tanıttı. Bu özellik, kullanıcıyla etkileşim sırasında gerçek zamanlı çeviri yapabilme kapasitesine sahip. 70’ten fazla dili anlayan model, 13 dilde anlık destek sunarak eş zamanlı metin çıktısı da üretebiliyor.

Transkripsiyon alanında da yenilikler sunan OpenAI, GPT-Realtime-Whisper modelini tanıttı. Bu model, canlı konuşma ile metin dönüştürme özellikleri sunarak, özellikle toplantı notları, canlı altyazılar ve müşteri destek süreçlerinde düşük gecikmeli transkripsiyon sağlamayı hedefliyor.

Faturalandırma sisteminde ise Translate ve Whisper, dakika bazında ücretlendirilirken, GPT-Realtime-2 token tüketimi üzerinden ücretlendirilmekte. Ses girdi tokenları için 1 milyon token başına 32 dolar, ses çıktısı için ise 64 dolar talep ediliyor.

OpenAI, yeni modelleriyle sesli arayüzleri basit bir soru-cevap formatından daha karmaşık işlevleri yerine getirebilen bir yapıya dönüştürdüğünü belirtiyor. Eğitim, medya ve içerik üretimi gibi birçok sektörde fayda sağlayacağı ifade ediliyor. Ayrıca, şirket kötüye kullanımı önlemek için koruma önlemleri geliştirdiğini ve zararlı içeriklere karşı belirli tetikleyicilerin sisteme entegre edildiğini açıkladı.

OpenAI, ses teknolojisinde çığır açtı! Gerçek zamanlı konuşma ve çeviri yapabilen yeni modeller geliştiricilerin kullanımına sunuldu.
0

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

0/30 karakter

Giriş Yap

Sondaki Haber ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!

Sondaki Haber ile Haber Hakkında Sohbet

Sondaki Haber ile Haber Hakkında Sohbet

Sohbet sistemi şu anda aktif değil. Lütfen daha sonra tekrar deneyin.