OpenAI​, yaklaşık yedi ay önce demosunu yaptığı ChatGPT​ için gerçek zamanlı video yeteneklerini nihayet yayınladı. Perşembe günü bir canlı yayın sırasında şirket, ChatGPT için insan benzeri konuşma özelliği olan Gelişmiş Sesli Modu'nun artık görebilmeye de başladığını söyledi.

ChatGPT Plus, Team veya Pro'ya abone olan kullanıcılar ChatGPT uygulamasını kullanarak telefonlarını nesnelere doğrultabilir ve ChatGPT'nin neredeyse gerçek zamanlı olarak yanıt vermesini sağlayabilir.

Keçiörengücü, Karagümrük'e Yenildi Keçiörengücü, Karagümrük'e Yenildi

Görme özelliğine sahip Gelişmiş Sesli Mod, ekran paylaşımı yoluyla bir cihazın ekranında ne olduğunu da anlayabiliyor. Örneğin, çeşitli ayar menülerini açıklayabiliyor veya bir matematik problemi hakkında önerilerde bulunabiliyor.

ChatGPT "Gelişmiş Sesli Modu" artık görebiliyor: Ekran paylaşımı ve nesne algılama özellikleri geldi - 1. Resim


GÖRÜNTÜLÜ GELİŞMİŞ SESLİ MOD NASIL KULLANILIR?

Görüntülü Gelişmiş Sesli Moduna erişmek için ChatGPT sohbet çubuğunun yanındaki ses simgesine dokunun, ardından sol alttaki video simgesine dokunarak videoyu başlatın. Ekran paylaşmak için üç noktalı menüye dokunun ve "Ekranı Paylaş"ı seçin.

OpenAI, görüntülü Gelişmiş Sesli Modu'nun kullanıma sunulmasının perşembe günü başlayacağını ve önümüzdeki hafta tamamlanacağını söyledi. Ancak tüm kullanıcılar erişemeyecek. OpenAI, ChatGPT Enterprise ve Edu abonelerinin ocak ayına kadar bu özelliğe sahip olamayacağını ve AB, İsviçre, İzlanda, Norveç veya Lihtenştayn'daki ChatGPT kullanıcıları için bir zaman çizelgesi olmadığını belirtti.

OpenAI Başkanı Greg Brockman, CNN'in "60 Dakika" programında yaptığı bir tanıtımda, Gelişmiş Sesli Modu ile Anderson Cooper'ı anatomi becerileri konusunda sınadı. Cooper bir tahtaya vücut parçalarını çizerken, ChatGPT onun ne çizdiğini "anlayabiliyordu".

ChatGPT, "Konum tam yerinde. Beyin tam kafanın içinde. Şekle gelince, bu iyi bir başlangıç. Beyin daha çok oval bir şekle sahip" gibi sözlerle Cooper'in çizimiyle ilgili gerçek zamanlı olarak yorum yaptı.

BİR GEOMETRİ TESTİNDE HATA YAPTI

Ancak aynı demoda, bir geometri probleminde hata yaptı ve bu da yanlış bilgi sunmaya açık olduğunu düşündürüyor.

Görme özellikli Gelişmiş Sesli Modu, OpenAI'ın bu özelliği üretime hazır olmadan çok önce duyurması nedeniyle birçok kez ertelendi. Nisan ayında OpenAI, Gelişmiş Sesli Modu'nun "birkaç hafta içinde" kullanıcılara sunulacağı sözünü vermişti ancak aylar sonra şirket daha fazla zamana ihtiyacı olduğunu duyurmuştu.

Google ve Meta gibi rakipler de kendi chatbot ürünleri için benzer özellikler üzerinde çalışıyor. Bu hafta Google, gerçek zamanlı, video analizli konuşma yapay zekası özelliği Project Astra'yı Android'de bir grup "güvenilir test kullanıcısının" kullanımına sundu.

ChatGPT "Gelişmiş Sesli Modu" artık görebiliyor: Ekran paylaşımı ve nesne algılama özellikleri geldi - 2. Resim


NOEL BABA MODU SUNULDU

OpenAI perşembe günü, görüntülü Gelişmiş Ses Moduna ek olarak, Noel Baba'nın sesini ChatGPT'de önceden ayarlanmış bir ses olarak ekleyen şenlikli bir "Noel Baba Modu" başlattı. Kullanıcılar bunu ChatGPT uygulamasında istem çubuğunun yanındaki kar tanesi simgesine dokunarak ya da tıklayarak bulabilirler.