Yeni GPT modeli GPT-4o özellikleri ile herkesi şaşırttı

14 Mayıs 2024 Salı

OpenAI, ChatGPT'nin yeni yapay zeka modelini duyurdu

GPT-4o'nun daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adım olduğu belirtilerek, modelin herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çıktı ürettiği belirtildi.

Modelin ses girişlerine verdiği yanıt süresinin, herhangi bir konuşmadaki insan tepki süresine benzer olduğuna işaret edilen açıklamada, GPT-4o'nun, mevcut modellerle karşılaştırıldığında özellikle görüntü ve ses anlama konusunda daha iyi olduğu vurgulandı.

GPT-4o ile metin, görüntü ve ses genelinde uçtan uca tek bir yeni modelin eğitildiğinin bilgisi verilerek, yeni modelin, tüm girdi ve çıktıların aynı sinir ağı tarafından işlendiği ilk model olduğu ifade edildi.

Ayrıca hem ücretsiz hem de ücretli kullanıcılar için, bilgisayarda yapılan işlemlere entegre olacak şekilde tasarlanmış, Mac işletim sistemi için yeni bir ChatGPT masaüstü uygulamasının da kullanıma sunulduğu bildirildi.

Öte yandan OpenAI'nın bugün düzenlediği tanıtım etkinliğinde, modelin önceki modellere göre daha uygun maliyetli olması nedeniyle ücretsiz olarak da sunulacağı, ücretli GPT-4o kullanıcılarının ise daha fazla kapasiteye sahip olacağı kaydedildi.

Yeni modelin birkaç hafta içinde ChatGPT'de sunulacağı belirtildi.

GPT-4o görüntülü ve sesli yeni özellikleriyle tüm dünyada büyük ses getirdi

OpenAI tarafından dün gece duyurulan GPT-4o, daha doğal insan-bilgisayar etkileşimi hedefinde büyük bir adım attı.

OpenAI, ChatGPT'nin yeni yapay zeka modelini duyurdu

Yeni model, herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çok doğal çıktılar üretmeyi başarıyor.

Daha hızlı ve konuşma diline daha yakın

GPT-4o'un en dikkat çekici özelliklerinden biri önceki versiyonlarına göre daha hızlı ve konuşma diline daha yakın bir üslupta cevap vermesi olarak öne çıkıyor.

OpenAI'ın web sayfasından paylaşılan videolarda bir kişi, GPT-4o'ya "OpenAI ile bir iş görüşmesi yapacağım. Bu şirketi hiç duydun mu?" diyor. GPT-4o da gerçek bir insan tonlaması ve esprili bir dille, "Bayağı tanıdık geliyor. Şaka, Tabii ki biliyorum." diyor.

Videonun devamında ön kamerayla konuştuğu kişiyi gören yapay zeka, mülakat öncesinde kişinin dış görünüşüyle ilgili yorumlar yapıp, tavsiyelerde bulunuyor.

GPT-4o, görme engelli bir kişiye asistanlık yaptı

Şirket tarafından yayınlanan bir diğer videoda da GPT-4o, görme engelli bir kişiye adeta asistanlık yapıyor. Londra'da geziye çıkan kişi, Buckingham Sarayı önünde yapay zekaya "Kral şu anda sarayda mı?" sorusunu yöneltiyor. Gördüğü görüntüleri yorumlayan GPT-4o, "Evet, kral şu anda sarayda gibi görünüyor. Royal Standard bayrağı şu anda Buckingham Sarayı'nın üstünde dalgalanıyor. Bu da kralın orada olduğuna işaret ediyor." yanıtını veriyor.

Videonun devamında yapay zeka, bir parkı ziyaret eden görme engelli kişiye gördüğü manzaraları anlatıyor. Ardından da taksi bekleyen kişiye taşıtı tespit ederek, "taksi yaklaşıyor" uyarısında bulunuyor.

GPT-4o'nun dış ortam hakimiyetini gösteren başka bir videoda, yapay zeka bir odadaki 2 kişi ile ortada duran ufak bir pasta ve üzerindeki mumu görüyor. Yapay zeka yine esprili bir dille, "Görünen o ki birileri doğum günü kutluyor. Özel bir günü mü kutluyorsunuz, yoksa pasta yemek için bir bahane mi buldunuz?" diyor. GPT-4o bunun ardından doğum günü kutlanan kişiye doğum günü şarkısı söylüyor.

Konuşmaları anında dilden dile çeviriyor

Bir diğer videoda da GPT-4o anlık çeviriler yaparken görülüyor. Videodaki kişi yapay zekaya, yanında bir İtalyan arkadaşı olduğunu belirterek, konuşmaları tercüme etmesini istiyor. GPT-4o tercüme işlemini de gerçek zamanlı ve doğal bir insan sesiyle yapmayı başarıyor.

Geometri problemini çözüyor

Şirket tarafından yayımlanan diğer bir videoda da GPT-4o, bir öğrenciyle geometri problemi çözüyor. Yapay zeka videoda öğrenciye adeta bir hoca gibi yardımcı oluyor ve problemi nasıl çözmesi gerektiğini öğretiyor.

 Abdulkadir Günyol - AA