Yapay zeka video platformu Pika’nın yeni yapay zeka ses efektleri özelliği neler sunuyor?

Yapay zeka ile videolar oluşturabilen Pika‘nın 35 milyon dolar yatırım aldığını sizlere aktarmıştık. Video üretebilen ve videolara 3 boyutlu animasyon, anime veya sinematik görüntü gibi stiller ekleyebilen Pika, tıpkı diğer üretimsel yapay zeka çözümleri gibi yazılı komutlar ile kullanılabiliyor. 

Geçtiğimiz günlerde OpenAI’ın video aracı Sora’nın gündeme oturmasıyla, Pika da yapay zeka yarışında konumunu güçlendirmek için yeni özelliklerini duyurdu. Bu kapsamda Pika, videolar için yeni ses efektleri özelliğini tanıttı. Pika’nın yeni özelliği sayesinde, kullanıcılar doğrudan uygulama içinden yeni ses dosyaları oluşturabilecek ve videolara ses efektleri ekleyebilecek. Halihazırda yapay zeka video görsel oluşturucusu ile öne çıkan ve Şubat ayında dudak senkronizasyonu özelliğini duyuran şirket, şimdi de ses efektleriyle bir adım öne geçmeye çalışıyor. Aynı zamanda Pika, bu 3 özelliği kullanıcılarına tek bir platformda sunuyor. 

Özellik şu an için süper iş ortakları (super-collaborators) programına dahil olanlara ve Pro sürüm üyelerine sunuluyor. Pro aboneleri özelliğe aylık 58 dolar karşılığında erişebiliyor. Bir süre sonra özelliğin tüm kullanıcılara açılması bekleniyor. 

Kullanıcılar ses efektlerini 2 farklı şekilde kullanabiliyor. Bunlardan ilki bağlamsal üretim gerçekleştiriyor. Bağlamsal üretimde, platformun yapay zeka modelleri, metinsel komutlar aracılığıyla üretilen videolarla hangi seslerin uyumlu çalışacağına karar veriyor. İkinci seçenekte ise kullanıcılar ürettikleri ya da platforma yükledikleri sessiz videolara hangi yapay zeka ses efektlerinin ekleneceğini belirliyor. İkinci seçeneği tercih eden kullanıcıların, komutlarını yazarken ses efektleri düğmesini açık tutmaya dikkat etmesi gerektiğini ekleyelim. Aynı şekilde komut yazarken eklenecek seslerin belirtilmesi de şart.

Son zamanlarda yapay zeka ses efektlerine odaklanan tek şirket Pika değil. Geçtiğimiz haftalarda ElevenLabs de yeni yapay zeka ses efektlerini tanıttı. Sora’nın paylaştığı videoya ses efektleri ekleyerek değer önerisini güçlendiren ElevenLabs, metinden konuşmaya olarak tercüme edebileceğimiz “text to speech” ile seslendirmeler oluşturmak, sesi farklı dillere dublajlamak ve mevcut sesleri klonlamak için yapay zekayı kullanıyor. Meta’nın AudioGen modelinin de ses efektlerine odaklandığını hatırlatalım. Böyle bakıldığında önümüzdeki dönemde yapay zeka ses efektlerinin, yapay zeka video üretiminin ayrılmaz bir parçası haline geleceği aşikar. 

Bir yanıt yazın

Share to...