Rap Mona Lisa'yı mı? Yeni Microsoft AI, fotoğraflardan yüzleri canlandırıyor

Ana Ryu/Visual China Group/Getty Images

19 Mart 2023'te şirketin Seattle, Washington'daki genel merkezinde bir Microsoft tabelası görülüyor.

New York
CNN
—

Mona Lisa, Microsoft'un yeni yapay zeka teknolojisi sayesinde artık gülümsemekten daha fazlasını yapabiliyor.

Geçtiğimiz hafta Microsoft araştırmacıları, bir yüzün hareketsiz görüntüsünü ve konuşan birinin ses klibini alabilen ve otomatik olarak konuşan kişinin gerçekçi görünümlü bir videosunu oluşturabilen, geliştirdikleri yeni bir yapay zeka modelinin ayrıntılarını açıkladı. Karikatürler veya sanat eserlerinin yanı sıra gerçek hayattaki yüzlerden de oluşturulabilen videolar, ikna edici dudak senkronizasyonları ve doğal yüz ve kafa hareketleriyle tamamlanıyor.

Deneysel bir videoda araştırmacılar, Mona Lisa'yı aktris Anne Hathaway'in komik bir rap şarkısını okuyacak şekilde nasıl canlandırdıklarını gösterdiler.

Yapay zeka modelinden elde edilen çıktılara denir Vasa-1, hem eğlenceli hem de gerçeklikleri açısından biraz çelişkili. Microsoft, teknolojinin eğitim için kullanılabileceğini, “iletişim güçlüğü çeken bireylerin erişilebilirliğini artırmak” veya belki de insanlar için sanal arkadaşlar yaratmak için kullanılabileceğini söyledi. Ancak aracın nasıl kötüye kullanılabileceğini ve gerçek insanları taklit etmek için kullanılabileceğini görmek de kolaydır.

Bu, Microsoft'un ötesine geçen bir endişedir: Yapay zeka tarafından oluşturulan ilgi çekici görüntüler, videolar ve ses klipleri oluşturmak için daha fazla araç ortaya çıktıkça, Uzmanlar endişeli Ve bunların kötüye kullanılması yeni yanlış bilgi biçimlerine yol açabilir. Bazıları teknolojinin filmlerden reklamcılığa kadar yaratıcı endüstrileri daha da sekteye uğratacağından endişe ediyor.

Şu anda Microsoft, VASA-1 modelini hemen kamuoyuna sunmayı planlamadığını söyledi. Bu hamle, Microsoft ortağı OpenAI'nin çevredeki kaygıları ele alma biçimine benzer Yapay zeka tarafından oluşturulan video aracıSora: OpenAI, Şubat ayında Sora'yla ilgili bir tanıtım yaptı ancak şimdiye kadar yalnızca bazı profesyonel kullanıcıların ve siber güvenlik profesörlerinin kullanımına test amaçlı olarak sunuldu.

READ CES 2024: Nvidia, Samsung ve daha fazlasının donanım ve yapay zeka güncellemelerini nasıl izleyeceğiz?

Microsoft araştırmacıları bir blog yazısında “Gerçek insanlara yönelik yanıltıcı veya zararlı içerik oluşturmaya yönelik her türlü davranışa karşı çıkıyoruz” dedi. Ancak teknolojinin sorumlu bir şekilde ve uygun düzenlemelere uygun şekilde kullanıldığından emin olana kadar şirketin “ürünü halka açık olarak yayınlama planının olmadığını” da eklediler.

Araştırmacılar, Microsoft'un yeni yapay zeka modelinin, konuşurken insanların yüzlerinin çeşitli videoları üzerinde eğitildiğini ve diğerlerinin yanı sıra “dudak hareketi, (dudaksız) ifade, göz bakışı ve göz kırpma dahil olmak üzere doğal yüz ve baş hareketlerini tanıyacak şekilde tasarlandığını söyledi. ” diğer şeyler”. Sonuç, VASA-1 hareketsiz bir görüntüyü kaydırdığında daha gerçekçi bir videodur.

Örneğin, video oyunları oynarken tedirgin görünen bir kişinin klibinin yer aldığı bir test videosunda, konuşan yüzün çatık kaşları ve büzülmüş dudakları vardı.

Yapay zeka aracı, konunun belirli bir yöne baktığı veya belirli bir duyguyu ifade ettiği bir video üretmek üzere de yönlendirilebiliyor.

Yakından bakıldığında, seyrek göz kırpma ve abartılı kaş hareketleri gibi videoların makine tarafından oluşturulduğunu gösteren işaretler hala görülüyor. Ancak Microsoft, modelinin diğer benzer araçlardan “önemli ölçüde daha iyi performans gösterdiğine” ve “insan konuşma davranışlarını taklit eden gerçekçi avatarlarla gerçek zamanlı etkileşimlerin önünü açtığına” inandığını söyledi.

Tolga Kurtulus

“Kahve meraklısı. İçine kapanık. Gururlu problem çözücü. Kaşif. Arkadaş canlısı müzik tutkunu. Zombi inek.”

Rap Mona Lisa'yı mı? Yeni Microsoft AI, fotoğraflardan yüzleri canlandırıyor

Apple, yaygın iPhone değişikliklerinin milyonlarca iPad’e ulaşacağını doğruladı

Helldivers 2, Valve’ın 100 saati aşan oyunculara para iadesi yapma politikasını göz ardı etmesi nedeniyle 170 ülkede PSN erişimi olmadan Steam’den çekildi

Helldivers 2, oyuncuların Steam’i bir PSN hesabına bağlaması gerektiğinin açıklanmasından bu yana 100.000 olumsuz yorum aldı

Bernard Hill: Titanik ve Yüzüklerin Efendisi oyuncusu öldü

Boeing Starliner lansmanı: Tarihi astronot uçuşunun kalkışı nasıl izlenir

Liverpool 4 Tottenham 2 – Elliott ve Salah Kırmızıları güçlendiriyor, Tottenham’a daha fazla soru

Apple, yaygın iPhone değişikliklerinin milyonlarca iPad’e ulaşacağını doğruladı

Bir yanıt yazın Yanıtı iptal et

More Stories

Apple, yaygın iPhone değişikliklerinin milyonlarca iPad’e ulaşacağını doğruladı

Helldivers 2, Valve’ın 100 saati aşan oyunculara para iadesi yapma politikasını göz ardı etmesi nedeniyle 170 ülkede PSN erişimi olmadan Steam’den çekildi

Helldivers 2, oyuncuların Steam’i bir PSN hesabına bağlaması gerektiğinin açıklanmasından bu yana 100.000 olumsuz yorum aldı

You may have missed

Bernard Hill: Titanik ve Yüzüklerin Efendisi oyuncusu öldü

Boeing Starliner lansmanı: Tarihi astronot uçuşunun kalkışı nasıl izlenir

Liverpool 4 Tottenham 2 – Elliott ve Salah Kırmızıları güçlendiriyor, Tottenham’a daha fazla soru

Apple, yaygın iPhone değişikliklerinin milyonlarca iPad’e ulaşacağını doğruladı