Ana Ryu/Visual China Group/Getty Images
19 Mart 2023'te şirketin Seattle, Washington'daki genel merkezinde bir Microsoft tabelası görülüyor.
New York
CNN
—
Mona Lisa, Microsoft'un yeni yapay zeka teknolojisi sayesinde artık gülümsemekten daha fazlasını yapabiliyor.
Geçtiğimiz hafta Microsoft araştırmacıları, bir yüzün hareketsiz görüntüsünü ve konuşan birinin ses klibini alabilen ve otomatik olarak konuşan kişinin gerçekçi görünümlü bir videosunu oluşturabilen, geliştirdikleri yeni bir yapay zeka modelinin ayrıntılarını açıkladı. Karikatürler veya sanat eserlerinin yanı sıra gerçek hayattaki yüzlerden de oluşturulabilen videolar, ikna edici dudak senkronizasyonları ve doğal yüz ve kafa hareketleriyle tamamlanıyor.
Deneysel bir videoda araştırmacılar, Mona Lisa'yı aktris Anne Hathaway'in komik bir rap şarkısını okuyacak şekilde nasıl canlandırdıklarını gösterdiler.
Yapay zeka modelinden elde edilen çıktılara denir Vasa-1, hem eğlenceli hem de gerçeklikleri açısından biraz çelişkili. Microsoft, teknolojinin eğitim için kullanılabileceğini, “iletişim güçlüğü çeken bireylerin erişilebilirliğini artırmak” veya belki de insanlar için sanal arkadaşlar yaratmak için kullanılabileceğini söyledi. Ancak aracın nasıl kötüye kullanılabileceğini ve gerçek insanları taklit etmek için kullanılabileceğini görmek de kolaydır.
Bu, Microsoft'un ötesine geçen bir endişedir: Yapay zeka tarafından oluşturulan ilgi çekici görüntüler, videolar ve ses klipleri oluşturmak için daha fazla araç ortaya çıktıkça, Uzmanlar endişeli Ve bunların kötüye kullanılması yeni yanlış bilgi biçimlerine yol açabilir. Bazıları teknolojinin filmlerden reklamcılığa kadar yaratıcı endüstrileri daha da sekteye uğratacağından endişe ediyor.
Şu anda Microsoft, VASA-1 modelini hemen kamuoyuna sunmayı planlamadığını söyledi. Bu hamle, Microsoft ortağı OpenAI'nin çevredeki kaygıları ele alma biçimine benzer Yapay zeka tarafından oluşturulan video aracıSora: OpenAI, Şubat ayında Sora'yla ilgili bir tanıtım yaptı ancak şimdiye kadar yalnızca bazı profesyonel kullanıcıların ve siber güvenlik profesörlerinin kullanımına test amaçlı olarak sunuldu.
Microsoft araştırmacıları bir blog yazısında “Gerçek insanlara yönelik yanıltıcı veya zararlı içerik oluşturmaya yönelik her türlü davranışa karşı çıkıyoruz” dedi. Ancak teknolojinin sorumlu bir şekilde ve uygun düzenlemelere uygun şekilde kullanıldığından emin olana kadar şirketin “ürünü halka açık olarak yayınlama planının olmadığını” da eklediler.
Araştırmacılar, Microsoft'un yeni yapay zeka modelinin, konuşurken insanların yüzlerinin çeşitli videoları üzerinde eğitildiğini ve diğerlerinin yanı sıra “dudak hareketi, (dudaksız) ifade, göz bakışı ve göz kırpma dahil olmak üzere doğal yüz ve baş hareketlerini tanıyacak şekilde tasarlandığını söyledi. ” diğer şeyler”. Sonuç, VASA-1 hareketsiz bir görüntüyü kaydırdığında daha gerçekçi bir videodur.
Örneğin, video oyunları oynarken tedirgin görünen bir kişinin klibinin yer aldığı bir test videosunda, konuşan yüzün çatık kaşları ve büzülmüş dudakları vardı.
Yapay zeka aracı, konunun belirli bir yöne baktığı veya belirli bir duyguyu ifade ettiği bir video üretmek üzere de yönlendirilebiliyor.
Yakından bakıldığında, seyrek göz kırpma ve abartılı kaş hareketleri gibi videoların makine tarafından oluşturulduğunu gösteren işaretler hala görülüyor. Ancak Microsoft, modelinin diğer benzer araçlardan “önemli ölçüde daha iyi performans gösterdiğine” ve “insan konuşma davranışlarını taklit eden gerçekçi avatarlarla gerçek zamanlı etkileşimlerin önünü açtığına” inandığını söyledi.
“Kahve meraklısı. İçine kapanık. Gururlu problem çözücü. Kaşif. Arkadaş canlısı müzik tutkunu. Zombi inek.”
More Stories
Kara Cuma’nın erken saatlerinde en iyi iPad fırsatları
Apple, Vision Pro’nun iki ülkeye daha yayılacağını duyurdu
Android telefon kullanan çocuklar yakında Google Cüzdan’ın dokun-öde hizmetini kullanabilecek