Nerede arayacağınızı biliyorsanız, Apple'ın yeni bir fotoğraf düzenleyicisi var. iPhone Kings, metin talimatlarını kullanarak fotoğraf ve görselleri düzenlemenize olanak tanıyan bir araç geliştirmek için Santa Barbara'daki California Üniversitesi'ndeki araştırmacılarla birlikte çalıştı. Resmi bir sürümü yok ancak araştırmacılar, kendiniz deneyebileceğiniz bir demo düzenliyor; bu demo ilk kez fark edildi Aşırı teknoloji.
Projenin adı Multimodal Büyük Dil Modeli Kılavuzlu Görüntü Düzenleme (MGIE). Bugün piyasada çok sayıda AI fotoğraf düzenleme yazılımı var. Photoshop artık yerleşik AI araçlarıyla birlikte geliyor ve OpenAI'nin DALL-E'si gibi diğerleri, görüntüleri düzenlemenize ve bunları tüm kumaştan oluşturmanıza olanak tanıyor. Ancak bunları daha önce kullanmayı denediyseniz bunun biraz sinir bozucu olabileceğini biliyorsunuzdur. Çoğu durumda yapay zeka tam olarak ne aradığınızı anlamakta zorluk çeker.
MGIE'deki yenilik, başka bir yapay zeka yorumlama katmanı ekliyor. Yapay zekaya ne görmek istediğinizi söylediğinizde, MGIE öncelikle talimatlarınızı daha net ve açıklayıcı hale getirmek için metin tabanlı yapay zekayı kullanır. Araştırmacılar bir makalede “Deneysel sonuçlar, anlamlı talimatların talimat tabanlı görüntü düzenleme için gerekli olduğunu gösteriyor” dedi. kağıt arXiv'de yayınlandı. “MGIE önemli gelişmelere yol açabilir.”
Apple, yazılımın açık kaynaklı bir sürümünü şu adreste yayınladı: github. Eğer akıllıysanız, MGIE'nin bir kopyasını kendiniz çalıştırabilirsiniz, ancak araştırmacılar aracı şu şekilde kurdu: Yüze sarılma. Çok sayıda insan kullandığında biraz yavaş çalışıyor ama eğlenceli bir deneyim.
Apple gibi teknoloji devleri kimsenin göremeyeceği projelere milyarlarca dolar harcıyor, dolayısıyla MGIE aracı olarak adlandırılan aracın hiçbir zaman resmi olarak yayınlanmaması tamamen mümkün. Apple, yorum talebine hemen yanıt vermedi.
Gizmodo ofisinde bir tur attık. Meslektaşım ve en yakın danışmanım Kyle Barr'ın tuhaf güneş gözlükleri taktığı, Netflix'te çektiğim bir fotoğrafını yükledim… Bu yıl Tüketici Elektroniği Fuarı. Uluslararası Af Örgütü'ne şunu söyledim: “Adam çölde duruyor.” Görüntüyü oluşturmadan önce MGIE aşağıdakileri tahmin eder:
“Adam metal bir kask takıyor ve çöl ortamında duruyor. Çevresi çorak ve kıraç, kum tepeleri göz alabildiğine uzanıyor.”
Araçla olması gerekenden çok daha uzun süre oynadıktan sonra, diğer AI görüntü oluşturucularla aynı sınırlamaların çoğuna tabi olduğu açıktır. Çoğu zaman sonuçlar tuhaftır ve sipariş ettiğiniz şeye benzemez. Ancak bazı durumlarda takdire şayan bir iş çıkardı ve yazılımın savunmasında yapay zeka, tanıdık konularda daha iyi performans gösterdi. “Tanıdık”, Kyle'ın güneş gözlüğü diyebileceğiniz bir şey değil.
“Kahve meraklısı. İçine kapanık. Gururlu problem çözücü. Kaşif. Arkadaş canlısı müzik tutkunu. Zombi inek.”
More Stories
Kara Cuma’nın erken saatlerinde en iyi iPad fırsatları
Apple, Vision Pro’nun iki ülkeye daha yayılacağını duyurdu
Android telefon kullanan çocuklar yakında Google Cüzdan’ın dokun-öde hizmetini kullanabilecek