Mayıs 20, 2024

Play of Game

Türkiye'den ve dünyadan siyaset, iş dünyası, yaşam tarzı, spor ve daha pek çok konuda son haberler

Apple, cihazda çalışan açık kaynaklı yapay zeka modellerini piyasaya sürüyor

Apple, cihazda çalışan açık kaynaklı yapay zeka modellerini piyasaya sürüyor

Apple bugün, bulut sunucuları yerine cihaz üzerinde çalışacak şekilde tasarlanmış çeşitli açık kaynaklı büyük dil modellerini (LLM'ler) piyasaya sürdü. OpenELM (Açık Kaynak Verimli Dil Modelleri) adı verilen LLM programlarına şu adresten ulaşabilirsiniz: Sarılma yüzünün merkezi parçasıAI kodunu paylaşmaya yönelik bir topluluk.


Teknik incelemede gösterildiği gibi [PDF]Toplamda sekiz adet OpenELM modeli bulunmaktadır; bunların dördü CoreNet kütüphanesi kullanılarak önceden eğitilmiştir ve dördü talimat ayarlı modellerdir. Apple, doğruluğu ve verimliliği artırmayı amaçlayan bir katman ölçeklendirme stratejisi kullanıyor.

Apple, yalnızca nihai eğitim modeli yerine kod, eğitim günlükleri ve birden fazla sürüm sağladı ve projenin arkasındaki araştırmacılar bunun, doğal dil yapay zekası alanında daha hızlı ilerlemeye ve “daha güvenilir sonuçlara” yol açacağını umuyor.

OpenELM, açık gelişen bir dil modeli. OpenELM, parametreleri transformatör modelinin her katmanına verimli bir şekilde tahsis etmek için bir katman ölçeklendirme stratejisi kullanır ve bu da daha iyi doğruluk sağlar. Örneğin, yaklaşık 1 milyar parametrelik parametre bütçesiyle OpenELM, OLMo'ya göre doğrulukta %2,36'lık bir iyileşme gösterirken, ön eğitim için 2 kat daha az token gerektirir.

Yalnızca model ağırlıkları, çıkarım kodu ve özel veri kümeleri üzerinde ön eğitim sağlayan önceki uygulamalardan ayrılan sürümümüz, eğitim günlükleri, çoklu kontrol noktaları ve ön-eğitim de dahil olmak üzere halka açık veri kümeleri üzerinde dil modelinin eğitimi ve değerlendirilmesi için eksiksiz bir çerçeve içerir. puan. Eğitim konfigürasyonları.

Apple, modern dil modelleriyle “açık araştırma topluluğunu güçlendirmek ve zenginleştirmek” için OpenELM modellerini başlattığını söylüyor. Açık kaynaklı modellerin paylaşılması, araştırmacılara riskleri, verileri ve model önyargılarını araştırma yolu sağlar. Geliştiriciler ve işletmeler şablonları olduğu gibi kullanabilir veya üzerinde değişiklik yapabilir.

Bilgilerin açık paylaşımı, Apple'ın en iyi mühendisleri, bilim adamlarını ve uzmanları işe almasında önemli bir araç haline geldi; çünkü normalde Apple'ın gizlilik politikaları uyarınca yayınlanmayacak araştırma makaleleri için fırsatlar sağlıyor.

READ  Nintendo, ilk Switch-Party oyununu herhangi bir tantana olmadan duyurdu

Apple henüz bu tür yapay zeka yeteneklerini cihazlarına getirmedi ancak iOS 18'in bir dizi yeni yapay zeka özelliği içermesi bekleniyor ve söylentiler, Apple'ın gizlilik amacıyla cihazda kendi büyük dil modellerini çalıştırmayı planladığını gösteriyor.