Artık ChatGPT’ye açık kaynaklı bir alternatif var, ancak onu çalıştırırken iyi şanslar

OpenAI’nin ChatGPT’sinin ilk açık kaynak eşdeğeri geldi, ancak onu dizüstü bilgisayarınızda çalıştırırken iyi şanslar – veya hiç.

Bu hafta, Meta’nın Make-A-Video’su da dahil olmak üzere kapalı kaynaklı AI sistemlerinin tersine mühendislikten sorumlu geliştiricisi Philip Wang, ChatGPT’ye benzer şekilde davranan bir metin oluşturma modeli olan PaLM + RLHF’yi piyasaya sürdü. Sistem birleştirir Avuç içiGoogle’dan büyük bir dil modeli ve İnsan Geri Bildirimiyle Güçlendirmeli Öğrenim – kısaca RLHF – adlı bir teknik, e-posta taslağı hazırlamak ve bilgisayar kodu önermek de dahil olmak üzere ChatGPT’nin yapabileceği hemen hemen her görevi gerçekleştirebilen bir sistem oluşturmak için.

Ancak PaLM + RLHF önceden eğitilmemiştir. Diğer bir deyişle, sistem, gerçekten çalışması için gerekli web’den alınan örnek veriler üzerinde eğitilmemiştir. PaLM + RLHF’yi indirmek, ChatGPT benzeri bir deneyimi sihirli bir şekilde yüklemez; bu, modelin öğrenebileceği gigabaytlarca metin derlemeyi ve eğitim iş yükünü kaldıracak kadar sağlam donanım bulmayı gerektirir.

ChatGPT gibi, PaLM + RLHF de temelde kelimeleri tahmin etmek için istatistiksel bir araçtır. Eğitim verilerinden muazzam sayıda örnek beslendiğinde – örneğin Reddit gönderileri, haber makaleleri ve e-kitaplar – PaLM + RLHF, çevreleyen metnin anlamsal bağlamı gibi kalıplara dayalı olarak kelimelerin oluşma olasılığını öğrenir.

ChatGPT ve PaLM + RLHF, dil modellerini kullanıcıların başarmalarını istedikleri şeyle daha iyi hizalamayı amaçlayan bir teknik olan İnsan Geri Bildirimiyle Güçlendirmeli Öğrenmede özel bir sos paylaşır. RLHF, bir dil modelinin (PaLM + RLHF durumunda, PaLM) eğitilmesini ve insan gönüllülerin modelden bekledikleriyle eşleştirilmiş istemleri içeren bir veri setinde (örneğin, “Altı yaşındaki bir çocuğa makine öğrenimini açıklayın”) ince ayarının yapılmasını içerir. (örneğin, “Makine öğrenimi bir yapay zeka biçimidir…”). Daha sonra yukarıda belirtilen istemler, birkaç yanıt oluşturan ince ayarlı modele beslenir ve gönüllüler tüm yanıtları en iyiden en kötüye doğru sıralar. Son olarak, sıralamalar, orijinal modelin yanıtlarını alan ve bunları tercih sırasına göre sıralayan, belirli bir soruya en iyi yanıtları filtreleyen bir “ödül modeli” yetiştirmek için kullanılır.

Eğitim verilerini toplamak pahalı bir süreçtir. Ve eğitimin kendisi ucuz değil. PaLM, 540 milyar parametre boyutundadır, “parametreler” eğitim verilerinden öğrenilen dil modelinin bölümlerine atıfta bulunur. 2020 ders çalışma yalnızca 1,5 milyar parametreyle metin üreten bir model geliştirmenin masraflarını 1,6 milyon dolara kadar sabitledi. 176 milyar parametreye sahip açık kaynak modeli Bloom’u eğitmek ise 384 Nvidia A100 GPU kullanılarak üç ay sürdü; tek bir A100’ün maliyeti binlerce dolar.

PaLM + RLHF boyutunda eğitimli bir model çalıştırmak da önemsiz değildir. Bloom, yaklaşık sekiz A100 GPU’lu özel bir bilgisayar gerektirir. Bulut alternatifleri pahalıdır ve ezber bozan matematiğe sahiptir bulma OpenAI’nin yaklaşık 175 milyar parametreye sahip metin üreten GPT-3’ü tek bir Amazon Web Hizmetinde çalıştırmanın maliyeti yılda yaklaşık 87.000 ABD dolarıdır.

Bir AI araştırmacısı olan Sebastian Raschka, bir LinkedIn’de dikkat çekiyor İleti PaLM + RLHF hakkında, gerekli geliştirme iş akışlarını ölçeklendirmenin de zor olabileceğini kanıtlayabilir. “Birisi size bu modeli eğitmeniz için 500 GPU sağlasa bile, yine de altyapıyla uğraşmanız ve bununla başa çıkabilecek bir yazılım çerçevesine sahip olmanız gerekir” dedi. “Elbette mümkün, ancak şu anda büyük bir çaba (elbette, bunu daha basit hale getirmek için çerçeveler geliştiriyoruz, ancak yine de önemsiz değil).”

Bu, PaLM + RLHF’nin bugün ChatGPT’nin yerini almayacağı anlamına gelir – iyi finanse edilen bir girişim (veya kişi) onu eğitme ve halka açık hale getirme zahmetine girmediği sürece.

Daha iyi bir haberimiz var, ChatGPT’yi kopyalamaya yönelik diğer birkaç çaba hızlı bir şekilde ilerliyor, bunlardan biri de adlı bir araştırma grubu tarafından yürütülen Carper AI. Açık yapay zeka araştırma kuruluşu EleutherAI ve Scale AI ve Hugging Face startup’ları ile ortaklaşa CarperAI, insan geri bildirimiyle eğitilmiş ilk çalışmaya hazır, ChatGPT benzeri yapay zeka modelini piyasaya sürmeyi planlıyor.

Kararlı Difüzyonu eğitmek için kullanılan ilk veri setini sağlayan kâr amacı gütmeyen kuruluş LAION da öncü ChatGPT’yi en yeni makine öğrenimi tekniklerini kullanarak çoğaltmak için bir proje. LAION, iddialı bir şekilde, yalnızca e-postalar ve ön yazılar yazan değil, aynı zamanda “anlamlı işler yapan, API’leri kullanan, bilgileri dinamik olarak araştıran ve çok daha fazlasını yapan” bir “geleceğin asistanı” oluşturmayı hedefliyor. Erken aşamalarda. Ama bir GitHub sayfa proje için kaynaklarla birlikte birkaç hafta önce yayına girdi.

genel-24

Popular Articles

Other Articles