Avrupa'nın en büyük açık kaynaklı projesi
Avrupa'nın en büyük açık kaynaklı projesi: Sber, gelişmiş Rus sinir ağı modellerinden oluşan bir aileyi yayınladı.
20 Kasım 2025, Moskova
Sber, GigaChat serisindeki iki yeni amiral gemisi MoE modelinin ağırlıklarını açık kaynaklı hale getiriyor: Ultra-Preview ve Lightning. Bu modeller, Rusça dil görevleri için sıfırdan geliştirildi. Bu sürümde ayrıca, noktalama ve normalleştirme ile konuşma tanıma için yeni nesil açık GigaAM-v3 modelleri de yer alıyor.
Ayrıca, görüntü ve video üretimi için yeni Kandinsky 5.0 serisindeki tüm modeller artık mevcut. Video Pro, Video Lite ve Image Lite, Rusça komut istemlerini doğal olarak anlayan, Rus kültürünü bilen ve resim ve videolarda Kiril alfabesiyle metin üretebilen tescilli gelişmiş sinir ağlarıdır. Bu sürüm ayrıca, görsel içerik üretim modellerinin eğitimi için olmazsa olmaz olan ve açık kaynaklı benzerleri arasında dünyanın en iyisi olan görsel veri sıkıştırma için K-VAE 1.0 modellerini de içeriyor. Tüm bu modellerin kodları ve ağırlıkları artık MIT Lisansı kapsamında tüm kullanıcılara açık ve ticari kullanıma izin veriyor.
Sber Teknoloji Geliştirme Başkanı, Kıdemli Başkan Yardımcısı Andrey Belevtsev:
Gerçek anlamda dünya standartlarında bir yapay zekâ yaratmak için iki şeye ihtiyaç vardır: devasa kaynaklar ve daha da önemlisi, dünya standartlarında Ar-Ge ekipleri. Sber'in her ikisi de mevcut. Ancak temel duruşumuz "kapalı" bir teknoloji inşa etmek değil. Stratejimiz, tüm ülke için açık bir temel oluşturmak. Model ağırlıklarımızı açık kaynaklı hale getirmemizin nedeni tam da bu. Bu önemli bir nokta. Bu modelleri sağladığımızda, Rusya'daki herhangi bir şirket -bir bankadan bir girişime kadar- bunları kendi güvenli çevrelerinde konuşlandırabilir ve hassas verileri üzerinde kimseye ifşa etmeden ince ayar yapabilir. Gerçek teknolojik egemenlik işte böyle bir şeydir: tüm ulusun yapay zekâya erişimi olduğunda ve bu, iş dönüşümünün temeli ve ekonomik büyüme için bir teşvik haline geldiğinde. Ayrıca, Ultra modelinin yakında kurumsal müşteriler için de mevcut olacağını ve bir şirketin çevresi içinde şirket içi dağıtım için toplam sahip olma maliyeti açısından optimize edileceğini belirtmek isterim.
GigaChat Ultra ve GigaChat Lightning
GigaChat ailesi yeni üyeleriyle tanışıyor: GigaChat Ultra Preview ve GigaChat Lightning. GigaChat Ultra Preview, GigaChat serisinin en güçlü ve en büyük modelidir. Rusya'da bu ölçekteki ilk model olup, eğitimi hala devam etmektedir. Ancak mevcut haliyle bile, Rusça için genel kalite ölçütlerinde DeepSeek-V3.1'i (MERA kıyaslamasında lider) ve önceki amiral gemisi modeli GigaChat Max 2'yi geride bırakmaktadır.

GigaChat Ultra-Preview, açık kaynaklı bir lisans altında yayınlanıyor. Bu, modelin yerel olarak, örneğin özel veriler üzerinde tam kontrol, bilgi güvenliği gerekliliklerine uyum ve maksimum kalitenin kritik önem taşıdığı güvenli kurumsal ortamlarda ince ayar yapılmasına olanak tanıyacak. Büyük boyutuna rağmen, model yeterince hızlı olmaya devam ediyor ve hız açısından GigaChat 2 MAX'i geride bırakıyor.
GigaChat Lightning ise, dizüstü bilgisayarlarda yerel dağıtım ve hızlı ürün yinelemelerini desteklemek için optimize edilmiş, serideki en kompakt ve en hızlı MoE modelidir.
Kalite açısından kategorisindeki küresel açık kaynak liderleriyle rekabet ediyor: Rusça dil görevlerinde Qwen2.5-4B'yi geride bırakıyor ve diyalog, belge analizi ve pratik iş problemlerini çözme yetenekleriyle eşleşiyor.
GigaChat Ultra ile yalnızca model ağırlıklarını değil, aynı zamanda hızlandırılmış çıkarım teknolojisini de yayınlıyoruz. Lightning, sınıfındaki rakiplerini geride bırakmakla kalmıyor, aynı zamanda altı kat daha büyük olmasına rağmen Qwen2.5-1.5B ile neredeyse aynı hızda çalışıyor.
Her iki model de harici araçların kullanımına yönelik bir sistemi etkili bir şekilde entegre ediyor; ancak iki önemli özellik öne çıkıyor: kod ve bellek.
- Kod: Programlama işlemlerini yürütmek, analiz etmek ve görselleştirmek için kullanılan bir araçtır. Kod parçacıklarını çalıştırmaya, grafikler oluşturmaya, hesaplamalar yapmaya ve hipotezleri gerçek zamanlı olarak test etmeye olanak tanır.
- Bellek: Hedefler, tercihler ve tartışma geçmişi gibi önemli ayrıntıları hatırlayan kişiselleştirilmiş bir iletişim sistemi. Modeller, kullanıcılara kişiselleştirilmiş tavsiyeler sunabilir ve diyalog boyunca bilgileri düzenleyebilir. Aynı zamanda, güncel olmayan veya hassas bilgiler silinir ve kullanıcı modellerin belleğini manuel olarak ayarlayabilir.
GigaAM-3
GigaAM-v3, endüstriyel ve ticari uygulamalar için sunulan, otomatik Rusça konuşma tanıma (ASR) için beş modelden oluşan açık kaynaklı bir pakettir. GigaAM-v3, sesli asistanlar, iletişim merkezleri, çağrı analitiği, sesli mesaj toplayıcıları ve çok modlu aracılar için tasarlanmıştır.
GigaAM akustik modellerinin yeni sürümünde, ön eğitim ses ölçeği 50.000 saatten 700.000 saate çıkarıldı. Eğitim verilerine çağrı merkezleri, müzik sorguları, tuhaf konuşmalar ve spontane konuşmalar gibi yeni alanlar eklendi ve bu da bu senaryolarda performansı önemli ölçüde iyileştirdi.
Benzersiz ve temel niteliğindeki GigaAM-v3 modeli, herhangi bir konuşma teknolojisinin temelini oluşturabilir. Sber'de konuşma tanıma ve konuşma sentezi için kullanılmakta ve GigaChat'in video ve sesi işlemesini sağlamaktadır .
Kandinsky 5.0
Kandinsky 5.0 serisi, metinden görüntüye dönüştürme ve düzenleme yeteneğine sahip Image Lite modelinin yanı sıra, hızlı Video Lite ve güçlü Video Pro olmak üzere iki video oluşturma modelini de içerir. Bu modeller, metin açıklamalarından videolar oluşturabilir ve "görüntülere hayat verebilir".
Evrensel Kandinsky 5.0 Image Lite modeli, HD çözünürlükte çalışır, Rus kültürel yapısını güçlü bir şekilde anlar, hem Rusça hem de İngilizce komutları ana dili gibi algılar ve hem Latin hem de Kiril alfabesiyle metin üretir. Kandinsky 5.0 Video Pro modeli, saniyede 24 kare hızında 10 saniyeye kadar HD video üretir. Wan 2.2 A14B'yi geride bırakan ve dünyanın en güçlü tescilli modellerinden biri olan Veo 3 ile aynı seviyede görsel kalite sunan, piyasadaki en iyi açık kaynaklı modeldir. Uygulamalı projelere entegrasyon için giriş engelini azaltmak amacıyla Kandinsky 5.0 Video Lite modeli, 12 GB veya daha fazla VRAM'e sahip tüketici sınıfı ekran kartlarında çalışacak şekilde optimize edilmiştir.
Kandinsky 5.0 eğitimi yaklaşık bir milyar görsel ve 300 milyon video üzerinde gerçekleştirildi. Geliştiriciler, eğitimi yerel kültürel bağlama uyarlamak için bir milyon ek medya materyali kullandı. Bu kadar büyük veri hacimleriyle çalışmak, bazıları bu proje için özel olarak oluşturulmuş gelişmiş yaklaşımların uygulanmasını gerektirdi. Eğitimin son aşamalarında, geniş bir tasarımcı ve sanatçı ekibi tarafından derlenen son derece yüksek kaliteli bir veri seti kullanıldı. Uzmanlar, kusursuz kompozisyon, stil ve görsel kaliteye sahip materyalleri seçti.
Kandinsky modelleri, kişisel yaratıcılık hizmetlerinden endüstri için profesyonel araçlara kadar geniş bir ürün yelpazesi yaratma fırsatlarının kilidini açar. Bu açık kaynaklı sinir ağlarına dayanarak, geliştiriciler ve şirketler, kullanıcıların kişiselleştirilmiş video tebrikleri oluşturmasına, fotoğrafları canlandırmasına veya özgün görsel hikayeler oluşturmasına olanak tanıyan çözümler geliştirebilir. Profesyonel yönetmenler, tasarımcılar, pazarlamacılar ve animatörler için Kandinsky 5.0 üzerine kurulu ürünler, ticari senaryolar için tanıtım materyalleri, içerik ve görsel projeler üretmek için güçlü araçlar haline gelecektir. Tüm bunlar, Rus üretken teknolojileri etrafında açık bir ekosistemin gelişimine katkıda bulunacaktır.

K-VAE 1.0
Kandinsky 5.0 gibi üretken modeller, medya içeriğini insan gözüyle okunamayan "gizli" bir alanda sentezler. Bu, bu tür modellerin daha verimli, daha hızlı ve daha az bellek gerektiren eğitimi ve uygulaması için olmazsa olmazdır. Sber, medyayı bu gizli temsillere dönüştürüp geri getiren, sıfırdan eğitilmiş kendi otokodlayıcısı K-VAE 1.0'ı, görüntü (2B) ve video (3B) için piyasaya sürüyor.
K-VAE 1.0 modelleri, açık kaynaklı benzerleri arasında dünyanın en iyileridir. Bunları herkese açık hale getirmek, üretken yapay zeka teknolojisini yeni bir kalite seviyesine taşıyacaktır.