AI /eyay/ (veya Yapay Zeka veya YZ) sanat üretimi araçları dediğimizde, profesyonel kullanım için şimdilik bu dördü göze çarpıyor: Midjourney, Adobe Firefly, Çeşitli “Dot AI” Firmaları ve Stable Diffusion. Basitçe çizdim, ama bir de üstüne açıklayalım.
Midjourney

Vikipedi tabiriyle “metinsel açıklamalardan görüntüler oluşturan yapay zeka programı” yani görsel üreten bir YZ motoru. Bir motor yapmak gerçekten mühendislik; ama bunu kullanmak mühendislik değil ancak operatörlük olabilir. Bunu operate etmek için gereken arayüze Discord ile ulaşıyorsunuz. Kullanıcı olarak “prompt” yani metin giriyorsunuz (buna txt2img deniyor), montajlaması için ek olarak resim de girebiliyorsunuz (buna da img2img deniyor), yoğun kullanımda ise para veriyorsunuz.
Adobe Firefly

Adobe boş durmadı ve kendi AI modelini üretti. Nispeten ucuz, çünkü firmaya ait Creative Cloud (CC) paketine dahil. Arayüzüne Photoshop ile ulaşıldığı için Firefly biraz daha kullanışlı olabilir. Adobe için Buluttaki bir model onların işlerine gelir; çünkü AI araçları vazgeçilmez olursa, korsan kullanımın önüne bu şekilde geçebilirler.
Çeşitli “Dot AI” Firmaları

Tüm bunlarla uğraşmak yerine bu işi sizin için seve seve yapacak çeşitli firmalar da var. Kendi modelinizi onların web arayüzü ile eğitiyorsunuz. Tek riski kıymetli datalarınızı işlesin diye başkalarının ellerine vermeniz. İşlenmiş dosyalara model deniyor, hacmi de ortalama 8GB falan. Yani devasa boyutta sistemler gerektirmiyor.
Stable Diffusion

Kendi bilgisayarımda kendi modelimi eğiteceğim derseniz, açık kaynak kodlu Stable Diffusion en uygun seçim. Ayrıca bir plugin ile Photoshop’a bağlanabiliyor, aşağıdaki videoda bunu denemiştim.
En büyük farkı buluttaki bir model yerine, kendi modelinizi sansürsüz olarak kullanabilmeniz. Evet sansür, sanatçının o sevmediği şey.
Karşılaştırma Tablosu

Fiyat: Uzun erimli yoğun kullanım açısından SD üstün görünüyor. Ama sağlam ekran kartı istiyor, yalan yok.
Sansür: Sadece sandık, koltuk, ağaç, kılıç, kalkan, herkese benzeyen anime karakterli bir hikaye olacaksa paralı uygulamalar en doğru tercih. Üstelik detaylı karakter çizimininde “onu çizemem, bunu çizemem” diye bir sürü uyarı da bu ücretli paketlere dahil.
Kontrol: Sadece metin girerek bir şeyler çizdirmek hayatında hiç resim yapmamış insanlar için haz verici bir deneyim olabilir; ama anatomiye uygun küçük değişimler için bile tonlarca deneme yani prompt girmek gerekiyor. Yani bu kadar deneme yerine bir iki kalem darbesi ile çözülecek şeyler için komutlarla çok cebelleşmek lazım.
Burada asıl soruna geliyoruz. İnsanlar ne istiyor ve bunu doğru ifade edebiliyor mu?
Bu bağlamda, ne istediğini bilen bir sanatçı için görsellere en detaylı müdahale yine SD’de oluyor. Elleri düzgün çizebilmek bile mümkün, bunun için de iskeleti pozlayan bir poz eklentisi kullanılıyor.
Görsel Gizliliği: Çok şükür tüm uygulamalar bu hizmeti sağlıyor; ama bu bir illüzyondan ibaret. Çünkü bunları üreten YZ modelleri, yani bu dataları saklayan dosyalar, asıl kıymetli şeyler. (ChatGPT’de bile açılışta kişisel bilgilerinizin paylaşılmaması uyarısı verir. Eğer onunla tüm mahreminizi konuşursanız şifreniz tahmin etmek oldukça kolaylaşır.) Local bilgisayarınızda Stable Diffusion kullanırsanız göreceksiniz ki bunları üreten model dosyaları ekran kartı RAM’inde 2GB ile 24 GB arasında yer kaplayan dosyalar. Buradan da konu model gizliliğine geliyor.
Model Gizliliği: Dataların ne kadar kıymetli olduğunu anlatmaya gerek yok. Veri madenciliği boşuna denmiyor. YZ için her türlü özgün insani veri çok önemli. Kapalı kaynak kodlu firmaların hepsi, datalarınızı kendi modellerini sürekli eğitmek için kullanıyor. Bunlar devasa bir aşure tenceresi gibi, evet çok besleyici ama tadı her tabakta aynı. Özgün bir stil içeren data, gelecek dünyasında çok daha kıymetli olacak. Bu sebeple artık sanatçılar portfolyolarını açıktan sergilemeye çekiniyorlar. Eserleri, istekleri dışında bu modellere dahil edilebilir. Eğer bu ispatlanırsa da bu büyük firmaların başı derde girebilir. Bu açıdan da YZ devrimi, müzik endüstrisindeki dev firmaların ayağını kaydıran mp3 devrimine de benziyor. Fakat matbaa şimdilik en yakın analoji.
İnternet ilk çıktığında sınırsız bilgi paylaşımı ve düşünce özgürlüğü için harika bir mecra olarak düşünmüştük. Şimdi geldiğimiz noktada yalan bilimin ve cahilliğin daha da cesaretlendiği, kendimizi kollamamız gereken karanlık bir çukura dönüştü. Bu açıdan doğru bilgi şu anda internetin en kıymetli cevheri. YZ’ler için de aynısı geçerli. YZ’nin yamuk elleri ve anatomisiyle eğitilen YZ modelleri kendi datasına zarar veriyor. Bu yüzden YZ’nin en büyük gıdası insan sanatçılar, bu kadar ucuza verilerimizi kaptırmamamız gerekiyor. Çünkü geleceğin dünyasında para edecek elimizde kalan tek değer bu özgünlüğümüz olacak.
Peki Çözüm Önerin Nedir?

İşte huzurlarınızda insan sanatçı. Sizin için teknolojiyi takip edecek AI’ları operate edip, aldığı klasik sanat eğitimi ile harmanlayıp çok daha verimli üretimler sağlayacak, sizi geleceğe güvenle taşıyacak kişi. Şimdi herkes Ferrari’ye bindi bu dönem bittikten sonra usta şoförler bu güzel arabalara binerse o zaman çıkacak işlerden çok daha keyif alınacağını düşünüyorum. Benim tezim budur.
Tabi bana soran oldu mu?
Hayır.
Bir yanıt yazın