BİLİM VE TEKNOLOJİ

DEEPFAKE YAPAY ZEKASI NEDİR?

Last Updated on 16/06/2024 by ahmet can ayışık

blank

 

Önemli Kavramlar:

Deepfake konusuna girmeden önce konunun daha iyi anlaşılması için bilinmesi gereken birkaç önemli kavramı çok kısa olarak açıklamalıyız.

Yapay Zeka:

En basit şekilde belirli görevleri yerine getirmek için insan zekasını taklit eden ve topladıkları bilgileri yineleyerek kendilerini geliştirebilen sistemler olarak tanımlanır. Yapay zekayı çoğu teknoloji sistemlerinden ayıran en önemli özellik insan zekasını taklit edebilmesidir. Bu sistem, var olan durumları gözlemleyerek daha önceden belirlenen parametreler doğrultusunda duruma ilişkin verileri hızlı, yinelemeli ve akıllı algoritmalarla birleştirilerek işler.

Yapay Zeka, bir zamanlar müşterilerle çevrimiçi olarak iletişim kurmak veya satranç oynamak gibi insan girdisi gerektiren karmaşık görevleri gerçekleştiren uygulama yazılımlarının tamamını kapsayan bir kavram haline geldi. Kavram, genellikle makine öğrenimi (ML: Machine Learning) ve derin öğrenme gibi alt alanlarıyla birlikte kullanılır. Ancak, bunlar birbirinden farklı kavramlardır. Örneğin makine öğrenimi, tüketilen verilere göre öğrenen veya performansını iyileştiren sistemlerin oluşturulmasına odaklanır. Tüm makine öğrenimi çözümleri yapay zekadır, ancak tüm yapay zeka çözümleri makine öğrenimi anlamına gelmemektedir.

Yapay Zeka teknolojisi, daha önce insan gücünü gerekli kılan süreçleri veya görevleri otomatikleştirerek kurumsal performansı ve üretkenliği artırır. Aynı zamanda, hiçbir insanın ulaşamayacağı bir ölçekte verileri anlamlandırabilir. Bu özellik, muazzam iş avantajları sağlayabilir. Örneğin, Netflix belirli bir düzeyde kişiselleştirme sağlamak için makine öğreniminden yararlanmış ve müşteri kitlesinde % 25’ten fazla büyüme sağlamıştır.

 

Makine Öğrenimi:

Makine öğrenmesi(Machine Learning), bilgisayar programlarının algoritmalar ve eğitim verileri aracılığıyla kalıpları öğrenebildiği bir yapay zeka uygulamasıdır. Makine öğrenimi de denen makine öğrenmesi uygulamaları, doğrudan programlama olmadan tıpkı insanların yaptığı gibi deneyim yoluyla öğrenir. Algoritmaya sağlanan eğitim verilerine bağlı olarak bir makine öğrenimi yazılımı; verileri algılayabilir, tahminler yapabilir ve nasıl iyileştirilebileceğini öğrenerek görevleri otomatik olarak tamamlayabilir.

Makine öğrenimi araştırmalarının odaklandığı konu, bilgisayarlara karmaşık örüntüleri algılama ve veriye dayalı akılcı kararlar verebilme becerisi kazandırmaktır. Makine öğrenimi, bilgisayarların, açıkça programlanmadan görevleri nasıl yerine getirebileceklerini keşfetmelerini içerir. Örneğin, veri bilimcileri bir tıbbi uygulamayı milyonlarca tarama görüntüsünü ve bunlara karşılık gelen teşhisleri saklayarak röntgen görüntülerinden kanseri teşhis edecek şekilde eğitebilir.

 

Derin Öğrenme:

İnsanların bilgi edinme şeklini taklit eden, büyük miktarda veri toplama, analiz etme ve yorumlama sürecini daha hızlı ve kolay hale getiren bir makine öğrenimi türüdür.

Derin öğrenme, bilgisayarlara, verileri insan beyninden esinlenerek işlemeyi öğreten bir yapay zeka yöntemidir. Derin öğrenme modelleri, doğru öngörü ve tahminler üretmek için resimler, metinler, sesler ve diğer verilerdeki karmaşık modelleri tanıyabilir. Görüntüleri tanımlamak veya bir ses dosyasını metne dönüştürmek gibi tipik olarak insan zekası gerektiren görevleri otomatikleştirmek için derin öğrenme yöntemleri kullanılabilir.

Derin öğrenme algoritmaları, insan beyninden esinlenilerek modellenen sinir ağlarıdır. Örneğin, bir insan beyni, bilgiyi öğrenmek ve işlemek için birlikte çalışan milyonlarca birbirine bağlı nöron içerir. Benzer şekilde, derin öğrenme sinir ağları veya yapay sinir ağları, bilgisayar içinde birlikte çalışan birçok “yapay nöron” katmanından oluşur.

Yapay nöronlar, verileri işlemek için matematiksel hesaplamalar kullanan ve düğüm adı verilen yazılım modülleridir. Yapay sinir ağları da karmaşık problemleri çözmek için bu yazılım modüllerini kullanan derin öğrenme algoritmalarıdır. Derin öğrenme, makine öğreniminin bir alt kümesidir. Derin öğrenme algoritmaları, geleneksel makine öğrenimi tekniklerini daha verimli hale getirmek amacıyla ortaya çıkmıştır.

 

Sinir Ağı:

Kalıpları tanımak ve insan beynindeki nöronlara benzer şekilde çalışmak için tasarlanmış bir donanım ve yazılım sistemidir.

Sinir ağları da bilgisayarlara verileri insan beyninden esinlenerek işlemeyi öğreten bir yapay zeka yöntemidir. Sinir ağları, bilgisayarların sınırlı insan desteğiyle akıllı kararlar almasına yardımcı olur. Bunun nedeni, doğrusal olmayan ve karmaşık girdi ve çıktı verileri arasındaki ilişkileri öğrenip modelleyebilmeleridir.

 

 

Deepfake Yapay Zeka Teknolojisi ve Çekişmeli Üretken Ağlar(ÇÜA) Nedir?

Örnek: Rusya devlet başkanı Putin’in deepfake videosu

Deepfake, İngilizce “deep learning(derin öğrenme)” ve “fake (sahte)” sözcüklerinden türetilmiş bir birleşik sözcüktür. Türkçemizde karşılığı “derin sahtecilik” olarak kullanılmaktadır.

Günümüzdeki anlamı, mevcut bir görüntü veya videoda yer alan bir kişinin, yapay sinir ağları kullanarak bir başka kişinin görüntüsü ile değiştirildiği her türlü medyayı kapsamaktadır. Sıklıkla, otomatik kodlayıcılar ve Çekişmeli Üretken Ağlar(kısaca ÇÜA’lar aşağıda açıklanacak) olarak bilinen makine öğrenme tekniklerini kullanarak mevcut medyanın kaynak medya üzerinde birleştirilmesi ve üst üste yeniden kodlanması ile üretilirler.

Gerçeklik algısını derinden etkileyen deepfake teknolojisi, herhangi bir kişinin, aslında bulunmadığı video ya da fotoğraflara eklenmesiyle oluşturulur. Yani, deepfake yapay zekası, ikna edici görüntüler, ses ve video aldatmacaları oluşturmak için kullanılan bir yapay zeka türüdür. Terim hem teknolojiyi hem de ortaya çıkan sahte içeriği tanımlamak için kullanılmaktadır.

Deepfake yapay zekasının kökeni Adope Photoshop gibi fotoğraf işleme yazılımlarına kadar eskiye gider. Basitten gelişmişlerine doğru fotoğraf ve video düzenleme yazılımları ile başlayan süreç, bugün bilgi işleme teknolojisi ve yapay zekanın geldiği noktada her türlü fotoğraf, video ve ses verilerinin manipülasyonuna imkan veren bir düzeye ulaşmıştır. Bu süreç 2010’ların ortalarından başlayarak, ucuzlayan bilgi işlem gücü, artan yapay zekalaşma, makine öğrenimi teknolojisi ve karmaşıklaşan derin öğrenme algoritmaları ile bir araya geldiğinde hızla gelişmeye başladı.

2014 yılında, deepfake’in kalbindeki teknoloji olan ÇÜA (GAN: Generative Adversarial Network), Montreal Üniversitesi araştırmacısı Ian Goodfellow tarafından geliştirildi. 2017 yılında, “Deepfakes” adlı anonim bir Reddit kullanıcısı, ünlülerin deepfake videolarını ve kullanıcıların videolardaki yüzleri değiştirmelerini sağlayan bir ÇÜA aracını yayınlamaya başladı. Bunlar internette ve sosyal medyada viral oldu.

Deepfake içeriklerinin hızla popüler hale gelmesi, Facebook, Google ve Microsoft gibi dev teknoloji şirketlerinin deepfake’leri tespit etmek için araçlar geliştirmek üzere yatırım yapmalarına neden oldu. Teknoloji şirketlerinin ve hükümetlerin deepfake ile mücadele etme ve deepfake tespit zorluğunu üstlenme çabalarına rağmen, teknoloji ilerlemeye ve giderek daha ikna edici deepfake görüntüler ve videolar üretmeye devam ediyor.

“Deepfake”lerin yarattığı en büyük tehlike, güvenilir kaynaklardan geliyor gibi görünen yanlış bilgileri yayma kapasiteleridir. Örneğin, 2022’de Ukrayna Devlet Başkanı Vladimir Zelenski’nin Ukrayna ordusundan teslim olmalarını istediği bir deepfake videosu yayınlanmıştı.

Günümüzde, Deepfake’in seçimlere ve seçim propagandasına karışma potansiyeli konusunda ciddi endişeler sözkonusudur. Bunun yanında, video oyunları, ses ve eğlence alanlarındaki meşru kullanımları, çağrı yönlendirme-yanıtlama, resepsiyonist hizmetleri gibi müşteri desteği sağlayan uygulama alanlarında da sıklıkla kullanılmaktadır.

Örnek verelim. Bir İngiliz enerji şirketinin CEO’su, ana şirketinin yöneticisinin kendisinden acil bir para transferi talep ettiği Deepfake bir ses kaydı yoluyla 243.000 dolar dolandırıldı. Sahte kayıt o kadar inandırıcı yapılmıştı ki, kontrol etmeye gerek duymadı, para, merkez ofise değil üçüncü taraf bir banka hesabına havale edildi. CEO, durumdan ancak “patronu” bir başka havale daha talep edince şüphelendi. Bu kez alarm zilleri çaldı. Fakat, önceden transfer edilen parayı geri almak için artık çok geç kalınmıştı.

 

Deepfake nasıl çalışır?

Basitleştirerek yazarsak, sahte içerik oluşturmak için biri kodlayıcı, diğeri kod çözücü olmak üzere iki algoritma kullanılır. Kodlayıcı, istenen çıktıya dayalı bir öğrenilmiş bilgi seti oluşturarak ilk sahte dijital içeriği oluştururken, kod çözücü, içeriğin ilk sürümünün ne kadar gerçekçi veya sahte olduğunu analiz eder. Bu işlem istenildiği kadar tekrarlanır ve kodlayıcının gerçekçi içerik oluşturmada gelişmesine ve kod çözücünün kodlayıcının düzeltmesi için kusurları tespit etmede daha yetenekli hale gelmesine olanak tanır.

Deepfake ile bir fotoğraf oluştururken, bir ÇÜA sistemi tüm ayrıntıları ve perspektifleri yakalamak için hedefin fotoğraflarını bir dizi açıdan görüntüler. Bir deepfake ile video oluştururken, ÇÜA videoyu çeşitli açılardan izler, davranış, hareket ve konuşma kalıplarını analiz eder. Bu bilgiler, daha sonra son görüntünün veya videonun gerçekçiliğine ince ayar yapmak için kod çözücüden birkaç kez geçirilir.

ÇÜA’lar, sınıflandırma, tahmin etme ve problem çözme konularında son derece başarılı olan, makine öğrenimi alanında son dönemlerdeki en heyecan verici gelişmelerden biri olarak kabul ediliyor. Ian Goodfellow tarafından 2014 yılında geliştirildi. Son olarak Google ve Apple’da görev alan Ian, 28 yaşındayken bu teknolojiyi keşfetti ve makine öğrenimi dünyasında büyük bir yankı uyandırdı.

ÇÜA (GAN); İngilizce açılımı Generative Adversarial Network, biz kavramın karşılığını Türkçe’de “Çekişmeli Üretken Ağ” olarak kullanıyoruz. Bu nedenle, Türkçe kısaltmasını ÇÜA yaptık. ÇÜA’lar resimleri öğrenip, neredeyse gerçekle farkı olmayan yeni resimler oluşturabilir.

Gelin şimdi ÇÜA’yı biraz daha yakından tanıyalım. ÇÜA ve yeni fotoğraf üretme algoritmasının çalışma şekline baktığımızda, iki ana yapıdan oluştuğunu görüyoruz:

  • Generator (Kodlayıcı veya Üretici)
  • Discriminator (Kod çözücü veya Ayırt Edici)

Bunlar son derece yeni kavramlar olduğundan Türkçe’de kullanılan çevirilerde farklı sözcüklerle ifade edilebiliyorlar. Biz Generator ve Discriminator karşılıkları olarak “Kodlayıcı” ve “Kod çözücü” sözcüklerinin daha uygun seçimler olduğunu düşünüyoruz.

Bir ÇÜA sözkonusu olduğunda, belirttiğimiz kodlayıcı ve kod çözücüler bir yapay zeka algoritması olarak sürekli birbiri ile bağlantılı çalışırlar. ÇÜA kapsamındaki çalışma sürecinde, kodlayıcı bir fotoğraf üretir, kod çözücü ise üretilen bu fotoğrafın gerçek mi yoksa sahte mi olduğunu test eder. Sözkonusu yapay zekanın kendini eğitme sürecinde kodlama ve kod çözme sürekli bağlantılı çalışarak; kodlayıcıdaki gerçek bir fotoğrafın kodlanmışının, kod çözücüye gönderilmesi, kod çözücünün, kodlayıcının ürettiği ile kendi elindeki örneği karşılaştırıp kodlayıcıya geri bildirim göndermesi, bu geri bildirime göre kodlayıcının yeniden kendini güncellemesi şeklinde  bir döngü kapsamında, giderek kodlayıcıdaki fotoğrafa çok daha benzer fotoğraflar üretebilir.

Deepfake videoları iki yoldan biriyle oluşturulur. Birinci olarak, hedefin, kişinin hiç yapmadığı şeyleri söylemesi ve/veya yapması için orijinal bir video kaynağından alıntı/değiştirme yapılabilir. Ya da kişinin yüzü, “yüz takası” olarak da bilinen başka bir kişinin videosuna değiştirilebilir.

Aşağıda deepfake oluşturmak için bazı özel yaklaşımlara yer verdim:

  • Kaynak Video Deepfake’i: Bir kaynak videodan çalışırken, sinir ağı (Neural Network: insan beyninin yapısı ve işlevine göre modellenen bir tür makine öğrenimi algoritması) tabanlı bir deepfake otomatik kodlayıcı, yüz ifadeleri ve vücut dili gibi hedefin ilgili özelliklerini anlamak için içeriği analiz eder. Daha sonra bu özellikleri orijinal videoya uygular. Bu otomatik kodlayıcı, ilgili öznitelikleri tanımlayan bir kodlayıcı ile bu özellikleri hedef videoya empoze eden bir kod çözücü aracılığıyla bu işlemleri yapar.
  • Ses Deepfake’i: Ses deepfake’i için bir ÇÜA kişinin ses izini klonlar, vokal kalıplarına dayalı bir model oluşturur ve sesin yaratıcının istediği her şeyi söylemesini sağlamak için bu modeli kullanır. Bu teknik, video oyunu geliştiricileri tarafından yaygın olarak kullanılır.
  • Dudak Senkronizasyonu: Deepfake’lerde kullanılan bir başka yaygın tekniktir. Burada, deepfake, bir ses kaydını videoya eşleyerek videodaki kişinin kayıttaki sözcükleri söylüyormuş gibi görünmesini sağlar. Sesin kendisi bir deepfake ise video ekstra bir aldatma katmanı ekler. Bu teknik tekrarlanan ÇÜA’lar tarafından desteklenir.

putin real ve fake fotoğraf örnekleri

Deepfake Geliştirmek İçin Gereken Teknoloji

Deepfake aşağıdaki teknolojiler geliştirildikçe, giderek daha kolay oluşturulabilir, daha zor anlaşılır ve daha yaygın hale gelmektedir:

  • Evrişimli sinir ağları, görsel verilerdeki kalıpları analiz eder. Evrişimli sinir ağı(CNN veya ConvNet), doğrudan verilerden öğrenen derin öğrenme için bir ağ mimarisidir.
  • ÇÜA sinir ağı teknolojisi, yukarıda açıkladığımız gibi kodlayıcı ve kod çözücü algoritmalar kullanılarak deepfake içeriğin geliştirilmesinde kullanılır.
  • Otomatik kodlayıcılar, yüz ifadeleri ve vücut hareketleri gibi bir hedefin ilgili özelliklerini tanımlayan ve ardından bu özellikleri kaynak videoya empoze eden bir sinir ağı teknolojisidir.
  • Doğal dil işleme(Naturel Language Processing: NLP), Deepfake ses oluşturmak için kullanılır. Doğal dil işleme (NLP) yapay zekanın(AI) bir koludur ve bilgisayarların, insan dilini kavramasını, üretmesini ve idare etmesini sağlar. NLP algoritmaları, bir hedefin konuşmasının özniteliklerini analiz eder ve ardından bu öznitelikleri kullanarak özgün metin oluşturur.
  • Yüksek performanslı bilgi işlem, Deepfake, hemen daima yüksek bilgi işlem gücüne ihtiyaç duyar. Dolayısıyla, bilgi işlem güç ve kapasitesindeki hızlı büyüme deepfake alanını da hızla büyütmektedir.

 

Deepfake’in Yaygınlaşan Kullanım Alanları

Deepfake’in ana kullanım alanları şunlardır:

  • Sanat: Deepfake, bir sanatçı yapıtının mevcut kalıplarını kullanarak yeni yapıtlar üretmek için kullanılabilir.
  • Şantaj ve itibar zedeleme: Görüntü ve seslerin, insanlara yalan söylemek, cinsel ya da uyuşturucu eylemlerini açıklamak gibi yasadışı, uygunsuz veya başka bir şekilde kullanılarak hedef insanların uzlaşmacı bir duruma sokulmasıdır. Genellikle bu videolar bir kurbanı kontrol etmek, bir kişinin itibarını mahvetmek, intikam almak veya sadece siber zorbalık için kullanılabilmektedir. En yaygın şantaj veya intikam amaçlı kullanımı, intikam pornosu olarak da bilinen rıza dışı deepfake pornodur.
  • Arayan yanıt hizmetleri ve müşteri telefon desteği: Çağrı yönlendirme ve diğer resepsiyonist hizmetlerini içeren arayan isteklerine kişiselleştirilmiş yanıtlar sağlamak için deepfake kullanılabilir. Çok yaygınlaşan hesap bakiyesi kontrol veya şikayette bulunmak gibi basit hizmetler için de günümüzde yaratılmış sesler kullanılmaktadır.
  • Eğlence: Hollywood filmleri ve video oyunları, belirli sahneler için aktörlerin seslerini klonlar ve manipüle eder. Eğlence ortamları, bunu, bir sahnenin çekilmesi zor olduğunda, post prodüksiyonda bir aktör artık sesini kaydetmek için sette olmadığında veya aktöre ve yapım ekibine zaman kazandırmak için kullanır. Deepfake, izleyicinin videonun gerçek olmadığını anladığı, ancak yarattığı mizahi durumdan hoşlandığı hiciv ve parodi içeriklerinde de kullanılabilir.
  • Sahte kanıt: Bir hukuk davasında suçluluk veya masumiyeti ortaya koyan kanıt olarak kullanılabilecek sahte görüntülerin veya seslerin üretilmesinde kullanılabilir.
  • Dolandırıcılık: Deepfake, banka hesabı ve kredi kartı numaraları gibi kişisel olarak tanımlanabilir bilgileri elde etmek için bir kişiyi taklit etmek için kullanılabilir. Bu bazen büyük bir siber güvenlik tehdidi olan hassas bilgilere erişmek için kimlik bilgilerine sahip şirketlerin veya diğer çalışanların kimliğine bürünmeyi de içerebilir .
  • Yanlış bilgilendirme ve siyasi manipülasyon: Politikacıların veya güvenilir kaynakların deepfake videoları, kamuoyunu etkilemek için kullanılabilir. Buna sahte haberlerin üretilip yayılması da denir.
  • Borsa manipülasyonu: Sahte deepfake malzemeler, bir şirketin hisse senedi fiyatını etkilemek için kullanılabilir. Örneğin, bir CEO’nun şirketleri hakkında zarar verici açıklamalar yaptığı sahte bir video, hisse senedi fiyatını düşürebilir. Teknolojik bir atılım veya ürün lansmanı hakkında sahte bir video, bir şirketin satışlarını düşürebilir ya da artırabilir.
  • Mesajlaşma: ABD İç Güvenlik Bakanlığı’nın “Deepfake Kimliklerin Artan Tehdidi Raporu,” kısa mesajlaşmayı deepfake teknolojisinin gelecekteki bir kullanımı olarak göstermiştir. Tehdit aktörleri bir kullanıcının mesajlaşma stilini çoğaltmak için deepfake tekniklerini kullanabilir.

 

 

Deepfake’leri tespit etme yöntemleri

Aşağıdakiler, olası deepfake içeriğinin işaretleridir:

  • Olağandışı veya garip yüz konumlandırmaları. Sahteliği ayırt etmek için fotoğraf ya da videodaki kişilerin yüzlerinin ayrıntılı incelenmesi bir kısım sahtelik ipuçlarını ortaya koyabilir. Cildin çok pürüzsüz ya da aşırı kırışık olması, benlerin gerçekçi durmaması ve yüzdeki orantısızlıklar sahteliğin işareti olabilir. Doğal olmayan yüz veya vücut hareketleri. Deepfake teknolojisi aracılığıyla üretilen video içeriklerinde kişilerin sözleriyle jest ve mimikleri uyumlu olmayabilir.
  • Sarsak hareketler.
  • Doğal olmayan renklendirme. Ten renginde kaymalar.
  • Yakınlaştırıldığında veya büyütüldüğünde garip görünen videolar.
  • Tutarsız ses ya da konuşmaya uymayan dudak hareketleri. Garip göz kırpma hareketleri ya da gözünü kırpmayan insanlar. Gözler, sahteliği ayırt etmede en belirgin ipucu olabilir.

Metinsel deepfake’lerde de bazı önemli ipuçları sahteliği gösterebilir:

  • Yazım hataları.
  • Doğal akışında bozulma olan cümleler.
  • Şüpheli kaynak e-posta adresleri.
  • Sözde gönderenle eşleşmeyen ifadeler.
  • Herhangi bir tartışma, etkinlik veya sorunla alakalı olmayan bağlam dışı iletiler.

Bununla birlikte, gelişen yapay zekanın, her geçen gün belirtilen göstergelerin ayırt edici özellikler olarak tespit edilmesini zorlaştırdığını da söylemek gerekiyor.

 

blank