Son günlerde bu soruyu çok kez duyar oldum. Aktif olarak yapay zeka projeleri yapan bir kaç şirketin ortağı olarak veya bu işin mutfağından yetişmiş bir mühendis olarak yapay zeka’ nın bir blon olmadığını söyleyebilirim. Peki bu soru neden soruluyor? Aslında bu soruyu soran genel iki sektör var, bir tanesi bizim gibi bilişim sektörü ve çalışanları diğeri ise finans sektörü ve genel olarak Amerikan borsa yatırımcıları.

Mühendislerin gözünden balon konusunu şöyle özetlemek istiyorum, öncelikle milyonlarca dolar GPU donanımına yatırım yapıyoruzi üstüne bir o kadar yapay zeka yazılımlarına yatırım yapıyoruz, üstüne eğitimler alıyor hem para hem zaman harcıyoruz, peki bu kadar eforun sonunda yapay zeka beklediğimiz verimliliği,üretkenliği, yaratıcılığı bize verecek mi? İşte balon sorusu buradan geliyor, yani 10 koyup 1 alacaksam bu bir blondur deniyor.

Finans tarafında ise benzer bir durum var, eğer Amerikan borsasını benim gibi yakından takip ediyorsanız (son dönemde) her gün yeni bir AI temelli yatırım haberi görebilirsiniz. OpenAI, NVIDIA ile anlaştı, yok Oracle AMD ile anlaştı, OpenAI Microsoft ile şöyle iş birliği yaptı. NVIDIA bu şirkete ortak oldu vs. Özetle aşağıdaki gibi komik bir görsel de görmüş olabilirsiniz;

Veya bunu bence daha komiği olan aşağıdaki görseli;

Yani özetle konu şu aslında, OpenAI ona buna GPU siparişi veriyor, daha doğrusu ben senden bu kadar compute gücü alacağım hazır mısın diyor, bunu duyan hisse sahipleri hurra hisseye yükleniyor vs. Sorun ne? OpenAI finansallarına bakınca örnek 10 milyar dolar kazanırken 100milyar dolar harcama sözü veriyor, doğal olarak finansal sektörlerde de acaba bu kadar AI temelli şirket hissesi bir balon mu? Bu şirketler bu değerleri eder mi? Veya bu kadar veri merkezi, çip yatırımı yapılıyor bunların parasını bakın burası çok önemli, bu yorumu yapan yatırımcı, finanscı olduğu için özetle diyor ki kardeşim benim verdiğim paranın karşılığında senin şirketin gerçekten vaat ettiği karlılığı koruyabilecek mi?

Peki gelelim benim yorumuma, zaten yazımın ilk başında bunu söylemiştim ama neden böyle düşünüyorum onu anlatmak istiyorum.

Öncelikle herkes yapay zeka’ dan çok şey bekliyor, ve bunu çok hızlı bir şekilde beklediği için bazı hayal kırıklıkları var. Hatta Türkiye de pek çok yapay zeka projesi ölü doğuyor, çünkü sadece bunu lisans almak olarak gören ancak danışmanlığa bütçe ayırmayan çok fazla firma var. Doğal olarak AI ürünlerinin nasıl kullanılacağı, nasıl onboard edileceği, kurum kültürüne bunu nasıl yansıtılacağını bilmedikleri için aldıkları lisanslar ile başarısız projeler doğuyor ve bunu göre en tepedeki patron veya yöneticiden en alttaki çaycı ya kadar; bak gördün mü yapay zeka çalışmıyor diye yorumlar yapılıyor.

Peki tüm bunları bir kenara bırakırsak aslında büyük resmi nasıl görebiliriz? Öncelikle mevcut durumu ve yakın geleceği iyi analiz etmemiz şart;

Yapay zeka son birkaç yılda muazzam bir hızla gelişiyor. ChatGPT gibi LLM (Large Language Model) tabanlı metin modelleriyle başlayan bu dönüşüm, bugün artık görüntü anlayabilen VLM (Vision-Language Models), video üzerinden hareket ve eylem çıkarabilen VLA (Video-Language-Action Models) ve son aşamada Embodied AI yani gerçek dünyada fiziksel robotların akıllandırılması aşamasına doğru ilerliyor. İşte tüm konu burada aslında, herkes LLM ile uğraştığı için yapay zekayı bu kadar sanıyor. Oysa ki henüz LLM projeleri dahi gerçek anlamda başarıya ulaşmazken arkasından gelen daha üretken yapay zeka dil modellerinin yapabilecekleri inanılmaz.

Bu nedenler bu modelleri hızlıca toparlamak istiyorum,

LLM malum hepimiz biliyoruz, neler gördük şu ana kadar?

  • Metin üretir
  • Mantıksal çıkarım yapar
  • Kod üretir
  • Diyalog kurar

Ama sadece metin işler, ya da yapay zeka için “dil” konusunu çözdü diyebiliriz, yani aynı dili konuşuyoruz.

Ancak VLM yani gören dil modelleri ise aşağıdaki çıktıları verebiliyor;

  • Görüntü tanıma
  • Görüntü + metin eşleşmesi
  • Fotoğraftaki nesneleri, bağlamı, mekânı anlama
  • Görsel soru cevaplama

Bunun bir üstünde ise VLA var, yavaş yavaş skynet’ e doğru gidiyoruz çünkü görüntü anlamak yetmez; dünya zamana göre değişiyor. Bir robotun veya bir yazılım ajanının gerçek dünyada iş yapabilmesi için hareketi, niyeti, hız değişimini ve nedenselliği anlaması gerekir.

VLA modelleri tam bunu yapmak için tasarlanmıştır.

Yetenekleri:

  • Videodaki hareketleri anlamak
  • Nesnelerin zaman içindeki dinamiklerini çözmek
  • “Şu adımı yap → sonra bunu yap” şeklinde eylem üretmek
  • Multi-modal (görüntü + hareket + metin) ortak anlayış

Gelelim Terminatör karakterine…

Son aşama, yapay zekanın beden kazanması: robotlar, dronlar, mobil cihazlar, endüstriyel kollar, AR/VR ajanları… Buna Embodied AI deniyor.

Bu alanda işler çok karmaşık:

Simülasyon + gerçek dünya RL döngüleri

Multi-node unified memory

Sensör füzyonu: kamera + LiDAR + IMU + dokunma + proprioception

En büyük hesaplama ihtiyacı: insanlık tarihinin gördüğü en büyük twknolojik kara delik diyebiliriz. Neredeyse ona vereceğiniz tüm kaynakları tüketecek bir mimariden bahsediyoruz. Ne kadar hesaplama gücü verirsen ver, tamamını tüketen ve daha fazlasını isteyen bir modelden bahsediyoruz. Neden?

Çünkü robot:

  • Görmeli
  • Duymalı
  • Hissetmeli
  • Konumunu bilmeli
  • Eylem planlamalı
  • Ortama tepki vermeli

Ve bunların hepsini milisaniyeler içinde yapmalı.

Bu yüzden Embodied AI, AGI’ye (Genel Yapay Zeka) giden yolun en kritik bileşeni olarak görülüyor.

Özetlemek gerekir ise;

LLM → Zeka metni anlıyor.
VLM → Zeka görsel dünyayı anlıyor.
VLA → Zeka hareketi, zamanlamayı ve eylemi anlıyor.
Embodied AI → Zeka gerçek dünyada fiziksel olarak var olarak iş yapabiliyor. Sonrası zaten tufan :)

Yani çoğunluğun düşündüğü gibi yapay zeka bir sohbet botu veya görüntü, video üreten bir araç değil. Gelecek 10 yıl çok heyecan verici olacak. Bu nedenle buna hazır olan şirketler, yöneticiler, bireyler bu işten en fazla faydayı sağlayacak.

Umarım keyifli bir yazı olmuştur, bir sonraki blog postumda görüşmek üzere.

Not: Bu yazı herhangi bir şekilde yatırım tavsiyesi içermemektedir.

Published On: 05 Aralık 2025 / Categories: Yapay Zeka / 5,8 min read /

Bilgiyi Paylaşın!