Gemini modellerinin yeni yetenekleri, Astra’nın ses ve görseli birleştiren canlı zekası, Veo 3’ün sinematik üretim gücü, Imagen 4’ün görsel kalitesi… Hepsi etkileyici, hepsi çığır açıcı. Ama benim için bu etkinliğin asıl kıymeti, teknolojiyle insanın nihayet aynı frekansta buluşma çabasında saklı.
Artık şunu net bir şekilde söyleyebiliriz: Yapay zeka dönemi, bir “demo çağından” çıkıp, ürünleşmiş bir ekosisteme evrildi. Bu yıl tanıtılan tüm araçlar kullanıcı davranışını merkeze alan, üretkenliği temsil tabanlı sistemlerle birleştiren ürünler haline gelmiş durumda. Üstelik bu değişim, yalnızca bireysel deneyim seviyesinde değil; markaların, içerik üreticilerinin ve geliştiricilerin de doğrudan iş yapış biçimini dönüştürecek ölçekte.
Aşağıda, bu yıl tanıtılan tüm temel başlıkları teknik özellikleri ile birlikte bulacaksınız.
Gemini 2.5: Temsilci Tabanlı Yeni Model

Gemini 2.5 Pro, artık sadece dil modeli değil, görsel ve işitsel girdileri anlayan, plan yapabilen ve bağlamsal kararlar verebilen bir model olarak konumlanıyor.
- Gemini Live: Kamera ve ekran paylaşımı ile bağlamsal destek sağlıyor (Android/iOS’ta ücretsiz)
- Gemini 2.5 Flash: Yeni varsayılan model, son derece hızlı ve kaliteli yanıtlar veriyor
- Gemini AI Pro ve AI Ultra: Yeni abonelik modelleri ile özel özellikler, yüksek limitler ve erken erişim sunuyor
Project Astra: Gerçek Dünya Algısı ve Hafıza
DeepMind’ın Project Astra‘sı sesi, görüntü yüzeyi ve bağlamı anlık analiz eden bir yapay zeka prototipi.
- Hafıza, ses üretimi, ekran kontrolü gibi özelliklerle zenginleşti
- Gemini Live’a entegre edildi
- Donanım (gözlük vb.) destekleri yolda
Project Mariner: Çoklu Görevler için Temsilciler
Tarayıcı tabanlı çalışan Mariner sistemi, aynı anda 10 farklı görevi yerine getirebilen yapay zeka ajanlarıyla çalışıyor. Project Mariner artık aynı anda on farklı göreve kadar tamamlayabilen bir temsilci sistemi içeriyor. Bu temsilciler, aynı anda bilgi aramanıza, rezervasyon, alışveriş ve araştırma yapmanıza ve daha fazlasına yardımcı olabiliyor.

- Bilgi arama, rezervasyon, alışveriş gibi görevlerde destek sağlıyor
- ABD’de AI Ultra kullanıcılarına açık
- Gemini API ile entegre çalışıyor
Flow: Yeni Nesil Sinematik AI Stüdyosu
Flow, Google’ın yapay zeka destekli sinematik video üretim aracı. Veo, Imagen ve Gemini modellerini entegre ederek, senaryo yazımından sahne düzenlemeye kadar tüm süreci doğal dil üzerinden yönetebileceğin yaratıcı bir stüdyo sunuyor. Karakter, mekan, obje ve kamera hareketlerini tek bir arayüzde tanımlayıp değiştirebiliyorsun. Örneğin “gece sokakta yürüyen biri, uzaktan yaklaşan far ışığı” dediğinde sistem bunu sahneye dönüştürebiliyor. Kamera hareketleri (pan, zoom, slow motion), sahne içi düzenlemeler (ışık, obje ekleme/çıkarma) yapılabiliyor. Imagen 4 ile görsellik, Veo 3 ile hareket ve ses, Gemini ile bağlamsal tutarlılık birleşiyor. Flow’un güzelliği burada: karmaşık prodüksiyon süreçleri yerine, hayal ettiğini yazıyorsun; gerisini sistem senin için çözüyor. Şimdilik AI Pro ve Ultra kullanıcılarına açık ama yakın gelecekte kesinlikle içerik üreticilerinin yeni oyun alanı olmaya aday.
- Kamera hareketleri, nesne ekleme/çıkarma, sahne boyutu ayarı gibi özellikler
- Senaryo yazımı ve sahne yönetimi bir arada
- AI Pro ve Ultra kullanıcılarına açık
Veo 3: Metinden Sesli Video Üretimi
Veo3 yeni video üretim modeli, sesli çıktılarla birlikte sinematik sahneler yaratabiliyor. Bunlar arasında, arka planındaki trafik sesleri, parkta şarkı söyleyen kuşlar, hatta karakterler arasındaki diyaloglar gibi sesler bulunuyor. Veo 3, metin ve görüntü istemlerinden gerçekçi fizik kurallarına ve doğru dudak senkronizasyonuna kadar her alanda öne çıkıyor. Anlama konusunda da oldukça güçlü: İstem oluştururken kısa bir hikaye anlatarak modelin, size bunu hayata geçiren bir klip olarak geri vermesini sağlayabilirsiniz. Birkaç örneğe bakalım:
- Arka plan sesleri, doğal diyaloglar, ses senkronizasyonu
- Gerçekçi fiziksel çevre etkileşimi
- Referans destekli sahne oluşturma
Imagen 4: Görsel Kalite + Tipografi Gücü
Yeni görsel model, kumaş, doku ve ışık gibi detaylarda üst düzey hassasiyet sunuyor. Imagen 4, Gemini uygulamasında, Whisk’te, Vertex AI platformunda ve Workspace içindeki Slides, Vids, Docs gibi ürünlerde kullanılabilir durumda.


- 2K görüntü çıktısı
- Tipografi doğruluğu geliştirildi
- Workspace entegrasyonu tamamlandı
Lyria 2 ve Music AI Sandbox
Lyria 2 gerçek zamanlı müzik üretimini mümkün kılan bir model. Üstelik bu model, profesyonel müzisyenlerden amatör içerik üreticilere kadar herkesin kendi tarzında üretim yapmasına olanak tanıyor; ritim, armoni ve ses efektleri üzerinde detaylı kontrol sağlıyor.

- YouTube Shorts entegrasyonu ve AI Studio API erişimi
- MusicFX DJ gibi projelerle interaktif performanslar mümkün
- Müzisyenler için yaratıcı sandbox ortamı
Canvas: Gemini İçindeki Yaratıcı Stüdyosu
45 dilde test, infografik, podcast ve uygulama prototipi oluşturabilen sezgisel alan.
- Kullanıcı dostu arayüz
- Geniş yaratıcılık yelpazesi

Deep Research: Derinlemesine Analiz Alanı
Kendi PDF, görsel ve belgelerinle özelleştirilmiş raporlar oluşturabiliyorsun.
- Yakında Google Drive ve Gmail entegrasyonu geliyor
- Pazar araştırması, akademik çalışmalar gibi alanlarda özelleştirme
Aramada Yapay Zeka: AI Mode
- Yapay Zeka Bakışı’nın gelişmiş hali olan AI Mode, sorguları çoklu alt başlıklara bölerek analiz ediyor.
- ABD’de genel kullanıma açıldı
Android XR: Gözlükler, Ortamlar ve Donanımda Yeni Bir Dönem
Google, Android XR ile donanım vizyonunu da sahneye taşıdı.

- Xreal Project Aura: Optik see-through AR gözlüğü, geniş görüş alanı ve Gemini entegrasyonuyla çalışıyor.
- Warby Parker & Gentle Monster iş birlikleri: Android XR destekli, şık ve akıllı gözlük tasarımları.
- 150 milyon dolarlık yatırım, bu donanımların ticarileşmesini destekliyor.
Stitch: Video İçeriğin Ortak Zekası
Stitch, video düzenleme süreçlerini birlikte çalışılabilir hale getiriyor.
- Eş zamanlı video düzenleme
- Gemini destekli sahne ve kurgu önerileri
- YouTube Shorts entegrasyonu
- Takım içi çalışma ve senaryo üretimi bir arada
Google, bu yıl yapay zekanın yöneldiği büyük resmi netleştirdi. Gemini artık yalnızca bir model değil, çok katmanlı gerçeklikleri anlayan, senaryo kurgulayan ve karar alabilen bir sistem olarak konumlanıyor.
“Gemini’ı, gerçek dünyayı simüle ederek planlar yapan ve yeni deneyimler tasarlayan bir dünya modeli haline getirmek için geliştiriyoruz.”
Demis Hassabis, CEO & Kurucu Ortak, Google DeepMind
Bu vizyon, Astra’nın bağlam algısından Mariner’in görev yürütme becerilerine, Flow’un sahne kurgusundan Gemini Live’ın gerçek zamanlı etkileşim yeteneklerine kadar tüm ekosisteme yayılmış durumda. Soru şu: Bu kadar zeki ve temsilci bir sistemde bizim zekamıza ve temsil gücümüze hala ihtiyaç olacak mı? Ben bu yazıyı yazarken hem heyecan duyuyorum hem de kendi mesleki kimliğimi yeniden sorguluyorum. Çünkü Google I/O 2025 özelliklerine artık sadece “nasıl kullanırım?” diye değil, “benim özgün katkım ne olacak?” diye sormaya başladım. Belki de cevabı, hep birlikte, biraz insan, biraz makine olarak arayacağız.
Görsel: Google