Kürsülerde karşı karşıya duran iki insansı robot ve aralarında jüriyi simgeleyen bir tokmak bulunan, resmi münazara sahnesi.
AI vs AI münazarasını simgeleyen bir sahne: argüman, yapı ve ikna tek bir ışık altında.

Yapay Zeka ile Münazara Deneyi: Düşünme ve İkna

2025 yılında katıldığım birkaç yapay zeka seminerinde en çok sorulan soru "Yapay zeka işimizi elimizden alacak mı?" idi. Ancak benim dikkat ettiğim konu, gelişen yapay zeka ortamında kendimi nasıl daha dayanıklı ve daha işlevsel hale getirebileceğim. Bunun için Dünya Ekonomik Forumu'nun hazırladığı Geleceğin İşleri 2025 Raporu'na bakmanın faydalı olacağını düşündüm. Bu yazıda rapordan kısaca bahsedecek ve ardından bazı bulgularından yola çıkarak bir deney fikrini paylaşacağım.

Bu yazıyı yazma sebebim, raporda bahsedilen becerilerin yapay zekâ modelleri üzerinden uygulamalı olarak öğrenilip öğrenilemeyeceğini görmek. Bunu yapmak için de aklımda başka bir amaçla kurguladığım deneyi kullanmak var.

Bu teknik bir makale ya da yapay zeka modellerinin bir kıyaslama çalışması olmayacak. Günlük iş hayatında uygulaması giderek zorlaşan düşünme, tartışma ve ikna becerilerini, yapay zekânın nasıl kullandığını görmek ve bunları nasıl uygulayabileceğimi anlamayı amaçlıyorum.

WEF Geleceğin İşleri 2025 Raporu ve Öne Çıkan Beceriler

Dünya Ekonomik Forumu (WEF) tarafından hazırlanan bu rapor 2025-2030 yılları arasındaki küresel iş gücü piyasasının dönüşümünü analiz ederek oluşabilecek fırsatları ve riskleri belirlemeyi amaçlamaktadır. Raporun içerisinde, teknolojik gelişmeler, ekonomik dalgalanmalar ve toplumsal beklentiler gibi başlıkların iş dünyasını nasıl etkileyeceği ile ilgili veriye dayalı çıkarımları yer almaktadır.

Daha basit anlatmak gerekirse bu rapor, hızla değişen ve yer yer fırtınalı bir denizde yol alan gemiler için hazırlanmış modern bir denizcilik haritası ve hava durumu tahminidir. Harita (rapor), yaklaşan fırtınaları (gerileyen işler ve ekonomik krizler) ve yeni keşfedilen adaları (büyüyen sektörler ve yeni beceriler) göstererek, kaptanların (liderlerin ve bireylerin) rotalarını güvenli ve kârlı bir geleceğe doğru kırmalarına yardımcı olur.

Rapora göre; 2025-2030 yıllarında kazanılması önerilen bazı teknik, sosyal, davranışsal ve kişisel beceriler bulunmaktadır. Var olan becerilerin %39'unun yok olacağını veya dönüşeceğini öngören rapor, aşağıdaki listede yer alan becerilerin iş dünyasında hayatta kalmak için daha geçer akçe olacağını vurgulamaktadır. Raporu okurken fark ettiğim; bu becerileri kazandım demenin imkânsız olduğu, ama günlük hayatımızda uyguladıkça daha da uzmanlaşabileceğimiz.

Teknik Beceriler

  • Yapay Zeka ve Büyük Veri
  • Ağ ve Siber Güvenlik
  • Teknoloji Okuryazarlığı
  • Çevresel Yönetim

Sosyal ve Kişisel Beceriler

  • Analitik Düşünme
  • Dayanıklılık, Esneklik ve Çeviklik
  • Yaratıcı Düşünme
  • Liderlik ve Sosyal Etki
  • Merak ve Hayat Boyu Öğrenme
  • Motivasyon ve Kişisel Farkındalık
  • Empati ve Aktif Dinleme
  • Yetenek Yönetimi, Öğretim ve Mentorluk

Raporu okurken rahatsız edici bir örüntü de fark ettim. Kendimde zaten emin olduğum becerilerin çoğu teknik beceriler olduğu... Değerlendirmekte zorlandığım beceriler ise diğer becerilerdi: baskı altında net düşünmek, fikirleri savunmak, egoya kapılmadan fikrimi değiştirmek. Bu deneyin amacı da, yapay zekânın bu becerileri nasıl kullandığını görerek kendimi geliştirmek olacak.

Münazara: Analitik Düşünme ve İkna Becerileri için Bir Araç

Raporun çıktılarıyla ilgili çok fazla yazı yazabilirim ve aklımda çok değişik yazılar da var. Ancak bu yazıda odaklanacağım konu "münazara" olacak. Lisede burun kıvırdığım, üniversitede sadece yarışmalara dinleyici olarak katıldığım münazara aslında raporda sayılan bazı başlıkları kapsıyor.

Münazara; belirli bir konu hakkında karşıt görüşlerin, tanımlı kurallar içinde savunulduğu bir tartışma biçimidir. Amaç kimin haklı olduğunu bulmak yerine konu hakkında argümanları gerekçeleriyle savunmak ve karşı argümanları akıl yürüterek çürütmeye çalışmaktır. Bir nevi bir beyin jimnastiği olarak düşünebiliriz. Düşüncenizi ya da savunduğunuz konuyu yapılandırarak karşı tarafı ve dinleyicileri ikna etmeye çalışırsınız.

Münazara yapmak, düşünce sistemi kurma, zayıf veya kör noktaları görme, analitik düşünce becerisinin yanında, ifade gücü, aktif dinleme ve kendini ifade edebilmek yeteneği kazandırır. Yani raporun öngördüğü çoğu beceriyi sadece münazara yapmayı öğrenerek kazanabiliriz.

Münazara yapabilen bir yapay zekâyla karşı karşıya olmak, beni ciddi biçimde geliştirecektir. Ancak bir başlangıç olması ve aklımda olan başka bir deneyi de test etmem için bütün gezegenler aynı hizaya gelmiş gibi hissettim ve işin içine iki yapay zekâyı karşı karşıya getiren bir deney tasarladım.

Yapay Zeka ile Münazara Deneyi: Amaç ve Yaklaşım

Yapay zeka konusunda ilerlemek için ellerimi kirlettiğim çok nokta var. Teknik imkânsızlıklardan dolayı şu anda bazıları yavaş ilerliyor, ancak imkanlarım doğrultusunda bazı deneylerimi hayata geçirmem için sadece bahane bulmam gerekiyor. Bu anlatacağım deney için bu rapor harika bir bahane oldu benim için.

Deneyin amacı, iki farklı yapay zeka modelini karşılıklı olarak konuşturmak ve tartıştırmak. Bu tartışmadan çıkanları birkaç insan ile paylaşarak puanlama yapmalarını ve çıktıları insan kontrolünden geçirerek kaliteli bir eğitim verisi elde etmek. Bu tartışma veya diyalog ortamının oluşmasını sağlayacak en iyi yöntemin bir münazara yarışması olacağını düşündüm.

Bu arada belki bu çalışmayı yapan birileri veya bir ekip vardır. Ben araştırdığımda görmedim ama ilk ben yaptım demekten özellikle kaçınıyorum. Eğer sizler biliyorsanız lütfen benimle de paylaşın ben de öğrenmiş ve onların çıktılarına da bakıyor olayım.

Münazara Deneyinin Kuralları ve Yapısı

Deneyin kurallarını ve yapısını belirlemek isterken, insanların hangi konular üzerinde daha çok konuştuklarını ve hangi kurallarla konuştuklarını incelemeye başladım. Okuduklarım ve izlediğim yarışma videoları münazaranın çok basit kuralları olmasına rağmen arka planda inanılmaz bir stratejik çalışmanın olduğunu görmemi sağladı. Hatta bazı kalıp tekniklerin de olduğunu gözlemledim.

Araştırmalarım sonucunda - deneyi de doğrulamak için - bir ana başlık üzerinde dört turlu bir münazara akışında karar kıldım.

İlk turda ekipler, karşılıklı olarak sadece kendi argümanlarını ve savundukları konuyu ve bu konuyu destekleyen argümanları anlatıyor olacaklar. Hiçbir şekilde karşı tarafa cevap vermeyecekler. İkinci turda, taraflar karşı tarafın ne dediğine odaklanarak neden katılmadıklarını anlatacaklar. Burada karşı tarafın argümanlarını çürütmek için çalışıyor olacaklar. Üçüncü tur da, ikinci tur gibi yine cevap verme şeklinde olacak. Sadece bu turda taraflar karşı tarafın varsayımlarının neden hatalı olduğu üzerine konuşacaklar. Son tur da ise, tarafların fikirlerini toparlamalarını, gelen karşı argümanlara göre neden hâlâ kendi fikrini savunduğunu veya karşı fikre neden katıldıklarını söylemelerini istiyorum.

Akış insanlar arasında yapılan münazara yarışmalarına çok benzer olsa da yapay zeka modellerine süre sınırı veremeyeceğim için kelime ve argüman sınırı vermeyi tercih ettim. Her turda modeller en fazla 500 kelime ve 3 argüman ile savunma yapıyor olacaklar. Cevap verme turlarında yine benzer limitler olacak.

Bu sınırlar, modellerin "uzun ama boş" cevaplar üretmesini engellemek için konuldu. Amaç, cevapların daha değerli ve yoğun olmasını sağlamaktı. Aksi taktirde, televizyon programlarında yer alan konuşan kafalardan çok bir farkı kalmayacağını düşündüm.

İlk deney için seçtiğim konu, pandemi zamanında hepimizin yaşadığı ve sonrasında da şu anda yaşanan çoğu toplu işten çıkartmanın bahanesi olan; uzaktan çalışmak, ofisten çalışmaktan daha verimlidir. şeklinde. Bu konu üzerine bir sürü makale yazıldı ve araştırmalar yapıldı ama bakalım yapay zeka modelleri bu bilgileri kullanarak neler çıkartacak karşıma.

Münazara Çıktıları Nasıl Değerlendirildi?

Kuralları ve konuyu da belirlendikten sonra en önemli konu tarafsız bir şekilde çıktıların değerlendirilmesi olacaktı. Bu kısım için;

  • Kavramsal Açıklık
  • Mantıksal Tutarlılık
  • Argümanların Gücü
  • Karşıt Argümanların Kalitesi
  • Pratik Gerçekçilik
  • Toparlama ve Çıkarım yapma

becerileri üzerinden bir puanlama yapılabileceğini düşündüm. Belirlediğim altı kategoride ayrı ayrı verilen puanların toplamına göre bir kazanan olacak.

Bu altı başlığı seçmemin sebebi, hem düşünce kalitesini hem de pratik uygulanabilirliği birlikte ölçebilmek.

Deneyin Yapılışı: Model Seçimi ve Süreç

Deneyi yaparken iki güçlü yapay zeka modeli seçtim ve bunların arasında bir dengesizlik olamaması için iki modeli de Open Router üzerinden para harcayarak kullandım. Modellerin seçimini yaparken sitenin bana sağladığı kullanım trendi grafiklerini kullanmayı tercih ettim.

  • Teknoloji
  • Bilim
  • Sağlık
  • Akademi
  • Yasal
  • Önemsiz Bilgiler
  • Rol Yapma

kategorilerinde 15 Aralık 2025 - 6 Ocak 2026 arasındaki listelerde en çok token kullanılan modelleri seçtim ve sonra bu modellerden en yukarıda olan iki tanesini seçtim. Tablodan da görüleceği üzere Mimo V2 Flash ve Gemini 2.5 Flash modellerini seçmem gerekiyordu. Ancak Mimo 2 Flash modeli için istek atarken hata aldığım için DeepSeek V3.2 ile yoluma devam ediyor olacağım.

TechnologyScienceHealthAcademiaTriviaLegalRoleplayTotal
Mimo V2 Flash3908120335
Gemini 2.5 Flash248803227
DeepSeek V3.20002001214
Devstral 2 2512 (free)003307013
gpt-oss-120b040008012
Gemini 3 Flash Preview054001010
Claude Sonnet 4.572000009
Claude Haiku 4.520600008
GPT-5.220031006
Claude Opus 4.550000005
DeepSeek R1 T2 Chimera00000055
Gemini 2.5 Flash Lite10000304
GPT-4o-mini00003003
Grok 4.1 Fast00003003
Llama 3.1 70B Instruct00003003
MiniMax M220000002
Gemini 2.0 Flash00002002
Qwen3 235B A22B Instruct 250700000202
DeepSeek V3 032400000022
Claude Sonnet 400100001
gpt-oss-20b00100001
GPT-4.1 Nano00100001

İlk tur için seçtiğim modellerden; Gemini 2.5 Flash modeline A, DeepSeek V3.2 modeline de B diyeceğim. A modeli yarışmada öneriyi savunan model olacak. Yani, uzaktan çalışmanın daha verimli olduğunu savunacak. B modeliyse ofiste çalışmanın daha verimli olduğunu savunacak.

Deneyi yaparken DeepSeek V3.2 bir ufak dağılma yaşasa da beklenen çıktıya oldukça yakın sonuçlar üretti.

Münazara Deneyinden Çıkan Sonuçlar ve Öğrenilenler

Öncelikle bu deneyin sonucunda 0.010573 USD ya da 0.46 TRY gibi bir para harcadım yapay zekâ modellerine. Oldukça düşük bir maliyetle, aklımdaki deneyi hayata geçirdim. Bunları sadece insan olarak değerlendirmem yeterli.

Ama benim zamanım olmadığı için (bu yazıyı yetiştirmek için biraz acele ettim) değerlendirmeyi de GPT-5.2 modelinin yapmasını istedim. Herkesin yapay zeka olduğu bir yarışmada kazanan B modeli yani DeepSeek V3.2 oldu.

Peki ben bu deneyle ne kazanmış oldum? Aslında münazara yöntemlerini pratik etmiş oldum. Üstüne üstelik bir şablon projeye sahip olmuş oldum ki bu sayede bir sürü başka deneme de yapabiliyor olacağım. Aslında deneyi kurgularken ki hedeflerime ulaştım.

Ama bu yazıyı yazmak için bana ışık olan WEF raporunda yer alan becerilerden sadece bir tane teknik yetkinlik için bir adım atmış oldum. Aslında başarısız gibi görünüyorum değil mi?

Ben şöyle düşünüyorum. Başarısız olmadım, çünkü elimde test ettiğim üç farklı rol var. Bu rollerin oluşturduğu örnekler var ve bunlar olabildiğince canlı örnek. Yani bana inceleyebileceğim örnekler ve bir şekilde taklit edebileceğim veriler vermiş oldu bu deney. Aslında, yapay zekâyı bir antrenman partneri olarak kullanmaya başlamış oldum.

Bu sadece ilk denemeydi. Aynı formatı farklı konular, farklı modeller ve insan katılımıyla tekrar etmeyi planlıyorum. Çıktılar değiştikçe, sorular da değişecek. Belki siz de bana konu başlığı önererek deneyin gelişmesine destek verebilirsiniz.

Sonuç olarak mesele, yapay zekânın bizi geçip geçmeyeceği değil; onunla birlikte hangi kaslarımızı güçlendirmeyi seçeceğimiz ve geçmişte yapamadığımız "keşke" listesinden neleri kaldıracağımıza karar vermek.

Kaynaklar ve Ek Okumalar