İngiliz tarihinde 150 yıllık dönemi analiz eden Büyük Veri neler buldu?

İngiliz tarihinde 150 yıllık dönemi analiz eden Büyük Veri neler buldu?

150 yıllık bir periyot için 100’den fazla farklı yerel gazeteden haberleri okuyabiliyor olsak dünya hakkında neler öğrenebilirdik? 150 yıllık dönem için İngiliz bölgesel gazetelerine erişimi olan bir sosyolog ve bir tarihçi ile birlikte Bristol Üniversitesi Yapay Zeka (YZ) araştırma ekibinin yaptığı tam olarak bunu öğrenmek.

35 milyon makalenin otomatize edilmiş analizinden elde edilen modeller, büyük olayların tespitinden, dönemler arasında öngörülemez çeşitlilikte cinsiyet önyargılarına kadar çeşitlilik göstermekte. Çalışmada, yeni teknolojilerin ve hatta yeni siyasi fikirlerin alınması gibi geçişler, geleneksel tarih araştırmalarından daha çok genomik çalışmalara benzeyen yeni bir yolla araştırıldı.

Profesör Nello Cristianini liderliğindeki akademisyen ekip, İngiliz Gazeteleri Arşivi Projesi’nin bir parçası olarak British Library’den geçmiş gazeteleri dijitalize eden “Findmypast” isimli şirketle sıkı işbirliği halinde çalışmış.

Çalışmanın odak noktası; yerel gazetelerin kolektif içeriğinde kalan öngörülemez istatistiki ayak izlerinden, büyük çaplı tarihi ve kültürel değişikliklerin tespitini yapmak. Kaç tane kadından bahsedildi? Hangi yıl elektrik hakkında buhardan daha fazla söz edilmeye başlandı? Kritik olarak, bu çalışma kelime saymanın fazlasıyla ötesine geçiyor ve kişileri, cinsiyetlerini veya lokasyonlarını harita üzerinde belirlemek için YZ metotlarını kullanıyor.

Bristol Üniversitesi’nin ThinkBIG Projesi’nin bir kısmı, yani işin dönüm noktası olan çalışma, kitaplar gibi diğer yazılı kaynaklarda bulunmayan coğrafi ve zamana dayalı bilgilerin dahil olduğu İngiltere’nin bölgesel gazetelerinden çok sayıda topladı. Özetle, 35 milyondan fazla makale ve 28,6 milyardan fazla sözcük, 1800’den 1950’ye kadar tüm Britanya’daki yayınların %14’ünü temsil eden British Library’ye ait gazete koleksiyonları çalışma için kullanıldı.

Matematik Mühendisliği Departmanı’ndan YZ Profesörü Nello Cristianini şöyle diyor: “Çalışmanın temel amacı; tarihteki devamlılığı ve değişkenliği anlamak üzere, tarihçilerin geleneksel olarak yaptığını tamamlayacak şekilde, haberlerin geniş çapta uzak okumasına dayanan bir yaklaşım göstermek. Araştırma ekibi, gazete içeriklerinde tespit edilen değişiklik ve devamlılıkların kültür, temsiliyete dair önyargıları ve gerçek dünya olaylarını yansıttığını gösterdi. Aynı veriler üzerinde daha detaylı çalışmalar yapılacak.”

Basit içerik analizleri; araştırmacıların savaşlar, salgınlar, krallıklar veya toplanmaları yüksek doğrulukla tespit etmesini sağladı. Bunun yanı sıra, daha rafine YZ tekniklerinin kullanımı; bireyler, şirketler, lokasyonlar gibi referansları tespit edilebilir hale getirerek araştırma ekibinin kelime saymanın ötesine geçmesini sağladı

Sonuçların bazıları, beklendiği gibi ve bu yaklaşım için mantıksal kontrol görevi görürken, bazı çıktılar analizin başlangıcında bu kadar aşikar değildi. Araştırmacılar bu çalışmada, değerler, inançlar ve İngiliz politikası dahilinde 19. yüzyılda Gladstone’un Disraeli’den çok daha fazla haber değeri olduğunu; 1930’lara kadar Liberaller’in, Muhafazakarlar’dan daha fazla söz edilir olduğunu ve bunu 20. yüzyılda İngiliz kimliğinin sıçramasına yol açtığını buldular.

Ekip, teknoloji ve ekonomi konularında; 1898’de kesişme noktası yaşanacak şekilde buharın istikrarlı düşüşünü ve elektriğin yükselmesini; trenlerin 1902’de atların popülerliğini devralmasını ve 1826, 1847, 1857 and 1866’daki banka krizlerine bağlı negatif piyasa hareketlerine cevaben 4 büyük panik noktasını izlediler.

Sosyal değişimler ve popüler kültür konularında Suffragette Hareketi’nin 1906’dan 1918’e sınırlı bir zaman aralığında düştüğünü; 1890’larda aktörler, şarkıcılar ve dansçıların artmaya başladığını, sonrasında belirgin şekilde yükselişi olduğunu; buna zıt şekilde politikacılardan söz edilmesinin 20. yüzyılın başları itibariyle kademeli şekilde inişe geçtiğini ve 1909’dan itibaren futbolun kriketin önüne geçtiğini gösterdiler.

Kitap içeriğindeki çalışmanın kopyası olarak, araştırmacılar haberlerdeki ünlü insanları meslekleriyle eşleştirmeye başlayıp; politikacı ve yazarların yaşarken daha sıklıkla kötü şöhrete sahip olduğunu, bilim insanı ve matematikçilerin ise daha az üne kavuşup düşüşlerinin daha yumuşak olduğunu buldular.

Daha da önemlisi, araştırmacılar, çalışma süresince erkeklerin sistematik olarak kadınlardan daha fazla temsil edildiğini; 1900’den sonra kadın temsilinde yavaşça bir artış olduğunu ancak bunu tek bir faktöre bağlamanın zor olduğunu buldular. İlginç olan, incelenen dönemdeki haberlerde görülen cinsiyet önyargılarının bugünkü durumdan çok farklı olmaması.

Çalışmanın bilgisayımsal kısmını yürüten, Bilgisayar Bilimleri Departmanı’nında Makine Öğrenme araştırma ekibinden Dr Tom Lansdall-Welfare şöyle diyor: “Bilgisayımsal yaklaşımların, geniş çaplı metinsel bütün içinde verilen bir sinyal ile tarihte doğrulanabilir anlar arasında anlamlı ilişkiler oluşturabileceğini gösterdik.  Ancak, ulaşılan bulguların kişiler için çıkarımlarının nasıl anlaşıldığı otomatize edilemez, bu kısım hep insanlığın ve sosyal bilimlerin dünyası olarak kalacak ve hiçbir zaman makinelere geçmeyecektir.”

Araştırmacılar, bu şekilde verilerle ilerleyen yaklaşımların, tarihsel bütünlüğün devamlılık ve değişimindeki trendlerin tespit edilmesi için yapılan geleneksel tarih okuma metotlarını tamamlayabileceğine inanıyor.

Kaynak: phys.org

+ Yorum bulunmuyor

Yorum yap