Büyük Verinin Tarihinden Kesitler

Verilerin içerdikleri büyük iş değerinden yararlanmayı sağlayacak ticari ürünlerin çıkartılması 1990 yılına gider. O yıl Oracle ve Teradata firmaları ülkemize de yansıyan Veri Ambarı furyası başlattılar. Oracle sadece yazılımı seti, Teradata da donanım ve yazılımı ile pazara girmişlerdi. İki firmanın veri tabanı da ilişkiseldi. Veri tabanı nesnel tek firma olan Fujitsu ambar kavramının uzağındaydı. 

Internet ile birlikte Yahoo ve AOL firmalarının web sitelerini biriktirmesi depolama ve hesaplama kapasitelerinde tıkanmalar yarattı. Buna karşı ilk çözüm bilgisayarları birleştirmek oldu. Ancak donamım güvenilirliği (reliability) %100 olmadığından çökmelere karşı çare bulunması gerekti. Çareyi 2004 yılında Google MapReduce algoritmasıyla buldu. Binlerce bilgisayarın tek bir bilgisayarmış gibi çalışmasını sağlayan algoritmasıyla Google depolama ve hesaplama gereksinimine süper bilgisayarsız çözüm geliştirdi. Diğer firmaların topladıkları veriler hiç işe yaramadan eskidi. Taa ki Hadoop çıkıncaya kadar…

2007 yılında açık ve dağıtık dosya sistemi olarak doğan Hadoop MapReduce algoritması ile aynı işi yaparak Google’ın tekelliğini yıktı. 

Bu arada NOSQL yaratıldı, verileri ilişkisel veri tabı yerine büyük tabloda tutan NOSQL  düzensiz verileri işleme olanağı sundu. Bunu NOSQL’i yaratarak gerçekleştirdi. SQL ile arattırılamayan, paternleri bulunamayan formatsız verilerin içerdiği değer NOSQL ile ortaya konabildi. Örneğin Visa Hadoop – NOSQL ikilisi ile tarihin en büyük dolandırıcılığını keşfetti. Bugün Facebook, Twitter, LinkedIn, Amazon varsa bu ikili sayesinde varlar.

Şimdilik Endüstri dünyası Veri Ambarı ve Analitikleri kavramaya çalışıyor. Ancak yakın gelecek Hadoop’la yaşanacak. Hazırlanmak zorunlu!

YORUM EKLE
Dergiler
Partnerler