Büyük Veri 

Geleneksel yöntemlerle yönetilemeyen veya analiz edilemeyen çok büyük ya da karmaşık veri setlerine büyük veri adı verilir. Hacim (volume), hız (velocity) ve çeşitlilik (variety)  kelimelerinin baş harfleriyle oluşan 3V ifadesi büyük verinin karakteristik özelliklerini ifade etmektedir. Büyük veri, sayılan bu karakteristik özelliklerin birini ya da birkaçını aynı anda taşıyabilmektedir. Büyük veriden, istatistikler üretebilmek, makine öğrenimi algoritmalarını uygulayabilmek, gelecek tahmini yapabilmek için sahip olunan verinin güvenilir olması şarttır.

Teknolojinin gelişmesiyle birlikte cep telefonu, bilgisayar, sensörler gibi birçok elektronik aletin kullanımı yaygınlaşmıştır. İnternetin de daha yaygın ve hızlı hale gelmesiyle birlikte teknoloji,  dünya nüfusunun büyük bir kısmının hayatının ayrılmaz bir parçası haline gelmiştir. Arama motorları üzerinden yapılan aramalar, sosyal medyada paylaşılan fotoğraf ve düşünceler, e-ticaret siteleri üzerinden yapılan alışveriş sonucunda oluşan kayıtlar elektronik olarak tutulan veri hacminin oldukça büyümesine sebep olmuştur.

Gittikçe büyüyen bu verinin sahibi çoğunlukla özel sektördeki firmalardır. Bilgi güçtür ilkesinden yola çıkarak bu bilgilere sahip olan firmalar gittikçe güçlü hale gelmeye başlamıştır. Örneğin, bir arama motoru sitesi yapılan aramalara göre, grip salgınının hangi ülkelerde yaygın olduğunu ve hangi ülkede ne zaman grip salgını olacağını başarılı bir şekilde tahmin etmiştir.

Türkiye’de de büyük veri kullanımı artmaya başlamıştır, özellikle e-ticaret alanında öneri sistemleri ve bankacılık alanında dolandırıcılık tespiti gibi uygulamaları bulunmaktadır.

Büyük Verinin Resmi İstatistik Üretimindeki Önemi

Doğru analiz metotları ile yorumlandığında önemli stratejik bilgiler edinmeye imkan sağlayabilen büyük verinin kullanımı, küreselleşme ile birlikte artan rekabet ortamında daha da önemli hale gelmiştir.

Büyük verinin avantajı kullanılarak daha hızlı, daha etkili ve daha fazla sayıda istatistik üretebilir. Ayrıca ekonomik açıdan büyük verinin kullanımı istatistik üretim maliyetlerini uzun vadede kısma olanağı sunmaktadır. Bu anlamda resmi istatistiklerde büyük veri kullanımı dünyanın önde gelen istatistik ofisleri açısından çekici hale gelmeye başlamıştır. 

TÜİK’te büyük veri konusunda Ar-Ge çalışmaları 2013 yılının Kasım ayından itibaren hızlandırılmaya başlanmıştır. Büyük verinin analizine dönük olarak alt yapısal hazırlıklar ile çeşitli veriler üzerinde öğrenmeye dönük test çalışmaları yapılmaktadır.

Büyük veri’nin resmi istatistiklerde yardımcı veri olarak kullanılması, geleneksel mevcut istatistiklerin de kalitesini artırmaya yarayacaktır. Ayrıca büyük veriyi yardımcı veri olarak kullanarak anketlerdeki soru sayıları ya da anketlerin sayıları azaltılabilir, potansiyel yeni bilgiler büyük veri kaynaklarından keşfedilebilir.

Uluslararası alanda istatistik kurumlarınca büyük verinin veri üretiminde kullanılabilmesi yönünde araştırmalar devam etmektedir.