Big Data içinde bulunduğumuz teknoloji çağında önemli bir karşılığı içeriyor. Teknoloji temelde hayatı kolay hale getirirken aynı zamanda hayat ile pek çok konuda kendiliğinden bilgi sahibi de oluyor. Bu bilgi sahipleri bakımından “big data” kavramı da önem taşıyor.
Big Data Nedir?
Big data kavramı dijital dünyada sık kullanılan kavramlardan birisi olarak öne çıkıyor. Terim temel olarak atılacak büyük adımların temelini oluşturmakta olan olguları ifade etmektedir. Farklı kaynaklardan gelmekte olan bilgilerin oluşturmuş olduğu yığından alınan, analiz edilen, sınıflandırılan ve anlamlı hale getirilmiş olan, işlenebilir şekle dönüştürülen veriler için kullanılan kavrama denk gelmektedir.
Kaynağının ne olduğu veya kaynaktan gelmiş olan verinin boyutu bu aşamada küçük bir detay olarak kalmaktadır. Big dataya dönüştürülmüş veriler halihazırda büyük görevlerde kullanıldığı için bu isimle anılmaktadır. Büyük verinin ne olduğu ismin de kolay şekilde anlaşılmaktadır. Her konuda büyük tanımına uygun olan verileri ifade etmektedir.
Söz konusu büyük veri kaynakları dijital dünyada yer alan ürünlerin tamamı olabilmektedir. Herhangi bir bilgi verilen ve internet ile etkileşim içeren tüm varlıklar da bu kapsamda büyük veri havuzunu beslemektedir. Öne çıkan big data kaynakları şu şekildedir;
- Sosyal medya hesapları
- Arama motorları
- Banka hesapları
- Bloglar, e-ticaret siteleri ile tüm web sayfaları
- Ağ günlükleri
- Web sunucu logları
- Bilgi ve belge arşivleri
- Mailler
- Sensörler
- GSM operatörleri
Big Data Özellikleri Neler?
Toplanmış olan tüm verilerin oluşturduğu big data bulmak ise zor olabilir. Ancak bu türden bir sorunun yanıtı da verinin özelliklerinde gizli kalmaktadır. Verilerin niteliğe sahip olup olmadığını anlamak adına da birkaç özellik kapsamında değerlendirme yapılmaktadır. Bu özellik grubu hacim, çeşitlilik, değer, hız ve doğruluktan oluşmaktadır.
- Hacim; toplanmış olan verilerin yalnız işe yarar kısma dönüştürülmesi gereğince verilerin büyük hacimler içermesi gerekmektedir. Aynı zamanda veri salt kendi çapında olmayıp güncel veri değerlerine göre de büyük hacim taşımalıdır.
- Çeşitlilik; analize konu olmuş veri çeşidi ne çok olursa alınan sonuçlar da o kadar verimlilik taşıyacaktır. Bu yüzden kaynaklar bilgi yapıları ve formatlar da çeşitlilik taşıyabilir. Aynı zamanda kendi kapsamlarında da dönüştürülüyor özellik gerekmektedir.
- Değer; en belirleyici özellikler arasında yer alır. Bilginin büyük veri olarak kabul edilebilmesi için işlenmesi ve dönüştürülmesi sonrasında farklı şartlarda ve ayrıca işlemlerde de değerli olabilmesi gerekmektedir. İçerisinde anlamlı hale gelecek olan bilgi olmayan yığınlar sadece yığın olarak kalacaktır.
- Hız; veri akışının büyük hızla devamlılık taşıması ve analizin de aynı hızlarda gerçekleşmesi gerekmektedir. Her geçen gün daha fazla bilgi hızlı şekilde dijital ortamlara aktarılmakta ve söz konusu büyük veri de hıza yetişmelidir.
- Doğruluk; elde edilmiş verilerin hepsi doğru olmadığı için doğruluk taraması yapılmalıdır. Gerçeği yansıtmayacak olan veriler big data içeriğinden çıkarılır.