
Bilgi (Büyük Veri) Güç Müdür?
Kalem
kılıçtan keskindir demiş atalarımız. Bilginin şiddetten daha etkili bir çözüm
olduğu dile getirilmiştir. Özellikle son yıllarda internetin hayatımıza girmesi
ile bilgilerin oluşturulmasında ve paylaşımında ciddi artışlar oldu.
Makalemizde bilgilerin nasıl oluştuğuna, kimler için toplanıldığına, hayatımıza
olumlu ve olumsuz etkilerine ve en önemlisi bu bilgilerin değerine değineceğiz.
Bilginin yani bizim konumuz olan Büyük Verinin (Big Data) güç olup olmadığına hep birlikte bakalım.
Veri (Data) Nedir?
Veri en kısa tabirle
bilginin hammaddesidir.
Veri genel
bir terim olup araştırmalardan, gözlemlerden, sosyal medya, internet gibi
ortamlarda; ölçüm, deney, gözlem, sayım ya da araştırma yolu ile elde edilen
ham bilgilerdir.
Kısaca internette
yaptığımız her hareketimiz veridir.
Büyük
Veri (Big Data) Nedir?
Büyük
veri, sosyal medya paylaşımları, fotoğraflar, belgeler gibi
farklı kaynaklardan elde edilen verilerin analiz edilip sınıflandırılıp, anlamlı
ve işlenebilir hale dönüştürülmüş biçimi olarak tanımlanabilir.
Kısaca dünyada bulunan tüm
verilerin dijital ortamında toplanmasıdır.
Toplanan veriler dünya genelinde 40 bin exabyte civarı veri üretildiği bilinmektedir. Somutlaştırmak gerekirse her veriden bir basamak yapmak gerekirse buradan marsa yol olacak bir merdiven oluşturulur.
Büyük
Veri Nasıl Oluşturulur?
Verinin büyük olup
olmadığını anlamanın yani büyük veri olması için taşıması gereken hususlar
vardır.
Bunlar; Hacim(volume), Hız(velocity),
Çeşitlilik(variety), Doğrulama(Verification) ve Değer(Value)dir. Kısaca
tanımlayalım.
Hız, Büyük
veri üretiminde her geçen gün hızına hız katmakta ve bu veriler saniyede
inanılmaz boyutlara ulaşmaktadır. Örneğin, bazı sosyal medya uygulamaların bir
dakika içinde yaptığı veri girişlerine bakalım. İnstagramda 50 bin fotoğraf
paylaşımı, twitterda 500 bin tweet paylaşımı, mesajlaşma uygulamalarında(whatsap,
telegram vb.) 30 milyar anlık mesaj iletimi, 200 milyon e-posta gönderimi,
Google arama motorunda 4,5 milyon arama yapılıyor. Bu sayılardan da
anlaşılacağı üzere inanılmaz veriler inanılmaz hızlarda üretiliyor.
Hacim, yukarda
bahsettiğimiz veriler hızla artmakta üretilen bu veriler büyük veri yığınlar
oluşturmaktadır. Şuan en basit anlamıyla bildiğimiz gigabyte kavramı bile çok
küçük bir değişken olmakta. Veri Boyutu için petabyte yada tetrabyte gibi
ölçüler kullanılmaktadır.
Çeşitlilik,
çeşitli
ortamlardan gelen verinin birleştirilmesi aynı zamanda birbirlerine
dönüştürülmesi gerekmektedir. Çeşitlilik ne kadar artarsa büyük veri için sağlıklı
bir veri yığını oluşturur.
Doğrulama, hızla
büyüyen verilerin güvenli olup olmadığını kontrol etmemiz gerektiği durumlarda ortaya
çıkar. Bu verilerin saklı kalması gerektiği
durumlarda olabilir.
Değer, verilerimiz yukarıdaki veri bileşenlerinden filtrelendikten sonra büyük verinin üretimi ve işlenmesinin ilgili şirket için artı değer sağlıyor olmasıdır.
Büyük
Veri Örnekleri Nelerdir?
Şimdiye kadar teorik
bilgiler verdiğimiz Büyük Veri için daha basit bir örneği Netflix üzerinden
verelim. Netfix içerisinde film veya diziler izledikçe algoritma size tarzınıza
uygun öneriler sunması büyük verini teknolojisinin bir boyutu olup asıl önemli
kısmı her yapılan eylemin verisi toplanıp gerektiğinde ilgili şirketlere
satılıyor.
Şuan popüler olan akıllı
süpürgeler göründüğü kadar masum değil. Hepimiz al tarafı bir makine sadece evi
süpürüyor diye düşünüyoruz fakat olay bundan daha fazlasını barındırıyor. Akıllı
süpürgeler temizliğin yanında evin her köşesini santim santim ölçüp evin tüm
konumunu şirketine gönderiyor. Gönderilen veriler Büyük verinin bir boyutu olan
çeşitlilik için veri anlamında olup çok değerlidir.
Bir başka örnekte şuan
okumuş olduğunuz bu yazım ile büyük veriye yeni veriler oluşturuluyor. Mesela
ben bu yazıyı oluştururken Google üzerinden yaptığım aramalar, youtube
üzerinden izlediğim videolar, girdiğim web siteleri hepsi benimle ilgili ve
benimle benzer işleri yapan kişilerle birlikte her hareketimiz büyük veri için
toplanan verilerdir.
Kısaca internet ortamında koyduğumuz bir nokta bile Büyük Veriye (Big Data) hizmet ediliyor.