Büyük Veri

Büyük Veri

“Büyük Veri (Big Data)” kavramı, iş ve yönetim çevrelerinde giderek daha fazla gündem konusu olmaya devam ediyor. İş kültürü, yönetim ve pazarlama dergileri bu konuya sayfalarında yer vermeye devam ederken, literatürdeki çoğalma ve çeşitlenme dikkat çekiyor. Pek çok yeni kavramda olduğu gibi büyük veri de bir sis bulutu içinde, sisten haberdar olduğumuzu ima etmekle birlikte onu tanımlamakta hâlâ zorluklar var. Farklı kaynaklara başvurulduğunda birbiriyle çakışmayan büyük veri tanımlamaları ile karşılaşıyoruz. Kavramı tanımlamaya çalışan teknoloji uzmanlarının ve konuyla ilgili kuruluşların farklı bakış açıları öne sürdükleri tanımlara da yansıyor.

Büyük Veri Nedir?

İngilizce ‘Big Data’ veya Türkçe ‘Büyük Veri’ terimini günlük dilde yorumlamaya çalışırsak, adeta ‘bir dev veri öbeğinden’ söz edildiği gibi bir sonuç çıkarabiliriz. Sanki değişik kaynaklardan elde edilmiş veriler düzensiz biçimde büyük kapasiteli bir ortamda depolanmış gibidir. Bilişim, iletişim, İnternet, otomasyon ve sensor gibi veri toplama ve iletme teknolojilerindeki hızlı gelişmeye bakıldığında, bu güncel yorumlamayı destekleyen bir durum olduğundan söz edebiliriz.

Çoğu zaman bir kavramın tanımını tek bir cümleyle yapmaya çalışmak, anlaşılabilirlik ve kolay kavranma yönlerinden zorluklar çıkarıyor. Akademik düzeyde bir iletişim ortamında karmaşık tanımlar kabul görebilmekle birlikte reel iş dünyasının mevcut deneyim ve birikimini dikkate daha kolay anlaşılır ve açıklayıcı bir tanıma odaklanmak uygun olur.

Büyük veri, karar vermeye yönelik bakış açıları üretme sürecidir. Yukarıdaki güncel yorumla birleştirirsek; bir yerde depolanmış çok miktarda veri mevcuttur; bunlar analiz edilerek ilgilenilen alanda karar(lar) üretmek üzere bakış, sezgi veya içgörü geliştirilecektir. Gerçekten büyük veri süreci, çeşitli kaynaklardan gelen değişik türdeki verileri hızla analiz etmek üzere insan kaynağı ve teknolojiden yararlanır. Amaç, –örneğin iş alanında– yeni faaliyetlere ve eylemlere yol açacak bilgi elde etmektir. Bu veriler resim, video, e-posta, hesap hareketleri, sosyal medya iletileri biçimlerinde ham veya işlenmiş halde olabilir.

Örneğin bir e-ticaret sitesini ziyaret eden kişilerin cinsiyetleri, yaşları, ziyaret gün ve saatleri site yöneticilerinin kendi pazarlama ve satış politikalarını, promosyon programlarını düzenlemede yeni kararlar vermeleri açısından etkili olur. Bir alışveriş merkezindeki (AVM’deki) tüm işletmelerin yazarkasa hareketlerini izleyerek bunlardan yeni strateji, politika ve programlar geliştiren –dolayısıyla kararlar üreten– bir AVM yönetimi düşünebilirsiniz. Bir iş yerinde kendi cari hesap ve stok hareketlerini (kayıtlarda oluşmuş veri yığınını) inceleyerek üretilen veya satışa sunulan ürünler, bunların çeşitliliği ve derinliği konusunda bakış açıları ve kararlar geliştiren bir işletme politikası öngörebiliriz.

Başka Tanımlar

Büyük veri konusu, işletmelerin olduğu kadar iş kültürü ve yönetim alanlarında danışmanlık, eğitim ve denetim hizmetleri veren kuruluşlarında ilgisini çekiyor. Dolayısıyla bu tür yapılar da kendi yaklaşım ve tanımlarını yayınladıkları dokümanlarda ortaya koyuyorlar.

Örneğin McKinsey büyük veri konusunda şöyle bir tanım öne sürüyor: “Büyük Veri; verileri yakalama, depolama, yönetme ve analiz etme yönlerinden tipik veritabanı yazılımları ile başarılamayan büyüklükteki veri kümeleridir.” Gartner ise şu tanımı veriyor: “Büyük Veri; gelişkin bakış ve karar üretmek için maliyete duyarlı, inovatif enformasyon biçimleri gerektiren, yüksek hacim, yüksek hız ve yüksek çeşitliliğe sahip enformasyon varlıklarıdır.”

Basit olarak bakarsak; büyük veri olgusunun iki ana ekseni var. Bunlardan birincisi; ilgilenilen alanlarda büyük miktardaki verilerin toplanıp depolanmasıdır. İkinci eksen ise verilerin (büyük veri yığınlarının) analizini içeriyor. Bundan sonra sırada insan ve kurum zekâsının kullanılarak yorumlama, değerlendirme ve kararlar üretilmesi aşaması geliyor.

Büyük Veri Özellikleri

“Büyük Veri (Big Data)”; İnternet sunucularının kayıtları, İnternet istatistikleri, sosyal medya içerikleri, bloglar, ortam algılayıcıları ve benzer aygıtlardan gelen enformasyon, GSM operatörlerinden elde edilen arama kayıtları gibi büyük hacimli verilerden oluşuyor. Büyük veri, analiz yöntemleri ile yorumlandığında işletmelerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine, işlerinde ve ürünlerinde inovasyon yapmalarına imkân yaratıyor.

Büyük veri ile ilgili bir sunum söz konusu olduğunda, kavrama ilişkin özellikler daima bu tartışmanın bir parçasıdır. Tartışmaların büyük bölümünde ele alınan ayırt edici özellikler veri miktarı, verilerin akış – işleme – değişim hızı ve veri çeşitliliği olur. Bazı tartışmalarda bunlara verinin değeri ile verinin doğruluğu eklenir.

Stratejilere, politikalara ve kararlara yön verecek olan büyük verinin içeriği öncelikle bunlara altyapı olacak değere sahip olması gerekir. Veri değeri olarak bilinen bu nitelik, işletmenin katma değer yaratabileceği özelliklere sahip olmalıdır. Örneğin yeni ürün geliştirmek isteyen bir işletme bu faaliyeti için gereken özellikleri büyük veri yığını içinde bulabilmelidir. Bu gerçek, veri yığınını rastgele toplanıp depolanmış çöp olmaktan kurtarır.

Son 40 yılda bilgisayar özellikli cihazların işlem hızları yükseldi; depolama aygıtlarının kapasiteleri artarken fiziksel boyutları küçüldü; İnternet ile ağlar yaygınlaştı. Veri üretimi hacim olarak arttı ve çeşitlendi. Küreselleşmenin de bu süreçte neden ve sonuç olarak doğrudan etkisi oldu. Bayt ve kilobayt büyüklükleri ile başlayan bilişim süreci gigabaytları aştı; bugün sırayla her biri bir öncekinin 1024 misli olan terabayt (1024 gigabayt), petabayt, ekzabayt, zetabayt, yotabayt gibi dev büyüklüklerden söz ediyoruz. 2004’te İnternet ortamındaki veri büyüklüğü bir petabayt idi. Bir petabayt o zamana kadarki TV içeriğinin toplamına eşittir. 2019 yılında toplam küresel veri hacminin 1 yotabayt olacağı tahmin ediliyor. Veri kümelerinin büyüklükleri artmaya devam ediyor. Buralardaki verilerin yakalanması, depolanması, yönetilmesi ve analizindeki hızlı gelişmeler devam ediyor.

Her Şeyin İnterneti

Yeni türden veri kümelerinde depolanan ve analiz edilmeyi bekleyen veri hacminin giderek artacağı görüşünü güçlendiren teknolojik gelişmeler var. Bunlar arasında sensor (duyarga, veri toplama) alanındaki gelişmeler önemli bir yer tutuyor. Sensor teknolojileri sayesinde yaşam ve iş çevremizdeki her cihazı İnternete ve bilgisayara bağlantılı hale getirmek mümkün oluyor. Bu da veri debisinin, miktarının ve çeşitliliğinin artması anlamına geliyor.

Otomobilden evdeki buzdolabına, iş yerindeki çalışma masasından cepteki telefona, güvenlik sisteminden kapı kilidine, spor alanlarından sanat salonlarına kadar tüm kullanım imkânlarının İnternete ve bilgisayara bağlı olduğu bu yeni dünyaya “Her Şeyin İnterneti” adı veriliyor. Her şey hakkında bilgi sahibi olmak, muhtemelen geleneksel olarak yapageldiğimiz pek çok faaliyet ve eylemi değiştirecek; yeni yaşam tarzları ve iş modelleri gündeme gelecek.

Analitikler

Yukarıda özetlediğim türden büyük veri yığınlarının analizi için iş yapma biçimleri ile yeni yöntem, teknik ve araçlara ihtiyacımız olacağına kuşku yok. Dolayısıyla veri işleme alanındaki bilim ve disiplin dallarında yeni gelişmeler bekleniyor. Bunlara geleneksel veritabanlarının değişimini, buralardaki verilerin yeni sistemlerle bağlantılı hale getirilmesini ekleyebiliriz. Bu değişimi analiz sözcüğünden üretilen “Analitikler (Analytics)” kavramı ile ifade ediyoruz.

Analitiklere girdi sağlayan veri kümeleri geleneksel veritabanlarında yapısal olarak düzenlenen verilere ek olarak sosyal medya ortamındaki yapısal olmayan verileri de içeriyor. Bunlara sensorlardan gelen verileri, çağrı merkezi kayıtlarını, coğrafi konumlandırma (GPS) verilerini, iklim değerlerini, ekonomik verileri, merkezi ve yerel hükümetlerden gelen verileri, İnternet arama kayıtlarını ve şirketlerin ticari ve sınai kayıtlarını eklememiz gerekir. Günümüzde veri üretiminin yüzde 95 gibi büyük bölümü yapısal olarak düzenlenmemiş halde geliyor. Büyük veri yığınlarını kullanılabilir hale getirmek, yorumlamak ve değerlendirmek için “İş Zekâsı” adı verilen yeni yaklaşımlar kullanılıyor.

Verinin Geçerliliği ve Doğrulanması

Sosyal yaşamın ve iş dünyasının her noktasındaki veri elde etme kaynakları büyük bir hızla çeşitlenip yaygınlaşıyor. Bu kaynaklardan gelen veriler miktar olarak her an daha büyük hacimlere ulaşıyor. Veri akışında İnternete bağlı kanalların özel bir yeri ve ağırlığı var. Akan veriler, debiye ve çeşitliliğe uygun depolama, analiz etme teknik ve araçlarını gerektiriyor.

İnternet ortamındaki enformasyonun en önemli yönü, burada sunulan içeriğin doğruluğu ve gerçekliği konusudur. İnternet içeriği doğru, yararlı, gerçek veya iyi enformasyon olabildiği gibi kötü niyetli, yanıltıcı veya manipülatif özellikli dezenformasyon da olabilir. İşletmeler büyük veri yığınlarını analiz eder ve değerlendirirken bu riski göz önünde bulundurmalıdırlar.

Büyük veri olgusundan yararlanmak isteyen her işletme, konuya ilişkin bir stratejik yaklaşıma sahip olmalıdır. Çünkü veri yakalama ve toplama işlemleri, her işletmenin bağımsızca kendisinin yapabileceği bir faaliyet değildir. Toplumdan veri toplama ve bunları kullanma işi öncelikle mahremiyet açısından yasal mevzuatla ve karşılıklı haklar açısından sözleşme hukuku ile ilgilidir.

Konunun teknik yanına baktığımızda ise büyük veri sistemlerinin mimarisi, arama algoritmalarının tasarımı ve verilerin depolanması ve sonuçların dağıtımı gibi çözümü her zaman çok kolay olmayan konularla karşılaşılabilir. Ayrıca iş kültürü açısından verilerden elde edilen sonuçların bakışlara, kararlara ve eylemlere dönüşmesi gibi bir başka konu boyutundan daha söz edebiliriz.

Bu İşi Kim Yapacak?

Büyük veri olgusundan yararlanmak isteyen işletmeler bu amaca yönelik olarak teknoloji ve iş kültürü konusunda birikimli, çok disiplinli bir takım oluşturmayı hedeflemelidirler. Böyle bir takımın en önemli üyesi ‘veri bilimcisi’ olarak tanımlayabileceğimiz kişidir. Bu katılımcı işletme çalışanlarından birisi veya dışarıdan hizmet alınan bir uzman olabilir. Veri bilimcisinin temel fonksiyonu büyük verinin içinde gömülü olan yönelimlerin, muhtemel bakış ve görüşlerin ortaya çıkarılmasıdır. Bir anlamda kaos görüntüsü veren veri yığını içinden düzenli ve yapısal enformasyon türetilecektir.

Veri bilimcisinin varlığı ve fonksiyonu, yaşadığımız çağda (ve gelecekte) iş modellerinin özellikleri hakkında bazı ipuçları taşıyor. Artık basit iş kuralları, geleneksel ritüeller veya geçmişten gelen ezberlerle işi yönetmek mümkün değil. Sıradanlaşmış operasyonlar bir yana; iş süreçlerinin her aşamasında iş aklını (iş zekâsını) kullanmak gerekiyor. Her iş modellerinin baskın bileşeni ‘akıl’ olacaktır.

Büyük veri takımının veri bilimcisi çok boyutlu bir düşünürdür. İş konularında işe ve işletmeye özgü terimlerle etkili biçimde konuşmayı ve yazmayı başarır. İstatistik alanında birikimli ve deneyimli, teknoloji konusunda yetkinlik sahibidir.

Büyük veri takımının ve özellikle veri bilimcisinin temel sorumluluk ve yetkinlik alanları arasında şunları sayabiliriz. Veri bilimcisi veri kümelerini analiz ederek iş çözümleri için özgün model ve algoritmalar geliştirir. Basit veri yığınlarından daha karmaşık ve yapısal veri kümeleri oluşturur. İnovasyon çözümlerine esas olabilecek veri kümeleri meydana getirir. Veriler arasındaki ilişkiyi keşfedecek istatistiksel analizler yapar. Büyük verilerden bakışlar ve görüşler üretmek için yeni öğrenme modelleri geliştirir. Yer alınan endüstri ve sektörde yeni araştırma teknikleri bulur. Veri bilimcisinin anahtar beceri ve yetkinlikler için ise başta istatistiksel analiz, veritabanı bilgisi, iş kültürü ve yönetim bilgisi yetkinliği, raporlama becerisi, iş süreçleri deneyimi ve yazılım alanında geliştirme araçları deneyimi gibi nitelikleri sayabiliriz.

Gürcan Banger