Her şeyi analiz edebilir miyiz?

Excel tablolarında tuttuğumuz gelir gider kayıtlarından, yüzümüzdeki hatların aldığı biçime kadar her şey analiz edilebiliyor. Hatta mutluluk ve stres oranımız. Belki de çok yakında düşüncelerimiz..

Veri analizi konusuna başlarken Microsoft Azure gibi analiz araç platformlarına göz gezdirmekte fayda var. Ben direkt olarak “Azure Bulut Hizmetler Dizini“ni incelemenizi öneriyorum.

Bu platformda görsel analiz, metin analizi, duygu analizi gibi çeşitli analiz türleri için araçlar ve API’lar var. Ve bunların dışında onlarca cloud ve database aracı da mevcut.

Peki sorumuzun cevabına dönelim. Ulaşabildiğimiz her şeyi analiz edebilir miyiz? 

Bu soruya cevap vermek için mevcuttaki analiz yöntemlerine bakalım. (Liste: Veri  Stratejisi – Bernard Marr)

  • Metin tabloları
  • Yapılandırılmamış metin
  • Görüntü analizi
  • Video analizi
  • Ses analizi
  • Duygu analizi (metin, görüntü ve ses ile)
  • A/B test ile alternatif analizi
  • Korelasyon Analizi (iki farklı database arasında ilişki kurmak ve bu ilişkinin detay gücünü ölçümlemek)
  • Senaryo Analizi (A/B testine benzeyen fikir ve senaryo testleri. Uygulanabilirlik ve diğer kapsamları ölçümlemek.)
  • Tahmin/Zaman analizi
  • Monte Carlo Simulasyonu (İhtimaller göz önünde bulundurularak oluşabilecek kötü – orta – iyi olasılıkların ödül ve riskleri hakkında fikir verir. Eylem planlarının belirlenmesinde kullanılır.)
  • Kohort Analizi
  • Doğrusal Programlama (iktisadi veriler göz önünde bulundurularak en karlı ve en iyi üretim modeli belirlemede kullanılır.)
  • Nöral Ağ Analizi
  • Literatür Analizi

Bu analiz yöntemleri ile analiz edilemeyecek olan veri tipleri nelerdir?

Bilim tarihi boyunca insanlar önce dokunabildikleri, sonra dokunamadıkları ama görebildikleri, daha sonrasında göremedikleri ama hissedebildikleri ve nihayet soyut olanı yani düşünceleri dahi analiz etmeyi başardı. Bu yöntemler derinleşmeye ve genişlemeye devam ediyor. Detaylar netleşiyor ve her yeni netleşen detayda yeni sorularla karşılaşıyoruz. Kısacası artık soyut dünyaya kadar ulaşabiliyor ve onu netleştirebiliyoruz. Analiz konusunda ise belli bir sınır yok. Bugün sabah aynı anda aynı şarkıya başlayan 5 milyon insan olmadığına dair %100 emin olamayız. Bunu ancak ölçümleme yöntemlerini yaygınlaştırdıkça ve geneli ölçebildikçe netleştireceğiz. Her şeyi kaydetmek mümkün olduğu gün ne olacak..?

Bunu ben de bilmiyorum.

Hangi Verileri Toplamalıyım?

Veri toplamanın ve işlemenin bir çok yönden fayda sağlayacağını biliyoruz. Şirketlerin büyük veriye neden yatırım yaptıklarını ve onu işleyip nerelerde kullandıklarını mevcut kaynaklardan öğreniyoruz.

Örneğin Bernard Marr’ın 45 şirketin büyük veriyi nasıl kullandıklarına dair kitabını okuduğumuzda ABD’nin ülkeyi yönetmek için büyük veriyi kullandığını görüyoruz.

Büyük veri oluşturmak için bir yatırım yapmak gerekiyor. Haliyle doğru stratejiyi belirlemeden, yanlış yatırımlar yaparak elde edilmiş yığınla veri gerçekten hiç bir işimize yaramayabilir..!

 

Veri İhtiyaçlarımızı Tespit Edelim

Veri stratejisi geliştirirken ilk düşündüğümüz şey ne yazık ki elimizdeki mevcut veriler veya mevcutta toplayabilir halde olduğumuz veriler oluyor. Oysaki bir süreç başlatıyoruz ve neye sahip olduğumuzdan çok, bize pozitif etki sağlayacak hangi veriye sahip olmamız gerektiği önem arz ediyor.

Sonuç itibari ile anket çalışması yapmıyoruz. Veri çeşitliliğine ve mikro farkındalık yaratacak bilgiye ulaşmak için bir strateji geliştirmemiz gerekiyor.

Rolls-Royce’un düzgün çalışan %95’lik ürün istatistiği ona veri kazanımı sağlamıyor. Fakat x bölgedeki araçlarında gözlemlediği herhangi bir problem, sorunun kaynağına inmesinde ona muazzam bir hız ve sebep belirlemede büyük bir bilgi sağlıyor.

Starbucks dükkanlarının önünden geçenleri saydığı sensörlere sahip olduğunu duymuştum. Sadece içeri girenleri değil, önünden geçenleri de saymasının sebebi ne olabilir?

Tabii ki pazarlama stratejisi belirlerken nasıl bir yatırım yapması gerektiğini, en çok hangi dükkanlarında tanıtıma ihtiyacı olduğunu belirlemek istiyor. Hangi saatlerde, kaç çalışana ihtiyacı olduğunu lokasyon bazlı belirleyebilir. Hatta hangi saatler arasında dükkanların önünün süpürülmesi gerektiğini bile..

Toplayacağımız verileri nasıl belirleriz?

Koku ve hissiyat dışında kalan tüm duyuları otomatize ederek dijital olarak saklayabiliyoruz. Duyu ve kokuyu ise kişilerin yorumlarına dayanarak ve niteliklerine bakarak saklayabilir durumdayız.

Bir ürün satmadan önce kendimize 3 ay ayırıp diğer sitelerdeki stokları takibe alabiliriz. Ya da bir yazılım sayesinde her saat başı bu stokları veritabanımıza kaydedebiliriz. Pek tabii stoklarını yayınlayan e-ticaret siteleri bulmak biraz zor olabilir. O zaman biz de kaç adet kullanıcı yorumu geldiğine bakarız. O da mı mümkün değil o zaman ön sipariş özelliği olan dükkanları kullanalım. Bu örnekler belki çok basit ama bedava olması kulağa çok güzel geliyor.

Çünkü 15 yıl öncesine kadar bu dediklerimi hayal dahi edemiyorduk. Şimdi nasıl yapabilir duruma geldik?

Çünkü birileri hayal etti ve bu doğrultuda mekanikler yarattı. Stokları tutan sanal dükkanlar yaptılar. Çünkü o bilgiye ihtiyaçları vardı. Ve onu bugün alabiliyorlar. Gelecek yıllarda bunun örneklerini fazlasıyla göreceğiz.

Ne dediğinizi duyuyorum.. İhtiyacımız olan veriyi belirlerken ulaşılabilirliğini tabii ki düşünmek zorundayız. Fakat jet motorlarında arızaya sebebiyet olabilecek ısı değişimlerini dahi anında merkeze ileten GPRS sistemleri geliştiren şirketler işe şu soruyla başladılar: En iyisi olmak için neler yapabiliriz?

Bugün “VERİ” kelimesini her yerde gördüğümüz için heyecanlanıyoruz. Ama bir yerlerden veri toplama yarışına girmeden önce, bu soruyu bizim de sormamız gerekiyor. En iyisi olmak için neler yapabiliriz? Belki de sizin ihtiyacınız olan bilgi zaten elinizin altındadır. Ya da ona ulaşmak için bir müddet daha, daha basit ve geleneksel yöntemlere yatırım yapmanız gerekiyordur.

Big data bir araçtır. Unutmayın onu ihtiyaçlarınızı belirlerken de kullanabilirsiniz, bu ihtiyaçları çözerken de.

Büyük veri dünyanın ufkunu katlarken onu görmezden gelmeyeceğiz. Nasıl, neden, nerelerde, hangi aşamalarda diye sordukça aslında her aşamaya entegre edilebilirliğini fark edeceğiz.

WBD’yi takip etmeye devam edin… 🙂

Kitaplık: Büyük Veri İş Başında – Bernard Marr

Büyük verinin ne olduğunu anlama aşamalarındayız. Teknik tanımlar, mizansenler veya çeşitli hikayelerle bilenler bilmeyenlere big data’dan bahsediyor.

Ben de big data nedir? sorusunu ilk sorduğumda; pratikte nasıl kullanıldığını, yardımcılarını ve kullanım alanlarını görmem gerektiğini fark etmiştim.

Fütürist ve Forbes köşe yazarı Bernard Marr, toplamda 45 büyük şirketin big data’dan nasıl yararlandığını, veriyi hangi alanlarda işlediklerini ve nerelerden veri topladıklarını “Büyük Veri İş Başında” kitabında kaleme almış.

Kitabın içeriğinde büyük veriyi kullanan şirketler ve kullanım özetleri ise şöyle sıralanıyor;

  1. WALMART: Büyük veri, süpermarket performansını artırmak için nasıl kullanılıyor?
  2. CERN: Evrenin sırlarını büyük veri ile çözmek
  3. NETFLIX: Büyük veriyi kullanarak istediğimiz programları nasıl sunuyor?
  4. ROLLS-ROYCE: Büyük veri, üretimde nasıl kullanılıyor?
  5. SHELL: Petrol şirketleri büyük veriyi nasıl kullanıyor?
  6. APIXIO: Büyük veri sağlık sektörünü nasıl dönüştürüyor?
  7. LOTUS F1 TAKIMI: Büyük veri motor sporu ekibinin başarısında nasıl rol oynuyor?
  8. PENDLETON&SON: Küçük firmalar için büyük veri
  9. ABD OLİMPİYAT KADIN BİSİKLET TAKIMI: Büyük veri sporcuların performansını optimize etmek için nasıl kullanıyor?
  10. ZSL: Büyük veri ve hayvanların korunması
  11. FACEBOOK: Müşterilerini anlamak için büyük veriyi nasıl kullanıyor?
  12. JOHN DEERE: Büyük veri çiftliklere nasıl uygulanabilir?
  13. İSKOÇYA KRALİYET BANKASI: Müşteri hizmetlerini kişiye özel hale getirmek
  14. LINKEDIN: Büyük veri, sosyal medyadaki görünürlüğü artırmak için nasıl kullanıyor?
  15. MICROSOFT: Büyük veriyi kitlelerle buluşturmak
  16. ACXIOM: Pazarlamayı büyük veri ile geliştirmek
  17. ABD GÖÇMENLİK VE GÜMRÜK KURUMU: Büyük veri, yolcuların güvenliğini sağlamak ve terörizmi engellemek için nasıl kullanıyor?
  18. NEST: Nesnelerin internetini eve getirmek
  19. GENERAL ELECTRIC: Büyük veri endüstriyel interneti nasıl besliyor?
  20. ETSY: Büyük veri el işçiliği alanında nasıl kullanılıyor?
  21. NARRATIVE SCIENCE: Büyük veri hikaye anlatırken nasıl kullanılıyor?
  22. BBC: Büyük veri medyada nasıl kullanılıyor?
  23. MILTON KEYNES: Büyük veri akıllı şehirler yaratmak için nasıl kullanılıyor?
  24. PALANTIR: Büyük veri, CIA’ye yardımcı olmak için nasıl kullanılıyor?
  25. AIRBNB: Büyük veri, konaklama sektöründe nasıl kullanılıyor?
  26. SPRINT: Mobil ağ verilerini kullanarak profil çıkarmak
  27. DICKEY’S BARBECUE PIT: Büyük veri, Amerika’nın en başarılı restoran zincirlerinden birinde nasıl kullanılıyor?
  28. CAESARS: Büyük veri kumarhanede
  29. FITBIT: Fitness alanında büyük veri
  30. RALPH LAUREN: Moda sektöründe büyük veri
  31. ZYNGA: Oyun sektöründe büyük veri
  32. AUTODESK: Büyük veri, yazılım sektörünü nasıl dönüştürüyor?
  33. WALT DISNEY: Büyük veri aile tatillerimizi nasıl dönüştürüyor?
  34. EXPERIAN: Büyük veriyi kredi kararlarını vermek ve kimlik dolandırıcılığını önlemek için kullanmak
  35. TRANSPORT FOR LONDON: Büyük veri Londra’daki toplu taşımayı geliştirmek için nasıl kullanılıyor?
  36. ABD HÜKÜMETİ: Bir ülkeyi yönetmek için büyük veriyi kullanmak
  37. IBM WATSON: Bilgisayarlara anlamayı ve öğrenmeyi öğretmek
  38. GOOGLE: Google’ın iş modelinin merkezinde büyük veri nasıl yer alıyor?
  39. TERRA SEISMIC: Büyük veriyi depremleri tahmin etmek için kullanmak
  40. APPLE: Büyük veri şirketin merkezinde nasıl yer alıyor?
  41. TWITTER: Twitter ve IBM büyük veriyi nasıl kullanıyor?
  42. UBER: Büyük veri Uber’in merkezinde nasıl yer alıyor?
  43. ELECTRONIC ARTS: Video oyunlarında büyük veri
  44. KAGGLE: Veri bilimcinizi kitle kaynağından seçin
  45. AMAZON: Müşteri profili çıkarmak.

 

Big datayı tanımak için çok iyi bir Türkçe kaynak olduğuna inanıyorum. Veri bilimine ilgili olan herkese bu kitabı okumayı tavsiye ederim.

Ayrıca böyle bir kaynağı Türkçe’ye çevirdiği için de Başak Gündüz‘e teşekkür ederim.