Büyük Veri ve Makine Öğrenmesi Arasındaki Temel Farklar

Big Data ve Makine Öğrenmesi bazı benzerlikleri ve farklılıkları olan, birbirleri ile peş peşe kullanıldığını sık sık gördüğümüz iki olay, tabir, kelime.

Ben veri bilimi konusunda okumalarıma ilk başladığımda bir çok terimi karıştırıyor, mantıklarını anlamakta zorluk çekiyordum.

Tabii ki deneyimleyen ve deneyimlerini paylaşan kişiler çoğaldıkça -tıpkı en güzel lezzeti veren yemek tarifini bulup uygulamak gibi- bu terimleri anlamak, öğrenmek ve uygulamak da basitleşecek.

İtiraf etmeliyim, ben bir yazılımcıyım ve bilgisayar üstünde tekrar eden hiç bir işlemi manuel olarak yapmıyorum. Bir döngü varsa kesinlikle bir kaç satır kod ile bu döngüdeki her işlemi programlıyor ve işimi bilgisayara yaptırıyorum.

Kesinlikle tembel olduğumu kabul ediyorum. Big Data ve Yapay Zeka bu sebeple beni cezbetmiş olabilir.

Big Data genel itibari ile bize binlerce karar, sonuç, yöntem, istatistik sağlayan bir araçtır. Daha ötesi benim düzenlemekten, geliştirmekten, silmekten kaçındığım 100 satırlık verilerin milyonlarcasıdır. İnsanlık bu güne kadar bilgiye hükmedebildi fakat insanların en büyük çaresizliği hafızalarını yönetememeleriydi.

Hafızayı yönetmek için insanlar kadar kompeks olmayan -belki de yarın daha kompleks olacak- fakat işi gücü bilgiyi erişilebilir, sistematik ve hızlı bir şekilde depolamak/yayınlamak olan dijital yapılar geliştirmemiz gerekti. Big Data dediğimizde peşi sıra söyleyeceğimiz her şey işte tam da bu ihtiyaçtan var oldu.

Hızlı ulaşabileceğimiz şekilde  verileri depolamayı başardıktan sonra bu verileri kullanmaya başladık. Anlık uyarılar, acil durumlar, iyileştirmeler, A/B testleri ve insanlığın aklına gelecek her şey bu büyük veri ambarıyla -yeterli seviyeye geldiğinde- yapılabilir.

Peki büyük veriyi araştırmaya başladıktan sonra sık sık duymaya başladığımız “makine öğrenmesi” nedir?

İşte bu makine öğrenmesi denilen yöntem-araç benim 100 satırlık excel dosyasındaki her bir telefon numarasını aynı formata getirmek için yazdığım küçük yazılımların milyonlarca kat daha etkilisidir. İlk olarak dijital bir zihin kurgularız, ona belli başlı şeyleri öğretir (ekler) ve bu bilgiyi geliştireceği/değiştireceği/kıyaslayacağı kaynakları gösteririz.

İnsanların bildiklerini makinelere öğretmesi eskiden şundan ibaretti. Makinenin anlayacağı dilden (yazılım dilleri) konuşurduk ve onlar bizim anlattığımız kadarını yapardı. Şimdi ise onlara kendi dilimizi öğretiyor, gerekli kaynakları sağlıyor ve onların tıpkı bir çocuk gibi zamanla gelişmesini istiyoruz. Bu gerçekten mümkün. Ama ben hala şaşırıyorum.

Bu yazıyı makine öğrenmesi ve büyük verinin arasındaki farkları tanımlamak için oluşturdum. Aşağıdaki tablodan da biraz daha basit ayrımları görebilirsiniz.

Terim Büyük veri Makine öğrenmesi
Veri Kullanımı Büyük veriler, finansal araştırma, satış verisi toplama vb. dahil olmak üzere çeşitli amaçlar için kullanılabilir. Makine öğrenmesi, kendi kendini süren otomobillerin ve öneri motorlarının arkasındaki teknolojidir.
Öğrenmenin Temelleri Büyük veri analitiği, karar alma süreçlerimizi şekillendirmeye yardımcı olabilecek yeni modeller aramak için mevcut bilgilerden yararlanır. Buna ek olarak, Makine öğrenmesi mevcut verilerden yeni şeyler öğrenebilir ve bir makinenin kendisine öğretmesi için de gereken temeli sağlayabilir.
Desen tanıma Büyük veri analitiği, mevcut modelleri, sınıflandırmalar ve dizi analizi yoluyla belli kalıplara sokar. Veya bu kalıpları belirleyerek desenleri kaydeder. Bununla birlikte, makine öğrenmesi, büyük veri analizlerinden toplanan verileri otomatik olarak öğrenmek için kullandığı algoritmaları da kullanarak  bir adım öteye götürür.
Veri Hacmi Adından da anlaşılacağı gibi büyük veriler, büyük miktarda veriyle çalışan büyük ölçekli veri kümeleriyle ilgilenirler. Makine öğrenmesi, tahmin ve önerileri anlar, oluşturur ve istisna problemlerin oluştuğu küçük veri kümeleriyle ilgilenmeyi amaçlar.
Amaç Big Data’nın amacı, büyük miktarda veriyi saklamak ve verilerde erişebilirlik sağlamaktır. Makine öğreniminin amacı, eğitilmiş verilerden öğrenmek ve gelecekteki sonuçları tahmin etmektir.

 

Tabii ki bu tabloda yazanlar fazlasıyla yüzeysel. Gelecekteki yazılarda bu içerikleri geliştireceğiz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir