Veri Gölünüzü Serbest Bırakmak için “Unutun”

Hayatta bazı becerileri mükemmelleştirmek yıllar, hatta bazen bir ömür alır. Örneğin top sürerken sıçrayarak tek elle havada atış yapmak, trompette yüksek oktav Do notasını hatasız basmak, Ford Expedition ile paralel park etmek. Malcolm Gladwell, “Çizginin Dışındakiler” adında, bir beceriyi mükemmelleştirmek için gereken çalışma süresinden (10.000 saat) bahsettiği bir kitap yazdı (her ne kadar 10.000 saatin tam doğru olup olmadığı tartışılsa da yine de insanların bir beceride uzmanlaşmaya önemli miktarda zaman ayırması ve çaba göstermesi gerektiğini bilmek oldukça yararlı). Ama uzmanlaştığımızı hissettiğimiz anda değişim konusunda da isteksiz oluyoruz. Uzmanlaşmak için bu kadar zaman harcadığımız bir şeyi unutmak konusunda da doğal olarak istekli değiliz.

Sıçrayarak tek elle yaptığınız atıştaki topu bırakma anınızı değiştirmek veya baş trompeti çalarken üfleme tarzınızı değiştirmek çok ama çok zordur! Neden mi? Çünkü unutmak öğrenmekten daha zordur. Tüm o sinoptik sinir uçlarının ve derin anıların bağlantılarını koparmak, ilk başta bu bağlantıları kurmaktan da zordur. Bu, sadece hızlı, küçük ya da ucuz düşünme meselesi değildir. Farklı düşünmeyi gerektirir.

Örneğin profesyonel basketbolun, 3 sayılık atışın oyun akışını değiştirme potansiyelini anlaması neden bu kadar uzun sürdü? 3 sayılık atış, NBA’ye 1979-1980 sezonunda eklendi; ancak yıllarca 3 sayılık atış ciddi bir oyun stratejisi değil bir tanıtım malzemesi olarak görüldü. Pat Riley, ligde 3 sayılık atanların ilk on yılının efsanevi koçu (1982, 1985, 1987 ve 1988 yıllarında NBA Şampiyonluğunu kazandı), buna “gimmick” yani dikkat çekmek için yapılan bir hile diyordu. Dönemin en iyi oyuncularından Larry Bird ise, “Gerçekten sevmiyorum,” demekten çekinmiyordu.

“3 sayılık atış ekonomisinin” NBA Şampiyonasını kazanma ilkelerini değiştirmesi ancak son 3 yıl içinde gerçekleşti.

NBA Koçları ve Menajerleri, “3 sayılık atış ekonomisini” ve 3 sayılık atışın iyi bir atıcıyı nasıl baskın bir oyuncuya çevirebileceğini, %40’lık bir 3 sayılık atış yüzdesinin sayı/verim yönünden %60’lık bir 2 sayılık atış yüzdesine denk geldiğini anlayamamıştı. 3 sayılık atış ekonomisinden (kabul edilebilir bir 3 sayılık atış yapmak için hızlı top hareketi eşliğinde), Golden State Warriors’un 2015-2016 sezonuna kadar tam olarak faydalanılamamıştı. Geçtiğimiz 3 sezondaki başarıları (3 NBA finali ve 2 şampiyonluk), basketbol oyununun ne kadar değiştiğini gösteriyor.

Yeni, daha güçlü, oyunu değiştiren inançlar edinmek (örn. topun hızlı hareket ettiği bir hücumda 3 sayılık atış yapmak) için bazen uzun süredir sahip olunan inançları (örn. ağırlıklı olarak isolation hücum oyununda 2 sayılık atış yapmak) unutmak gerekir.

NBA örneğiyle devam edersek; Phil Jackson, Chicago Bulls ve Los Angeles Lakers’ın koçluğunda kazandığı 11 NBA Dünya Şampiyonası ile en iyi NBA koçlarından biri olarak kabul edilir. Phil Jackson, bu 11 unvanı kazanmak için o dönemin başarılı oyuncuları Michael Jordan’ın (Chicago Bulls) ve Kobe Bryant’ın (Los Angeles Lakers) güçlü yönlerini ortaya çıkaran “Üçgen Hücum”da ustalaşmıştı.

Ancak 3 sayılık atış ekonomisi basketbolda kazanmanın yolunu değiştirdiğinde basketbol Phil Jackson’ı yendi. Jackson’ın deneyip başarılı olduğu “Üçgen Hücum”, New York Knicks karşısında başarısız olarak takımın dramatik bir şekilde düşük performans göstermesine ve sonuç olarak kendisinin de kovulmasına yol açtı. Bu, ilerlemek için eski becerileri unutmaya hazır olmanın ne kadar önemli olduğunu çarpıcı bir şekilde gösteriyor.

Ve spor için gerçek olan bu durum, teknoloji ve iş dünyası için daha da gerçek.

Unutmanın Zorluğu

Kariyerimin ilk yirmi yılında veri ambarlama tekniğini mükemmelleştirmek için uğraştım. 1980’lerde boyutsal modelleme ve yıldız şema oluşturma tekniğini iyileştirdiğimiz Metaphor Computers’da olduğum için şanslıydım. Yıllarca Ralph Kimball, Margy Ross, Warren Thornthwaite ve Bob Becker gibi veri ambarı uzmanları ile birlikte yıldız şema ve boyutsal modelleme becerilerimi geliştirmek için çalıştım. Her müşteri toplantısında benim için bir alışkanlık oluştu. Müşteri veri analiz ihtiyaçlarını açıklarken ben kafamda bir yıldız şeması ve uygun boyutları oluşturuyordum.

Daha sonra başıma Yahoo geldi ve kısa sürede mutlak doğru olarak gördüğüm her şey tepetaklak oldu. Yarı yapılandırılmış ve yapılandırılmamış petabaytlarca veriye dayanan analizlerin, 70-80 boyutlu ve yüzlerce ölçütü olan yüz milyonlarca müşterinin ve de saniyenin binde birinde kampanya kararları alma ihtiyacının olduğu cesur yeni bir dünyanın içine düşmüştüm. Benim toplu “ayır ve incele” iş yaklaşımımın ve fazlasıyla yapılandırılmış veri ambarı yaklaşımımın bu gerçek zamanlı, tahmine dayalı ve kuralcı analizlerin cesur dünyasında işe yaramasına imkan yoktu.

Bu yeni, gerçek zamanlı, tahmine dayalı ve kuralcı dünyayı benimsemek adına içime işlemiş veri ambarlama kavramlarını unutmak için çabaladım. Bugün BT liderlerinin de karşı karşıya kaldığı en büyük zorluklardan biri budur: kutsal bir kitapmış gibi kucakladıklarını unutmak ve yeni, farklı olanı kucaklamak. Ve ben, bu zorluğu en net Veri Bilimi ve Veri Gölü hakkında tartıştığım zamanlarda görüyorum.

“Başarısızlık Sanatı”nı kucaklamak ve Veri Bilimi Süreci

Günümüzde Bilişim Kurulu Başkanlarından (CIO) beklenen şudur: işleri takip etmek için verileri ve analizleri kullanan toplu bir dünyadan, olasılıkları tahmin etmek ve öneriler yapmak için yapılandırılmış ve yapılandırılmamış iç ve dış verileri kullanan gerçek zamanlı bir dünyaya doğru yaşanan dijital dönüşüme liderlik etmek. Bu geçişe güç vermesi adına CIO’ların müşteri, ürün ve faaliyetler konusunda ön bilgi edinmek için yeni bir yaklaşım benimsemesi gerekiyor: Veri Bilimi Süreci

Veri Bilimi Süreci, hızlı bir şekilde yeni veri kaynaklarını ve analiz araçlarını keşfetmek, denemek, test etmek ve hızlı başarısız olup daha hızlı öğrenmekle ilgilidir. Veri Bilimi Süreci, kurumsal liderlerin analiz sonuçlarından tatmin olmasından öncepek çok kez “yeterince iyi” ve yeterince başarısız olmasını gerektiriyor. Tahminler, %100 doğruluğun olduğu mükemmel bir dünya değildir. Yogi Berra’nın ünlü sözündeki gibi:

“Tahminde bulunmak zor, özellikle gelecek hakkında.”

Bu, fazlasıyla kendini yineleyen ‘hızlı başarısız ol ama daha hızlı öğren’ süreci, dijital dönüşümün kalbidir. Anahtar ticari ve operasyonel süreçleri optimize edebilecek yeni müşteri, ürün ve faaliyet içgörülerini açığa çıkarmak için düzenlemeler ve uyumla ilgili riskleri hafifletme, yeni gelir akışları yaratma ve daha ikna edici, daha kuralcı müşteri etkileşimleri oluşturma. Dijital dönüşüme olanak tanıyan platform ise Veri Gölü‘dür.

Veri Gölünün Gücü

Veri gölü; emtiayı, düşük maliyetli sunucuları ve depolamayı açık kaynak araçları ve teknolojileri ile eşleştiren“büyük veri ekonomisi”nden faydalanır. Bununla verileri depolamak, yönetmek ve analiz etmek geleneksel, tescilli veri ambarlama teknolojilerini kullanmaktan 50 ila 100 kat arasında daha ucuzdur. Ancak veri gölünü, veri ambarından daha cazip bir platform yapan sadece maliyet değildir. Veri gölü, aynı zamanda yeni veri ve analiz becerileri, çeviklik, hız ve esneklik ile işletmeyi güçlendirmek için yeni bir yol da sunar (bkz. Tablo 1).

Veri Ambarı Veri Gölü
Yoğun mühendislik gerektiren bir yapıya sahip boyutsal şemalarda yapılandırılmış veriler Olduğu-gibi (yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış formlarda) veriler
Yoğun mühendislik gerektiren, önceden işlenmiş veri alımı Hızlı, olduğu-gibi veri alımı
Geçmişe dayalı operasyonel veri kaynaklarından geçmişe dönük raporlar üretme Çok çeşitli iç ve dış veri kaynaklarından tahminler ve kurallar üretme
Geçmişteki olayların ve performansın %100 doğru sonuçları Gelecekteki olayların ve performansın “yeterince iyi” tahminleri
İşletmenin ne yaptığına dair geçmiş raporunu desteklemek için yükleme sırasında şema oluşturma Hızlı veri keşfini ve hipotez testini desteklemek için sorgulama sırasında şema oluşturma
Yeni veri kaynaklarını içeri almak ve keşfetmek oldukça zordur (haftalar veya aylar olarak ölçülür) Yeni veri kaynaklarını içeri almak ve keşfetmek kolay ve hızlıdır (saatler veya günler olarak ölçülür)
Tek parça tasarım ve uygulama (şelale) Yerel olarak paralel ölçeği büyütülebilir tasarım ve uygulama (scrum)
Pahalı ve tescilli Ucuz ve açık kaynak
Yaygın veri çoğalması (veri ambarları ve veri marketleri) Yönetilen tek bir kurumsal veri kaynağı
Katı, değiştirmesi zor Çevik, değiştirmesi nispeten kolay

Tablo 1:  Veri Ambarı x Veri Gölü

Veri gölü, veri bilimi ekibinin aşağıda belirtilen kendilerine has ihtiyaçlarını destekler:

  • Yeni yapılandırılmış ve yapılandırılmamış veri kaynaklarını hızlı bir şekilde keşfetme ve inceleme
  • Yeni analitik algoritmaları ve teknikleri deneme
  • Neden ve sonucu nicelendirme
  • Uyum derecesini ölçme

Veri bilimi ekibinin bu döngüyü, haftalar veya aylar değil, saatler veya günler içinde gerçekleştirmesi gerekir. Veri ambarı, bu veri bilimi gereksinimlerini destekleyemez. Veri ambarı, yapılandırılmış ve yapılandırılmamış iç ve dış kaynakları hızla keşfedemez. Veri ambarı, neden-sonucu nicelendirmek için büyüyen derin öğrenme/makine öğrenimi/yapay zekâ alanından faydalanamaz. Bir veri ambarı uzmanının bana söylediği gibi, veri gölünün “veri ambarımız için soğuk depo” olduğunu düşünmek daha büyük bir fırsatın kaçmasına neden olur. Bu, dünün “üçgen hücum” felsefesidir. Dünya değişti ve nasıl basketbol oyunu “3 sayılık atış ekonomisi” ile değiştiyse iş modelleri de “büyük veri ekonomisi” ile değişiyor.

Ama veri gölü, sadece bir teknoloji yığınından çok daha fazlasıdır. Kurumun verilerinin ekonomik potansiyelinden gerçek anlamda faydalanabilmek için veri gölünün veri doğruluğunu, kalitesini, güvenliğini, bütünlüğünü ve yönetişimini kapsayan veri yönetim hizmetleri ile birlikte gelmesi gerekir.

Veri gölü, yalnızca başka bir veri deposu olarak kullanılacaksa o zaman siz verilerinizi yönetilemeyen veri ambarları ve veri marketleri kalabalığına atmaya devam edin.

AMA asla tükenmeyen, yıpranmayan ve sıfır marjinal maliyetle sayısız alanda kullanılabilen benzersiz veri ve analiz özelliklerinden faydalanmak istiyorsanız, veri gölü sizin “işbirlikçi değer yaratma” platformunuzdur. Veri gölü, kurum genelinde verilerin ve analitik varlıkların yakalanmasını, tasfiye edilmesini, korunmasını ve yeniden kullanılmasını destekleyen platforma dönüşür.

Ama insanın veri ve analitik konusunda kutsal gerçek olarak kabul ettiklerini unutması ve yeni kavramları, teknolojileri, yaklaşımları kucaklamak için uzmanlaştıkları becerileri fırlatıp atmaya hazır olması gerekir. Zor olmakla birlikte büyük veri ekonomisi gözardı edilemeyecek kadar caziptir. Sonuçta geçiş, aydınlatıcı ve faydalı olacaktır. Biliyorum, çünkü bu yoldan geçtim.

Yazar hakkında:

Bill Schmarzo Teknolojiden Sorumlu Başkan, Dell EMC Services

About the Author: Dell Technologies