Blog ve Yorumlar

Veri Bilimi-1: “Verilerle düşünmek neden zeki olmanın yeni bir yoludur?”

“Dün dünde kaldı cancağızım, bugün yeni şeyler söylemek lazım” Mevlana’nın yıllar önce söylediği bu söz aslında günümüzün karmaşık dünyasını ne güzel anlatıyor.   Günümüzde her gün yaklaşık 3 exabyte bilgi üretiliyor ve bu gittikçe artmaya devam ediyor.(1 exabyte Economist Dergisinin 10 milyar kopyasına denk) Bu tür bir veri bombardımanında bugün konuştuğumuz şey ertesi gün hızlıca anlamını yitirebiliyor.

Bu kadar çok veri hayatımıza Büyük veri (big-data) dediğimiz  kavramı getirdi. Bu kavram büyük bir heyecan yaratmaya başladı ama bir yandan da aslında şirketlerin bu konuda nasıl ilerleyecekleri konusunda emin olmadıklarını görüyoruz.

...

Peki nedir bu Büyük Veri?

Daha şirketler ellerindeki mevcut verileri tam anlamazken ya da iş süreçleri ile hiç uyuşmayan veri depolama programlarına tonlarca para harcayıp bekledikleri geri dönüşü alamazken büyük veri ile nasıl başa çıkacaklar? Bu durum biraz da 1990′larda başlayan CRM deneyimlerini hatırlatıyor. Muazzam miktarda müşteri verisi toplamak için yeni bilgi teknolojisi(BT) sistemleri oluşturulurken etkileyici sonuçlar vaat edilirdi. Ama işler öyle gitmedi. Birçok üst düzey yönetici CRM teknolojilerinin pratik sonuçlarına kayıtsız kaldı. Bu teknolojilerden faydalanmak için için gereken süreç değişikliği ve çalışanların yeteneklerinin geliştirilmesi fazlasıyla yavaş gerçekleşti. Günümüzde artık çoğu şirket CRM programlarını rayına oturtmaya başladı ama bu zamana kadar bazısı ciddi zarara uğradı ya da ivmesini yitirdi.

Büyük ya da küçük veri; burada önemli olan kullandığımız verinin büyüklüğü değil onu nasıl kullandığımız ve bütünleşik hale getirdiğimizdir. Biz o datadan anlamlı içgörüler çıkarabiliyor muyuz? Bu veriler bizim pazar performansımızın artırılmasında katkı sağlıyor mu? Ben bu verileri kullanarak yapmış olduğum pazarlama yatırımlarının hesabını verebiliyor muyum? Eğer bu tür sorulara evet diyebiliyorsak o zaman veri işe yaramıştır. Tabi burada önemli olan diğer bir konu da hız… Bu sorulara cevap veriyorum ama bu cevapları çok geç görüyorsam yine çok bir anlamı yok.  Veriler önemlidir ama performans gelişimi ve rekabet avantajı , sonuçları tahmin edip faydalanma imkanı sunan analitik modellerle mümkündür. Burada işin içine Kestirimsel Analitik (modelleme) dediğimiz yeni bir kavram giriyor.

Wikipedia’da Kestirimsel Analitik şu şekilde tanımlanıyor:

İstatistikten veri madenciliğine ve oyun teorisine kadar bir dizi tekniği içerir. Cari ve tarihsel gerçekleri analiz ederek geleceğe ilişkin tahminler yapar. Kestirimsel modeller ilişkileri ve verilerdeki desenleri arayarak açıklayıcı değişkenleri belirler ve bağımlı değişkenleri kestirirler. Kestirimsel analitikte verinin kalitesi ve kestirimleri yapacak uzmanın yeterliliği çok önemlidir.

Burada size son dönemde yapmış olduğumuz hem büyük veri hem de küçük veriyi bir araya getiren ve aynı zamanda ileriye yönelik tahmin yapmamızı sağlayan bir çalışmamızdan bahsetmek istiyorum.

mbbv

Bu çalışmada yaklaşık 1.500.000′luk sosyal medya datası ile 70 haftalık tracking çalışmasından elde edilmiş  KPI (Key Performance Indicator) olarak kullanılan marka değeri(brand  equity) değerleri kullandı.

İlk olarak 1.500.000′lik sosyal medya datası text mining teknikleri ile analiz edilerek yaklaşık olarak 5000′lik bir kelime grubuna indirgendi. Daha sonra yapılan kümeleme analizleri ile yaklaşık olarak 150 değişkenlik yeni etiket(tag) ler oluşturuldu. Bu etiketlerin haftalık değişim değerleri ile KPI olarak kullanılan marka değeri arasında anlamlı olabilecek ilişkileri araştırmaya başladık.

Bu tür ilişkileri yakalamak için yalnızca etiketlerin (sosyal medyada o marka hakkında konuşulanlar) o haftaya olan etkileri değil zamana yayılmış stoketki dedğimiz taşınma etkisini de hesaba katıldı. Modelleme aşamasında ise geleneksel regresyon v.b gibi teknikler yerine bize daha kısa sürede çok daha fazla model çalışmamıza olanak veren genetik algoritma tekniklerinden yararlandık. Yaklaşık 200.000 model test edildi ve açıklama gücü en yüksek olan 15 model seçildi. Bunların arasından da ileriye yönük tahmin gücü en yüksek olan tek model ile devam ettik. Peki bu modelleme çalışması bize ne sağladı?

  1. Sosyal medya da markamız hakkında konuşulan yüzlerce konu yerine marka değerimizi artırıp/azaltma da en etkili konulara odaklanmamızı
  2. Marka değerimiz üzerinde etkili olan konulardaki artış ve azalış sayılarına bakarak ileriye yönelik marka değeri skorumuzu önceden tahmin etmeyi . Bu sayede sosyal medya datasını erken uyarı(early indicator) sistemi olarak kullanmayı.

Verinin gerçek değeri okyanusta yüzen bir buzdağı gibidir. İlk bakışta sadece çok ufak bir kısmı görünürken, büyük bölümü yüzeyin altında gizlidir. Bunu anlayan ve anlamlandıran innovatif şirketler gizli değeri çıkarabilir ve potansiyel olarak çok büyük fayda sağlayabilir.

Yazar : Serkan Ceran

Ipsos Pazarlama Bilimi Direktörü olan Serkan Ceran, Şişli Terakki Lisesi’nin ardından Mimar Sinan Üniversitesi istatistik Bölümünde lisans eğitimini tamamlamıştır. Bilgi Üniversitesinde Listening to Customer, Michigan Üniversitesinde Model Thinking ve Johns Hopkins Universitesinde The Data Scientist’s Toolbox sertifika programları ile eğitimine devam eden Serkan’ın uzmanlık alanları arasında kestirimsel analitik, non-linear modelleme, marketing mix modelleme, ROI/ROMI ve reklam etkinliğinin ölçülmesi, ve fiyatlama araştırmaları yer almaktadır. Yaklaşık 18 yıldır araştırma sektöründe olan Serkan dönem dönem Arçelik, Turkcell, Digiturk ve Coca-Cola gibi kilit müşterileri yönetmiş 2014 yılı başından beri de Ipsos Pazarlama Bilimi Modelleme ve Fiyatlama bölümünü yönetmektedir.

Kasım 24, 2014

0

Blog ve Yorumlar, Bültenler

Diğer yazıları okuyun

Yorum yazın