Doğrudan satış sektöründe veri madenciliği teknikleri ile müşteri kayıp analizi
Küçük Resim Yok
Tarih
2019
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Beykent Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada, bir doğrudan satış firmasından temin edilen Temsilci verileri kullanılmıştır. Temin edilen veriler üzerinde veri madenciliği yöntemlerinden olan sınıflandırma algoritmaları ile müşteri kayıp analizi yapılmıştır. Analiz yapılırken Veri Madenciliği için Çapraz Endüstri Standard Süreç Modeli (CRISP) adımları takip edilmiş ve uygulanmıştır. Çalışmada sınıflandırma algoritmalarından karar ağaçları tercih edilmiş, C4.5 karar ağacı ve Gini karar ağacı algoritmaları kullanılmıştır. C4.5 karar ağacı ve Gini karar ağacı algoritması ile elde edilen modellerin performansları hold-out performans yöntemi ile ölçülmüş ve değerlendirilmiştir. Hold-out yöntemi ile veri seti sırasıyla eğitim ve test veri seti olmak üzere %90-%10, %80-%20, %70-%30, %60-%40 oranlarıyla ayrılmıştır. Yapılan analiz çalışmasında R programlama dili kullanılmıştır.
All representative data is obtained from a direct sales company for this study. Customer loss has been calculated, by classification algorithms which are data mining methods, with the data provided. Cross Industry Standard Process Model (CRISP) steps is followed for the data mining while analyzing. Decision trees have been chosen from classification algorithms. In addition to this C4.5 decision tree and Gini decision tree algorithms were used in this study. The performance of the models obtained by C4.5 decision tree and Gini decision tree algorithms were measured and evaluated by hold-out performance method. The data set is separated with hold-out method by %90-%10, %80-%20, %70-%30, %60-%40 respectively. R programming language has been used for the analysis conducted.
All representative data is obtained from a direct sales company for this study. Customer loss has been calculated, by classification algorithms which are data mining methods, with the data provided. Cross Industry Standard Process Model (CRISP) steps is followed for the data mining while analyzing. Decision trees have been chosen from classification algorithms. In addition to this C4.5 decision tree and Gini decision tree algorithms were used in this study. The performance of the models obtained by C4.5 decision tree and Gini decision tree algorithms were measured and evaluated by hold-out performance method. The data set is separated with hold-out method by %90-%10, %80-%20, %70-%30, %60-%40 respectively. R programming language has been used for the analysis conducted.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control