Tasarruf Finansmanı Sektöründe Makine Öğrenmesi Tabanlı Müşteri Segmentasyonu ve Ayrılma Eğilimli Müşteri Tahmini


Keywords:
Müşteri Segmentasyonu, Churn Analizi, Tasarruf Finansmanı, Veri Madenciliği, Xgboost, K-Means, Makine ÖğrenmesiAbstract
Bu çalışmada, bir tasarruf finansmanı şirketine ait müşteri verileri kullanılarak müşteri
segmentasyonu ve ayrılma eğilimli müşteri (churn) tahmini gerçekleştirilmiştir. Çalışmanın amacı, farklı
müşteri gruplarını davranışsal ve demografik özelliklerine göre ayırt ederek, ayrılma eğilimi gösteren
bireyleri önceden tespit etmek ve bu sayede şirketin müşteri ilişkileri yönetimine veri temelli katkı
sunmaktır. Veri madenciliği tekniklerinden K-means kümeleme algoritması ile dört ana müşteri segmenti
oluşturulmuş; bu segmentler gelir seviyesi, memnuniyet düzeyi, ödeme alışkanlığı ve tasarruf tipi gibi
değişkenler açısından anlamlı farklar göstermiştir. Churn tahmini için Lojistik Regresyon, Karar Ağaçları
ve XGBoost algoritmaları karşılaştırmalı olarak uygulanmıştır. XGBoost modeli %91 doğruluk ve %0.91
AUC skoru ile en yüksek performansı göstermiştir. Özellik önem analizine göre en belirleyici değişkenler
öne çıkarılmıştır. Segmentasyon ve tahmin çıktıları birlikte değerlendirildiğinde, yüksek riskli müşteri
gruplarının belirginleştiği görülmektedir. Elde edilen bulgular, tasarruf finansmanı sektöründe müşteri
sadakati yönetimi, hedefli pazarlama ve erken uyarı sistemlerinin geliştirilmesine yönelik önemli öngörüler
sunmaktadır. Çalışma, tasarruf finansmanı alanında veri madenciliği yöntemlerinin uygulanabilirliğini
gösteren özgün ve öncü bir örnek niteliği taşıması anlamında da önemlidir.
Downloads
References
Q. He, Y. Yang, and R. Wang, “Interest-free financing models: A systematic review,” J. Islam. Financ. Stud., vol. 7, no. 1, pp. 12–28, 2021.
A. Khosravi and A. Asgari, “Customer retention modeling in cooperative financing firms,” Int. J. Financ. Manag., vol. 6, no. 3, pp. 101–117, 2020.
K. Huang, J. Zhang, and Y. Li, “A comparative study of churn prediction models in subscription-based businesses,” Expert Syst. Appl., vol. 148, 2020.
N. Brahim, R. Saidi, and M. Ammar, “Machine learning-based customer segmentation: An empirical approach,” Int. J. Data Anal. Tech. Strateg., vol. 12, no. 1, pp. 43–60, 2020.
A. Vidyarthi, M. Rao, and S. Shukla, “Behavioral segmentation using clustering techniques: An application in banking,” Procedia Comput. Sci., vol. 167, pp. 2722–2731, 2019.
L. Zhou, W. Wang, and Y. Wu, “A comprehensive review on customer segmentation using machine learning,” Inf. Sci. (Ny)., vol. 512, pp. 334–357, 2020.
C. Jiang, J. Li, and X. Liu, “Clustering-based segmentation and prediction for financial customers,” Appl. Intell., vol. 50, pp. 1375–1388, 2020.
Y. Liu, H. Zhang, and T. Chen, “Customer segmentation via K-means and ensemble learning: Empirical evidence from retail banking,” Neural Comput. Appl., vol. 32, pp. 10123–10136, 2020.
H. Cheng, Y. Lu, and C. Sheu, “Predicting customer segmentation using deep learning: A case in e-finance,” Decis. Support Syst., vol. 107, pp. 103–114, 2018.
M. López, A. Romero, and A. Sánchez, “Churn prediction using explainable artificial intelligence: A telecom case,” Expert Syst. Appl., vol. 183, 2021.
J. McKee, L. Sutherland, and D. Thompson, “Understanding subscription churn: Behavioral and transactional indicators,” J. Bus. Res., vol. 119, pp. 489–497, 2020.
R. Bauer, P. Kosinski, and Z. Piech, “Advanced churn modeling with XGBoost and SHAP,” in Proc. Int. Conf. Machine Learning for Business, 2021, pp. 104–112.
K. Zhang, Q. Yang, and Z. Li, “Optimizing retention through predictive churn analytics,” J. Retail. Consum. Serv., vol. 51, pp. 98–106, 2019.
F. Yuan, J. Wu, and L. Wang, “Decision support for customer retention using hybrid methods,” Inf. Syst. Front., vol. 23, pp. 1183–1200, 2021.
E. Öztürk and Y. Kaya, “Tasarruf finansmanı sistemlerinin Türkiye’deki gelişimi ve yapay veriyle öngörü analizi,” Finans. Araştırmalar ve Çalışmalar Derg., vol. 12, no. 2, pp. 44–57, 2020.
G. Ünal and S. Yılmaz, “Finansal sektörlerde makine öğrenmesi ile müşteri davranışı tahmini,” YBS Derg., vol. 8, no. 1, pp. 25–37, 2020.
R. J. A. Little and D. B. Rubin, Statistical Analysis with Missing Data, 3rd ed. Wiley, 2019.
A. R. T. Donders, G. J. van der Heijden, T. Stijnen, and K. G. Moons, “A gentle introduction to imputation of missing values,” J. Clin. Epidemiol., vol. 59, no. 10, pp. 1087–1091, 2006.
J. Harris, “One-hot encoding categorical variables,” 2011.
X. Zhang, “Label Encoding and One-Hot Encoding,” 2013.
J. W. Tukey, Exploratory Data Analysis. Addison-Wesley, 1977.
J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufmann, 2011.
A. K. Jain, M. N. Murty, and P. J. Flynn, “Data clustering: A review,” ACM Comput. Surv., vol. 31, no. 3, pp. 264–323, 2000.
J. Burez and D. den Poel, “Customer lifetime value modeling and its application to churn prediction,” J. Interact. Mark., vol. 23, no. 1, pp. 57–69, 2009.
Y. Xie, J. Lee, and T. Chen, “Feature engineering for predicting customer churn: A survey,” Int. J. Mach. Learn., vol. 60, no. 4, pp. 223–244, 2011.
J. Dougherty, “Feature selection in machine learning: Empirical evidence,” Mach. Learn. Rev., vol. 17, no. 2, pp. 145–157, 2016.
C. M. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.
A. Agresti, Statistical Methods for the Social Sciences, 5th ed. Pearson, 2018.
I. Guyon and A. Elisseeff, “An introduction to variable and feature selection,” J. Mach. Learn. Res., vol. 3, pp. 1157–1182, 2003.
R. Kohavi, “A study of cross-validation and bootstrap for accuracy estimation and model selection,” in Proc. IJCAI, 1995, pp. 1137–1143.
N. V Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, “SMOTE: Synthetic minority over-sampling technique,” J. Artif. Intell. Res., vol. 16, no. 1, pp. 321–357, 2002.
G. James, D. Witten, T. Hastie, and R. Tibshirani, An Introduction to Statistical Learning. Springer, 2013.
D. W. Hosmer, S. Lemeshow, and R. X. Sturdivant, Applied Logistic Regression. Wiley, 2013.
L. Breiman, “Random Forests,” Mach. Learn. 2001 451, vol. 45, no. 1, pp. 5–32, Oct. 2001, doi: 10.1023/A:1010933404324.
T. Chen and C. Guestrin, “XGBoost: A scalable tree boosting system,” in Proc. 22nd ACM SIGKDD Int. Conf. Knowledge Discovery and Data Mining, 2016, pp. 785–794.
R. L. Thorndike, “Who belongs in the family?,” Psychometrika, vol. 18, no. 4, pp. 267–276, 1953.
M. Wedel and W. A. Kamakura, Market Segmentation: Conceptual and Methodological Foundations, 2nd ed. Springer, 2012.
F. F. Reichheld and W. E. Sasser, “Zero defections: Quality comes to services,” Harv. Bus. Rev., vol. 68, no. 5, pp. 105–111, 1990.
T. L. Keiningham, L. Aksoy, B. Cooil, and T. W. Andreassen, “Linking customer satisfaction to the bottom line,” MIT Sloan Manag. Rev., vol. 44, no. 4, pp. 73–78, 2007.
A. Lemmens and C. Croux, “Bagging and boosting classification trees to predict churn,” J. Mark. Res., vol. 43, no. 2, pp. 276–286, 2006.