Makine Öğrenmesi ve Özellik Seçimi ile Anemi Hastalığı Sınıflandırması


Abstract views: 450 / PDF downloads: 26

Authors

  • Kerim Berkay BUÇAN Bandırma Onyedi Eylül Üniversitesi
  • Serhat KILIÇARSLAN Bandırma Onyedi Eylül Üniversitesi

Keywords:

Anemi Hastalığı, Sınıflandırma, Özellik Seçimi, Makine Öğrenmesi

Abstract

Anemi, kandaki kırmızı kan hücrelerinin veya hemoglobin seviyesinin vücudun ihtiyaç duyduğu
oksijeni taşıyamayacak kadar düşük olduğu yaygın bir sağlık sorunudur. Bu durum, yorgunluk, baş
dönmesi ve nefes darlığı gibi belirtilerle kendini gösterirken, özellikle çocuklar, kadınlar ve yaşlılar gibi
hassas gruplarda daha ciddi etkiler yaratmaktadır. Geleneksel anemi teşhis yöntemleri, zaman alıcı ve
maliyetli olması nedeniyle sınırlı sağlık kaynaklarına sahip bölgelerde uygulanabilirliği kısıtlıdır. Bu
çalışmada, anemi teşhisinde makine öğrenmesi yöntemlerinin ve özellik seçimi tekniklerinin
uygulanabilirliği incelenmiştir. Veri seti 15.300 bireyden oluşmaktadır. Farklı yaş ve cinsiyet
gruplarından bireylerin hematolojik ve biyokimyasal özelliklerini içermektedir. Bu çalışmada, özellik
seçimi için Korelasyon Matrisi, Recursive Feature Elimination ve Boruta algoritmaları uygulanmış ve
elde edilen özellikler, Random Forest, Gradient Boosting Machine , XGBoost, Karar Ağacı ve Lojistik
Regresyon makine öğrenmesi modelleri üzerinde değerlendirilmiştir. Deneysel sonuçlar, Gradient
Boosting Machine modelinin %99,97 doğruluk, %99,97 duyarlılık, %100 özgüllük ve %99,97 F1 skoru
ile en yüksek performansı sergilediğini ortaya koymuştur. Özellikle Gradient Boosting Machine modeli,
hem Boruta algoritmasıyla hem de Korelasyon Matrisiyle seçilen özellikler üzerinde bu üstün
performansı göstermiştir. XGBoost modeli ise %99,90 doğruluk, %99,91 duyarlılık, %100 özgüllük ve
%99,90 F1 skoru ile GBM’in hemen ardından gelmiştir. Bu model, Korelasyon ve Boruta
algoritmalarıyla seçilen özelliklerle etkili sonuçlar sağlamıştır. Karar Ağacı modeli, %99,90 doğruluk,
%99,90 duyarlılık, %100 özgüllük ve %99,90 F1 skoru ile XGBoost modeliyle benzer performans
sergilemiştir ve en iyi sonuçlarını Boruta algoritmasıyla seçilen özellikler üzerinde göstermiştir.

Downloads

Download data is not yet available.

Author Biographies

Kerim Berkay BUÇAN, Bandırma Onyedi Eylül Üniversitesi

Yazılım Mühendisliği / Lisansüstü Eğitim Enstitüsü, Türkiye

Serhat KILIÇARSLAN, Bandırma Onyedi Eylül Üniversitesi

Yazılım Mühendisliği / Mühendislik ve Doğa Bilimleri Fakültesi, Türkiye

References

J. Fitriany and A. I. Saputri, "Anemia Defisiensi Besi," AVERROUS: Jurnal Kedokteran dan Kesehatan Malikussaleh, vol. 4, no. 2, pp. 1–14, Nov. 2018.

S. Dogan and I. Turkoglu, "Iron-Deficiency Anemia Detection From Hematology Parameters By Using Decision Trees," International Journal of Science & Technology, vol. 3, pp. 85–92, Jan. 2008.

M. Dugdale, "Anemia," Obstetrics and Gynecology Clinics of North America, vol. 28, no. 2, pp. 363–382, Jun. 2001.

S. Kilicarslan, M. Celik, and S. Sahin, "Hybrid models based on genetic algorithm and deep learning algorithms for nutritional Anemia disease classification," Biomedical Signal Processing and Control, vol. 63, Jan. 2021.

E. R. Eichner, "Observations on Iron, Anemia, and Sickle Cell Trait," Current Sports Medicine Reports, vol. 16, no. 1, p. 2, Feb. 2017.

N. Yağmur, H. Temurtaş, and İ. Dağ, "Anemi Hastalığının Yapay Sinir Ağları Yöntemleri Kullanılarak Sınıflandırılması," Journal of Scientific Reports-B, no. 008, pp. 20–34, Dec. 2023.

R. Vohra, A. Hussain, A. K. Dudyala, J. Pahareeya, and W. Khan, "Multi-Class Classification Algorithms for the Diagnosis of Anemia in an Outpatient Clinical Setting," PLOS ONE, vol. 17, no. 7, Jul. 2022.

P. Verma and V. Chopra, "A Review on Machine Learning Algorithms for Anemia Disease Prediction," International Research Journal, vol. 4, no. 5, 2022.

J. R. Khan, S. Chowdhury, H. Islam, and E. Raheem, "Machine Learning Algorithms To Predict The Childhood Anemia In Bangladesh," Journal of Data Science: JDS, vol. 17, pp. 195–218, Jan. 2019.

M. Hasan, M. S. Tahosin, A. Farjana, M. A. Sheakh, and M. M. Hasan, "A Harmful Disorder: Predictive and Comparative Analysis for Fetal Anemia Disease by Using Different Machine Learning Approaches," in Proc. 2023 11th International Symposium on Digital Forensics and Security (ISDFS), 2023, pp. 1–6.

B. Sen, A. Ganesh, A. Bhan, S. Dixit, and A. Goyal, "Machine Learning Based Diagnosis and Classification of Sickle Cell Anemia in Human RBC," in Proc. 2021 Third International Conference on Intelligent Communication Technologies and Virtual Mobile Networks (ICICV), 2021, pp. 753–758.

D. C. E. Saputra, K. Sunat, and T. Ratnaningsih, "A New Artificial Intelligence Approach Using Extreme Learning Machine as the Potentially Effective Model to Predict and Analyze the Diagnosis of Anemia," Healthcare, vol. 11, no. 5, Jan. 2023.

Y. Zhang, Y. Zhou, D. Zhang, and W. Song, "A Stroke Risk Detection: Improving Hybrid Feature Selection Method," Journal of Medical Internet Research, vol. 21, no. 4, Apr. 2019.

M. S. Singh and P. Choudhary, "Stroke Prediction Using Artificial Intelligence," in Proc. 2017 8th Annual Industrial Automation and Electromechanical Engineering Conference (IEMECON), 2017, pp. 158–161.

"Risk Detection of Stroke Using a Feature Selection and Classification Method," IEEE Journals & Magazine.

S. Buyrukoğlu and A. Akbaş, "Machine Learning Based Early Prediction of Type 2 Diabetes: A New Hybrid Feature Selection Approach Using Correlation Matrix with Heatmap and SFS," Balkan Journal of Electrical and Computer Engineering, vol. 10, no. 2, pp. 110–117, Apr. 2022.

K. Yan and D. Zhang, "Feature Selection and Analysis on Correlated Gas Sensor Data with Recursive Feature Elimination," Sensors and Actuators B: Chemical, vol. 212, pp. 353–363, Jun. 2015.

M. Hasan, P. Roy, and A. M. Nitu, "Cervical Cancer Classification Using Machine Learning with Feature Importance and Model Explainability," in Proc. 2022 4th International Conference on Electrical, Computer & Telecommunication Engineering (ICECTE), 2022, pp. 1–4.

A. Karuppasamy, A. Abdesselam, R. Hedjam, H. Zidoum, and M. Al-Bahri, "Feed-Forward Networks Using Logistic Regression and Support Vector Machine for Whole-Slide Breast Cancer Histopathology Image Classification," Intelligence-Based Medicine, vol. 9, Jan. 2024.

H. Ren, T. Yang, X. Yin, L. Tong, J. Shi, J. Yang, Z. Zhu, and H. Li, "Prediction of High-Level Fear of Cancer Recurrence in Breast Cancer Survivors: An Integrative Approach Utilizing Random Forest Algorithm and Visual Nomogram," European Journal of Oncology Nursing, vol. 70, Jun. 2024.

D. D. Rufo, T. G. Debelee, A. Ibenthal, and W. G. Negera, "Diagnosis of Diabetes Mellitus Using Gradient Boosting Machine (LightGBM)," Diagnostics, vol. 11, no. 9, Sep. 2021.

A. Ogunleye and Q.-G. Wang, "XGBoost Model for Chronic Kidney Disease Diagnosis," IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 17, no. 6, pp. 2131–2140, Nov. 2020.

A. K. Jakhar, A. Gupta, and M. Singh, "SELF: A Stacked-Based Ensemble Learning Framework for Breast Cancer Classification," Evolutionary Intelligence, vol. 17, no. 3, pp. 1341–1356, Jun. 2024.

Google Colab website. [Online]. Available: https://colab.research.google.com/

Downloads

Published

2024-12-18

How to Cite

BUÇAN, K. B., & KILIÇARSLAN, S. (2024). Makine Öğrenmesi ve Özellik Seçimi ile Anemi Hastalığı Sınıflandırması. International Journal of Advanced Natural Sciences and Engineering Researches, 8(11), 473–485. Retrieved from https://as-proceeding.com/index.php/ijanser/article/view/2315

Issue

Section

Articles