Buğday Tohumu Sınıflandırmasının Karar Ağacı Algoritmasıyla Gerçekleştirilmesi ve Değişken Eğitim Verisine Göre Başarı Kıyaslaması


Keywords:
Makine öğrenmesi, Karar Ağacı, F1 Skor, Sınıflandırma, Öznitelik, Buğday TohumuAbstract
Buğday, tüm dünyada gıda alanında en önemli bir tahıl türüdür. İnsanlık için ihtiyaç olan birçok gıdanın temel yapı taşı buğdaya ve buğday alt ürünlerine bağlıdır. Buğday türlerini tanımlamak ve sınıflandırmak kalite kontrol sürecinde çok önemli bir aşamayı göstermektedir. Kalite sınıflandırmasının yapılması verimliği arttıran en önemli aşamadır. Çünkü buğday türleri, farklı biçimlerde işlenerek farklı alt ürünler oluşturulmaktadır. Buğday sınıflandırması çoğu ülkede hala çalışanlar tarafından görsel inceleme sonucu elle sınıflandırılmaktadır. Bu durum hem zaman alıcıdır hem de güvenilirlik düzeyi düşüktür. Makine öğrenme algoritmaları sınıflandırma işlemlerinde sıklıkla kullanılmaktadır. Makine öğrenme algoritmalarıyla, önceden hazırlanmış veri seti bilgilerine karar verilip sınıflandırma yapılabilmektedir. Bu çalışmada, UCI (University of California, Irvine) veri depolama alanında açık kaynak olarak yayınlanmış olan buğday tohumu (Wheat Seed) veriş eti kullanılmıştır. Bu veri seti içinde Kama, Rosa ve Kanada buğday sınıflarına ait 210 kayıt vardır. Her bir kayıt için 7 adet öznitelik bilgisi yer almaktadır. Çalışmada, buğday tohumu seti üzerinde makine öğrenme algoritmalarından biri olan C4.5 karar ağacı algoritması kullanılmıştır. Sınıflandırma başarı metriği için F1 score kullanılmıştır. F1 skor başarı metriği kullanılarak güvenilir ve tutarlı başarı sonuçları elde edilmektedir. Elde edilen sonuçlara göre en yüksek F1 skor başarı metriğine göre 0.903 bulunmuştur. Çalışmada, ek olarak farklı eğitim ve test verisi boyutlarına göre F1 skor başarı metriği sonuçları elde edilerek, kıyaslama yapılmıştır.
Downloads
References
A, Khatri, S. Agrawal, J. Chatterjee (2022). “Wheat
Seed Classification: Utilizing Ensemble Machine
Learning Approach”, Scientific Programming, 2022: 1
A. Çelik, “Determination of the Classification Success
of KNN Algorithm Distance Metric Methods on Wheat
Seeds Dataset”, Afyon Kocatepe Üniversitesi Fen Ve
Mühendislik Bilimleri Dergisi, 2023, 23: 1142–1149.
A. Eldem. “An Application of Deep Neural Network for
Classification of Wheat Seeds”, Avrupa Bilim Ve
Teknoloji Dergisi, 2020, 19: 213-220.
H. Küçükönder, K.K, Vursavuş, F. Üçkardeş. “K-Star,
Rastgele Orman ve Karar Ağacı (C4.5) Sınıflandırma
Algoritmaları ile Domatesin Renk Olgunluğu Üzerinde
Bazı Mekanik Özelliklerin Etkisinin Belirlenmesi”,
Türk Tarım–Gıda Bilim ve Teknoloji Dergisi, 2015, 3:
-306.
T. Kavzoğlu, İ. Çölkesen. “Karar Ağaçları İle Uydu
Görüntülerinin Sınıflandırılması: Kocaeli Örneği”,
Harita Teknolojileri Elektronik Dergisi, 2010, 2: 36-45.
G. Andrienko, N. Andrienko. “GIS Visualization
Support To The C4. 5 Classification Algorithm of
KDD”, In Proceedings of the 19th International
Cartographic Conference, pp: 1-7, 14-21 August 1999,
Ottawa.
E. Akbal, Ş. Doğan, N. Varol, “Karar Ağaçları ile
Telefon Dolandırıcılığı Verilerinin Analizi”, Fırat
Üniversitesi Mühendislik Bilimleri Dergisi, 2017, 29:
–177.
D. Dua, C. Graff. “UCI Machine Learning Repository.
Irvine, CA: University of California”, School of
Information and Computer Science, 2019.
[9]: University of California, [Online]. UCI UCI
Machine
Learning
Repository,
https://archive.ics.uci.edu/ml/datasets/seeds
11.2023)
Available:
(accessed
M. Charytanowicz, J. Niewczas, P. Kulczycki, P.A.
Kowalski, S. Lukasik, S. Zak. “A Complete Gradient
Clustering Algorithm for Features Analysis of X-ray
Images”, Information Technologies in Biomedicine,
Springer-Verlag, Germany, pp. 15-24. 2010.
A. Kayabasi, A. Toktas, K. Sabanci, E. Yigit.
“Automatic classification of agricultural grains:
Comparison of neural networks”, Neural New World,
, 28: 213-224.
Lipton, Zachary & Elkan, Charles & Narayanaswamy,
Balakrishnan. “F1-Optimal Thresholding in the Multi
Label
Setting”,
https://arxiv.org/abs/1402.1892
arxiv:
S. Demirel, “Makine Öğrenme Algoritmalarıyla
Akciğer X-Ray Görüntü Özniteliklerini Kullanarak
Pnömoni Tespiti ve Sınıflandırılması”, Yüksek Lisans
Tezi, Kütahya Dumlupınar Üniversitesi, Kütahya, 2022.
V. Yarğı, S. Postalcıoğlu, “EEG İşareti Kullanılarak
Bağımlılığa Yatkınlığın Makine Öğrenmesi Teknikleri
ile Analizi”, ECJSE, 2021, 8: 142–154..
W. Powers, A. Ailab, “Evaluation: from precision,
recall and F-measure to ROC informedness, markedness
and correlation”, J. Mach. Learn. Technolgy, 2008, 2:
-3981.