YAPAY BAĞIŞIKLIK SİSTEMİ TABANLI YENİ BİR AZ ÖRNEKLEME YÖNTEMİ
Abstract views: 46 / PDF downloads: 64
Keywords:
Ainet Algoritması, Az Örnekleme, Dengesiz Veri Seti, Sınıflandırma, Yapay Bağışıklık SistemiAbstract
Verilerden bilgi çıkarımı ve bu çıkarımlar baz alınarak yapılan çalışmalar gün geçtikçe yaygınlaşmaktadır. Veri setleri üzerinde öğrenme, sınıflandırma, kümeleme gibi işlemler uygulanması ve sağlıklı modellerin oluşturulması büyük önem taşımaktadır. Günümüzde kullanılan gerçek dünya verilerindeki en önemli sorunlardan biri dengesiz veri setleridir. Dengesiz veri seti, örneklem içerisindeki sınıf dağılımları arasındaki dengesizlikten doğar. Bir veri setinde sınıf etiketlerinin dağılımının birbirine yakın değerler olmaması durumunda bu veri seti dengesiz bir veri seti (Imbalanced Dataset) olarak kabul edilir. Bu çalışmada, veri kümesindeki bu dengesizliği gidermek için literatürde önerilen çözümlerden çoğunluk sınıfına uygulanan Az Örnekleme (Undersampling) tekniği baz alınmıştır. Az örnekleme işlemi için yapay bağışıklık algoritmalarından aiNet algoritmasının bu konuda yeni bir yöntem olacağı öngörülmüştür. Yapay bağışıklık sistemi; vücuda giren antijenler, vücutta üretilen antikorlar ve bağışıklık kazanıldıktan sonra oluşturulan hafıza hücreleri gibi temel özellikleri baz alınarak tasarlanmıştır. Veri setindeki çoğunluk sınıfına aiNet algoritması uygulandığında elde edilen hafıza matrisi, veri setindeki çoğunluk sınıfının yapısal organizasyonu temsil etmiştir. Önerilen yöntem tiroit veri seti üzerine uygulanmıştır. KNN sınıflandırma algoritması hem orijinal veri setine hem de azaltılmış veri setine uygulanmıştır. Başarı ölçütü olarak doğruluk, kesinlik, duyarlılık ve F1 skoru değerleri her iki durum içinde ayrı ayrı hesaplanmıştır. Sonuçlar göstermiştir ki, aiNet algoritması veriyi temsil yeteneğini kaybetmeden başarılı bir şekilde indirgemiştir.