+1 oy
32 gösterim
Veri analizinde bahsi geçen 3 farklı problem var

- Dummification (one hot encoding)
- Overfitting
- Imputing

Bu problemleri biraz anlatabilecek kimse var mı?
Veri Bilimi kategorisinde (3.9k puan) | 32 gösterim

1 cevap

0 oy
One Hot Encoding; Bildiğim kadarıyla kategorisel değişkenlerin ikili (binary) olarak temsil edilmesi anlamına gelmektedir. Örneğin Kediler=0, Köpekler=1 gibi.

(Underfitting) Yetersiz Uyum; Modelimizde veri setimizdeki önemli özellikleri yakalayamayıp gerekli öğrenmeyi yapamamamız demektir. Daha fazla veri kullanılarak ya da daha karmaşık bir model kullanılarak çözülebilir bir durumdur.

(Overfitting) Aşırı Uyum; Modelimiz, veri setinin üzerinde gereğinden fazla çalışıp ezber yapmaya başlamışsa aşırı uyumluluktan dolayı düşük skor alabiliriz. Çünkü model veri setindeki (datasetteki) verilerin bire bir kopyalarını arar.

Imputing; Eksik verilerin yerine uygun veriler üretilmesi durumudur diyebiliriz. Örneğin bir veri setimizdeki maas değeri bilinmeyen "a" elemanı olduğunu varsayalım. Yapacağımız Imputing işlemine göre "a" elemanına şirketin ortalama maaş değerini ya da belirlediğimiz maas değerini atıyabiliriz.
(201 puan)

İlgili sorular

0 oy
1 cevap
8 Nisan Java kategorisinde heyamigoo (102 puan) sordu | 27 gösterim
+1 oy
1 cevap
0 oy
1 cevap
21 Temmuz 2018 Java kategorisinde tolgacelik.art (1.8k puan) sordu | 42 gösterim