0 oy
29 gösterim

Python'da çektiğim verileri kıyaslamak istiyorum. ancak rakamlar arasında çok fark olduğu için oranlama yapacağım zaman baskınlık çıkıyor. bunları normalize edebiliyormuşuz galiba ama bulamadım. Mesela bir değerim 12 iken aynı kolonum da 2458 gibi bir değerim var. aradaki fark yüzünden baskınlığı nasıl indirgeyebilirim?

 
kapalı
Python kategorisinde (206 puan)
kapalı | 29 gösterim

1 cevap

0 oy
En İyi Cevap

örneğin .csv uzantılı dataset'inden "rakamlar" kolonunu çekelim ve normalizasyonma sokarak bu değerleri 0 ile 1 arasına indirgeyelim. Bu yöntem sayesinde rakamların kendileri arasındaki otorite  ve büyük farklar kırılır.


x1 = data.drop(["rakamlar"],axis=1)
x = (x1 - np.min(x1))/(np.max(x1)-np.min(x1)).values

 

(206 puan)
eğer sklearn kullanıyorsan standardscaler diye bir sınıf var. Bu sınıf verdiğin collection içindeki değerleri otomatik 0-1 arasına indiriyor. Onu da deneyebilirsin.
bir dahakine onu da deneyeceğim. teşekkürler