0 oy
30 gösterim
Veri biliminde bazı sütunların içindeki bilgilerin sayısal değer olarak kalmaması ve bunların ikilik (binary) sisteme çevrilmesi isteniyor. Bunun tam olarak sebebi nedir? ve nasıl yapılabilir?
Veri Bilimi kategorisinde (4k puan) | 30 gösterim

1 cevap

0 oy

Birçok makine öğrenmesi algoritması kategorik verilerle doğrudan çalışamaz, makine hangi verilere nasıl değerler verileceğini anlayamıyor. O yüzden en sağlıklı yöntem verileri ikili(binary) sisteme çevirmek oluyor. Sayısal veriler makine öğrenmesi algoritmalarında daha verimli bir kullanım sağlanıyor.

veri setimizdeki 'sutun1' kolonunda 'a' ve 'b' diye iki farklı değeri binary sisteme çevirme yöntemleri

from sklearn.preprocessing import OneHotEncoder
ohe = OneHotEncoder(sparse=False)
sutun1 = ohe.fit_transform(data[sutun1])

ya da

data.sutun1 = [1 if each == "a" else 0 for each in data.sutun1]

umarım yazdıklarım işinize yarar. Kolay gelsin :)

(188 puan)

İlgili sorular

0 oy
1 cevap
0 oy
1 cevap
13 Temmuz 2016 Sunucular kategorisinde kenan (4k puan) sordu | 40 gösterim