Birçok makine öğrenmesi algoritması kategorik verilerle doğrudan çalışamaz, makine hangi verilere nasıl değerler verileceğini anlayamıyor. O yüzden en sağlıklı yöntem verileri ikili(binary) sisteme çevirmek oluyor. Sayısal veriler makine öğrenmesi algoritmalarında daha verimli bir kullanım sağlanıyor.
veri setimizdeki 'sutun1' kolonunda 'a' ve 'b' diye iki farklı değeri binary sisteme çevirme yöntemleri
from sklearn.preprocessing import OneHotEncoder
ohe = OneHotEncoder(sparse=False)
sutun1 = ohe.fit_transform(data[sutun1])
ya da
data.sutun1 = [1 if each == "a" else 0 for each in data.sutun1]
umarım yazdıklarım işinize yarar. Kolay gelsin :)