Close
Uczenie maszynowe: przygotowanie danych – kodowanie zmiennych kategorialnych

Uczenie maszynowe: przygotowanie danych – kodowanie zmiennych kategorialnych

Jak już wiemy z poprzednich wpisów w uczeniu maszynowym wyróżniamy następujące  rodzaje zmiennych: ilościowe, kategorialne oraz mieszane.  I o ile ze zmiennymi ilościowymi (numerycznymi) modele radzą sobie dość dobrze, bo przecież w końcu operują na liczbach, to pozostałe rodzaje zmiennych dla opracowywanych modeli trzeba odpowiednio przygotować. Stąd też w obecnym wpisie kodowanie zmiennych kategorialnych będzie…

Uczenie maszynowe: przygotowanie danych – brakujące dane

Uczenie maszynowe: przygotowanie danych – brakujące dane

W praktyce wielokrotnie zdarza się, że gdy zaczynamy analizować otrzymany czy też pozyskany z różnych źródeł zbiór danych okazuje się, że w wielu miejscach spotykamy się z ich brakiem. Brakujące dane w zbiorze to jeden z elementów, na który musimy zwrócić uwagę na etapie przygotowania danych (ang. data preprocessing). Ciąg działań w uczeniu maszynowym przedstawiłem…