Differenza tra scaler standard e MinMaxScaler

2022-07-29 12:30:11

Qual ​​è la differenza tra MinMaxScaler e scaler standard.

MMS= MinMaxScaler(feature_range = (0, 1)) ( Usato nel Programma 1)

sc = StandardScaler() ( In un altro programma usavano Standard scaler e non minMaxScaler)

- Chakra

Source
Risposta


32
  • Da sito ScikitLearn:

    StandardScaler rimuove la media e ridimensiona i dati in base alla varianza unitaria. Tuttavia, i valori anomali hanno un'influenza nel calcolo dell'empirico media e deviazione standard che riducono l'intervallo della caratteristica valori come mostrato nella figura a sinistra sotto. Si noti in particolare quello poiché i valori anomali su ciascuna caratteristica hanno magnitudini diverse, il la diffusione dei dati trasformati su ciascuna caratteristica è molto diversa: la maggior parte dei dati si trovano nell'intervallo [-2, 4] per il reddito mediano trasformato caratteristica mentre gli stessi dati sono compressi nel più piccolo [-0.2, 0.2] intervallo per il numero trasformato di famiglie.

    StandardScaler pertanto non può garantire una scalabilità bilanciata delle funzionalità la presenza di valori anomali.

    MinMaxScaler ridimensiona il set di dati in modo che tutti i valori delle funzioni siano presenti l'intervallo [0, 1] come mostrato nel pannello a destra in basso. Tuttavia, questo scaling comprime tutti gli inlier nell'intervallo ristretto [0, 0,005] per il numero trasformato di famiglie.