Come leggere l'output di SPSS K-Means

L'analisi di cluster è una tecnica statistica utilizzata per organizzare i casi in categorie in modo che i casi in ciascuna categoria siano simili tra loro e diversi dai casi di altre categorie. Ogni categoria è un cluster. Gli scienziati sociali utilizzano SPSS (Pacchetto statistico per le scienze sociali) per condurre analisi di cluster. Nel clustering K-Means il ricercatore designa il numero di cluster desiderati. K è il numero di cluster che i ricercatori indicano di volere. Il clustering K-Means consente ai ricercatori di raggruppare set di dati molto grandi.

Analizzare i dati

Passo 1

Fare clic su "Analizza" nella parte superiore della schermata SPSS. Seleziona "Classifica" dal menu a discesa e "Cluster K-Means".

Passo 2

Seleziona un campione di casi. Nella finestra di dialogo, fare clic su "Variabili" ed evidenziare le variabili che si desidera utilizzare nell'analisi K-Means iniziale. Fare clic sulla freccia sinistra per spostare le variabili nella casella. Imposta il numero di cluster, di solito 5 in un set di dati di dimensioni medie, nella casella "Numero di cluster". Il numero di cluster deve essere superiore a due e non superiore al numero di casi. Fare clic su "Itera e classifica" nella finestra di dialogo per ottenere i centri cluster. Fare clic su "Scrivi finale".

Includere l'intero file di dati per l'analisi finale delle K-Means. Fare clic su "Analizza" nella parte superiore della schermata SPSS. Seleziona "Classifica" dal menu a discesa e "Cluster K-Means". Nella finestra di dialogo selezionare "Variabili" ed evidenziare le variabili che si desidera utilizzare. Fare clic sulla freccia sinistra. Imposta il numero di cluster su 5 nella casella "Numero di cluster". Fare clic su "Classifica" nella finestra di dialogo. Scegli "Leggi iniziale" per ottenere i centri cluster dal campione nel passaggio 2. Fai clic su "Salva". Fare clic su "Appartenenza al cluster". Fare clic su "Continua".

Leggi l'output

Passo 1

Esamina la prima tabella nell'output, denominata "Centri cluster finali". La parte superiore della tabella ha i numeri da 1 a 5 su di essa, che indicano ciascuno dei 5 cluster. La colonna di sinistra elenca il "punteggio del fattore REGR" (punteggio del fattore di regressione o quanto bene ciascuna variabile prevede il punteggio) per ciascuna delle analisi. Se segui la linea accanto al punteggio 1 per l'analisi 1 a destra, ti darà il punteggio del fattore per ogni cluster.

Passo 2

Leggi la tabella successiva nell'output intitolato "Numero di casi in ciascun cluster". La casella a sinistra elenca i cluster per numero, da 1 a 5. Segui il numero del cluster a destra e troverai il numero di casi in quel cluster.

Guarda l'ultima tabella nell'output, "Appartenenza al cluster", che mostra quali casi sono presenti in ogni cluster. I casi sono elencati nella colonna di sinistra e il numero di cluster si trova nella colonna all'estrema destra.