>> Elettronica Tecnologia >  >> Casa intelligente >> Vita intelligente

Come utilizzare variabili fittizie nella regressione di Excel

Il popolare programma Excel di Microsoft ha funzionalità di analisi dei dati che includono la conduzione di analisi di regressione con variabili fittizie. Le variabili fittizie sono variabili categoriali espresse numericamente come 1 o 0 per indicare la presenza o l'assenza di una particolare qualità o caratteristica. Excel non richiede funzioni speciali quando un modello di regressione include una variabile fittizia tra le variabili indipendenti. Tuttavia, i modelli di regressione con variabili fittizie dipendenti richiedono componenti aggiuntivi aggiuntivi, programmi che espandono le opzioni e le funzionalità di Excel.

Regressione con variabili fittizie utilizzando Excel

Passaggio 1

Carica lo strumento di analisi dei dati dai componenti aggiuntivi di Excel, inclusi in tutte le versioni di Excel. È necessario eseguire questa operazione per condurre una regressione o qualsiasi altro tipo di analisi dei dati. Facendo clic su "Strumenti" si apre un menu a discesa. Seleziona "Componenti aggiuntivi" e dal menu che si apre, seleziona "Analysis ToolPak" e fai clic su "OK". "Analisi dei dati" dovrebbe apparire nel menu Strumenti.

Passaggio 2

Inserisci i dati che utilizzerai per la tua regressione in un foglio di lavoro Excel, codificando eventuali variabili fittizie con il valore 1 o 0, a seconda che il soggetto abbia la caratteristica in questione. Il genere è un esempio di variabile fittizia, poiché i soggetti di uno studio possono essere solo maschi o femmine. Uno studio sui punteggi degli esami di ammissione all'università che includesse il sesso delle materie, ad esempio, potrebbe codificare le studentesse con un 1. L'utilizzo di variabili fittizie tra le variabili indipendenti non richiede funzioni speciali in Excel. Ricorda che se una variabile fittizia ha solo due categorie (come maschio o femmina), è necessaria una sola variabile per rappresentare le due categorie.

Passaggio 3

Codificare le variabili categoriali con più di due categorie come variabili fittizie multiple, assicurandosi che il numero di variabili sia uno in meno rispetto al numero di categorie (n-1, in termini statistici). Ad esempio, la categoria etnia espressa in cinque livelli (bianco, nero, ispanico, asiatico, indiano americano) richiederebbe quattro variabili fittizie separate. Ad esempio, se stavi studiando i punteggi degli esami di ammissione all'università, potresti creare le seguenti variabili fittizie:neri, ispanici, asiatici e indiani d'America, codificando ciascuno un 1 se lo studente in questione rientra nella categoria etnica.

Passaggio 4

Espandi la capacità di regressione di Excel con variabili fittizie con un componente aggiuntivo che consentirà al programma di condurre regressioni con variabili dipendenti fittizie. Uno di questi programmi è XLStat, disponibile per l'acquisto e il download dal produttore, Addinsoft. Programmi come questo consentono di condurre regressioni in cui la variabile dipendente assume i valori oppure 1 o 0.

Avviso

Un errore comune tra i principianti è usare tante variabili fittizie quante sono le categorie (come, ad esempio, due variabili fittizie per maschio e femmina). Un tale approccio creerebbe multicollinearità, in cui due variabili indipendenti sono altamente correlate, rendendo quasi impossibile determinare i loro effetti separati sulla variabile dipendente. Ricorda che il numero di variabili fittizie dovrebbe sempre essere uno in meno rispetto al numero di categorie.


  1. Come utilizzare Excel file su un Blackberry
  2. Come utilizzare Wingdings in Excel
  3. Come utilizzare le regole di formattazione condizionale in Excel
  4. Come utilizzare la funzione meno in Excel
  5. Come usare Ctrl + F in Excel
  6. Come utilizzare un valore di cella come riferimento in Excel