Analisi cross-section con regressione multivariata
L’analisi si basa sull’utilizzo di un gruppo di controllo, la cui condizione (valore medio di Y) è usata per stimare la condizione controfattuale dei soggetti esposti alla politica. Per tenere conto delle differenze iniziali tra i due gruppi, la stima dell’effetto è ottenuta ricorrendo a un modello di regressione: il modello stima la relazione tra la condizione finale Y di ogni soggetto e un insieme di fattori che comprendono T (l’esposizione o meno alla politica) e una serie di “variabili di controllo”, che rappresentano le caratteristiche iniziali dei soggetti nei due gruppi. Per sua costruzione, il modello può stimare la relazione ricercata tra Y e T al netto delle altre caratteristiche, o detto in altri termini, come se i due gruppi fossero equivalenti rispetto alle variabili di controllo.
Per sua costruzione, il modello può stimare la relazione ricercata tra Y e T al netto delle altre caratteristiche (cioè delle variabili di controllo), o detto in altri termini, come se i due gruppi fossero equivalenti rispetto ad esse.
La qualità delle stime dipende (oltre che da un uso corretto e consapevole del modello di regressione) dalla qualità delle variabili di controllo: più esse sono ricche e capaci di spiegare le differenze iniziali tra i gruppi, migliore la stima finale. Da un punto di vista teorico, la stima così ottenuta può essere corretta solo se le variabili di controllo utilizzate sono sufficienti a spiegare tutte le differenze iniziali tra i gruppi (ipotesi di selezione sulle osservabili).