name: xaringan-title class: inverse, left, bottom background-image: url(images/beach1.jpg) background-size: cover # **Econometría** ---- ## **<br/> Diferencias en Diferencias** ### Carlos A. Yanes Guerra ### 2024 --- # Estimador de Diferencias en Diferencias -- - Es un método de .hi-turquoise[inferencia causal] -- > Es un método general para cuando surge una política exógena que afecta más a un grupo que a otro -- - Se utiliza con datos de corte transversal repetidos a lo largo del tiempo -- - También puede utilizarse comparando .hi-pink[subgrupos]. -- DID se basa fundamentalmente en un supuesto denominado .ul[tendencias paralelas]. En ausencia de tratamiento, las tendencias de los grupos tratados y no tratados son iguales. --- # Estimador de Diferencias en Diferencias -- <img src="images/DID1.png" width="980" /> --- # Estimador de Diferencias en Diferencias -- ### Dif-en-Dif, ¿Qué estima? -- `$$\tau_{dif-en-dif}= [\mathbb{E}(Y_{2}|D=1)-\mathbb{E}(Y_{1}|D=1) ] - [ \color{blue}{ \mathbb{E}(Y_{2}|D=0)-\mathbb{E}(Y_{1}|D=0)}]$$` -- Donde: - La *primera* parte es el cambio .ul[esperado] entre el periodo anterior y el posterior a la implementación del .hi-pink[tratamiento] para los **tratados**. -- - La *segunda* parte es el cambio .ul[esperado] entre el periodo anterior y el posterior a la implementación del .hi-pink[tratamiento] para los .hi-purple[controles]. --- # Estimador de Diferencias en Diferencias -- ### Análogo muestral -- `$$\tau_{dif-en-dif}= [(\bar{Y}_{2}|D=1)-(\bar{Y}_{1}|D=1) ] - [ \color{blue}{ (\bar{Y}_{2}|D=0)-(\bar{Y}_{1}|D=0)} ]$$` -- Lo cual, se puede simplificar si se plantea el cambio temporal (longitudinal), que puede definirse como `\(\triangle Y\)`: -- `$$\boxed{ \widehat{\tau}_{dif-en-dif}= (\triangle \bar{Y}|D=1)- (\triangle \bar{Y}|D=0)}$$` --- # Estimador de Diferencias en Diferencias -- ### ¿Cuándo usar el estimador DIF-en-DIF o DID? -- - El estimador **DID** es más .hi[eficiente] que el de diferencia cuando algunos determinantes *no observables* de la variable .ul[objetivo] son persistentes en el tiempo. -- - La eficiencia va en dirección de la fracción de la varianza de `\(Y\)` que este explicada por factores no observados. -- - Cuando (*no hay balance*) entre grupo de .hi-purple[control] y .hi-pink[tratamiento] aún con asignación aleatoria se generan asignaciones parcialmente aleatorias. -- - Si el .hi-pink[tratamiento] esta **correlacionado** con el nivel inicial de `\(Y\)` antes de la intervención, ese estimador de diferencias será .ul[sesgado]. Pero el .hi-orange[Dif-en-Dif] no necesariamente. --- class: inverse, middle # DID en entorno de dos periodos <img src="images/lognig.png" width="280" /> --- # DID en dos periodos de tiempo -- > Consideremos un experimento que se hizo naturalmente, pero que iba interviniendo un grupo mas que otro. -- Vamos a decir que `\(\color{purple}{Y_i}\)` es la variable .hi-purple[resultado] y `\(D_i\)` es la de **tratamiento**. -- Esto es : `\(D_i=1\)` si es tratado y `\(D_i=0\)`, de lo contrario. -- ### Método 1: Comparando T-C en un mismo momento de tiempo -- `$$\text{Efecto del Tratamiento}= \overline{Y}\; \text{para tratados} - \overline{Y}\; \color{purple}{\text{para no tratados}}$$` -- `$$\tau=\overline{Y}_{1i}-\color{purple}{\overline{Y}_{0i}}$$` --
Lo único que nos puede llevar hacer las cosas mal, son las diferencias de características de los individuos que estamos evaluando --- count: false # DID en dos periodos de tiempo > Consideremos un experimento que se hizo naturalmente, pero que iba interviniendo un grupo mas que otro. Vamos a decir que `\(\color{purple}{Y_i}\)` es la variable .hi-purple[resultado] y `\(D_i\)` es la de **tratamiento**. Esto es : `\(D_i=1\)` si es tratado y `\(D_i=0\)`, de lo contrario. -- ### Método 2: Comparando T-T Antes y despues -- `$$\text{Efecto del Tratamiento}= (\overline{Y}\; \text{para tratados en}\;|\;t=2) - (\overline{Y}\; \color{red}{\text{para tratados en}}\;|\;t=1)$$` -- `$$\tau=\overline{Y}_{1t=2}-\color{purple}{\overline{Y}_{1t=1}}$$` --
Lo único que nos puede llevar hacer las cosas mal, es que en el tiempo (*todo evoluciona/cambia*) y es complejo separar eso así no mas!! --- count: false # DID en dos periodos de tiempo > Consideremos un experimento que se hizo naturalmente, pero que iba interviniendo un grupo mas que otro. Vamos a decir que `\(\color{purple}{Y_i}\)` es la variable .hi-purple[resultado] y `\(D_i\)` es la de **tratamiento**. Esto es : `\(D_i=1\)` si es tratado y `\(D_i=0\)`, de lo contrario. -- ### Método definitivo: Diferencias de diferencias -- `$$\tau_{DID}= \triangle\overline{Y}_{d=1}\; \text{para todos los tratados} - \overline{Y}_{d=0}\; \color{red}{\text{para todos los controles}}$$` -- algo así como: `$$\tau_{DID}=(\overline{Y}_{1t=2}-\color{red}{\overline{Y}_{1t=1}})-(\overline{Y}_{0t=2}-\color{purple}{\overline{Y}_{0t=1}})$$` --
de esta forma aproximamos mejor el hallazgo del cálculo deseado de esta parte controlando por tiempo y por grupo. --- # DID en dos periodos de tiempo -- ## Resumiendo -- <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:left;"> Tratados <br> \((D=1)\) </th> <th style="text-align:left;"> No Tratados <br> \((D=0)\) </th> <th style="text-align:left;"> Diferencia <br> sobre el Tratamiento </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;font-weight: bold;font-style: italic;color: black !important;vertical-align:top;"> Pre \( (t = 1) \) </td> <td style="text-align:left;font-style: italic;color: black !important;"> \(\beta_0 + \beta_2\) </td> <td style="text-align:left;font-style: italic;color: red !important;"> \(\beta_0\) </td> <td style="text-align:left;color: black !important;"> \(\beta_2\) </td> </tr> <tr> <td style="text-align:left;font-weight: bold;font-style: italic;color: black !important;vertical-align:top;"> Post \( (t = 2) \) </td> <td style="text-align:left;font-style: italic;color: black !important;"> \(\beta_0+\beta_1+\beta_2 +\beta_3\) </td> <td style="text-align:left;font-style: italic;color: red !important;"> \(\beta_0 + \beta_1\) </td> <td style="text-align:left;color: black !important;"> \(\beta_2 + \beta_3\) </td> </tr> <tr> <td style="text-align:left;font-weight: bold;font-style: italic;color: black !important;vertical-align:top;"> Cambio en <br> el tiempo </td> <td style="text-align:left;font-style: italic;color: black !important;"> \(\beta_1 + \beta_3\) </td> <td style="text-align:left;font-style: italic;color: red !important;"> \(\beta_1\) </td> <td style="text-align:left;color: black !important;"> Dif en Dif = \(\beta_3 !\) </td> </tr> </tbody> </table> --- class: inverse, middle # Computo de regresión de DID <img src="images/lognig.png" width="280" /> --- layout:true # Regresión DID --- --
El estimador de .hi[diferencias en diferencias] (DID) puede ser obtenido como el **coeficiente** de `\(t \times d\)` en una regresión de MCO -- `$$y_i=\beta_0+\beta_1t_i+\beta_2D_i+\beta_3t_i\times D_i+ u_i$$` -- - Vamos a tener tres (3) elementos claves que vienen a ser los datos .hi[binarios] tomando a `\((t)\)` como la dummy de `tiempo` cuando `\(t=1\)` esta en el periodo posterior y si `\(t=0\)` en el anterior. -- - El siguiente elemento es su fué *tratado* o *no tratado*. -- - La .ul[interacción] que hace referencia al parámetro `\(\beta_3\)`, viene a ser `\(\color{red}{t \times D_i=1}\)` si el individuo fue tratado en el periodo posterior y `\(t \times D_i=0\)` de lo contrario. --- layout:false class: inverse, middle # Mas del contexto del DID <img src="images/lognig.png" width="280" /> --- layout: true # Contexto del DID --- -- ## ¿Cuándo adicionalmente podemos usar el estimador DIF-en-DIF? -- - El estimador **DID** es más .hi[eficiente] que el de diferencia cuando algunos determinantes *no observables* de la variable .hi[objetivo] son persistentes en el tiempo. - La eficiencia va en dirección de la fracción de la varianza de `\(Y\)` que este explicada por factores no observados. - Cuando (.hi[no hay balance]) entre grupo de .hi-purple[control] y .hi[tratamiento] aún con asignación aleatoria se generan asignaciones parcialmente aleatorias. - Si el .hi[tratamiento] esta *correlacionado* con el nivel inicial de `\(Y\)` antes de la intervención, ese estimador de diferencias será .ul[sesgado]. Pero el .hi-orange[Dif-en-Dif] no necesariamente. --- -- ## Supuesto de tendencia paralela -- La .hi[variable] de resultado `\(Y\)` evoluciona de manera natural en el tiempo en la misma forma que para el grupo de control como el de tratamiento. -- Lo que permite utilizar `\([(\bar{Y}_{1}|D=1)-(\bar{Y}_{1}|D=0)]\)` como control apropiado y suficiente para controlar diferencias pre-existentes entre los **tratados** y *controles*. $$ \boxed{\tau_{DID} \Rightarrow \; \text{es insesgado}} $$ --- -- ## DID con modelo de panel --
Podemos entonces establecer: -- `$$Y_{it2}-Y_{it1}= \beta_{0}+\beta_{1}D_{i}+ (u_{it2}-u_{it1})$$` -- Su analogo vendría a ser: -- `$$\triangle Y_{i}= \beta_{0}+\beta_{1}D_{i}+ \nu_{i}$$` --
El parámetro `\(\beta_{1}\)` es el .hi[impacto] del programa por método de .hi-orange[diferencias en diferencias]. --- -- ## Al hacer su esperanza condicional `$$\begin{aligned} \mathbb{E}(\triangle Y|D=1)=& \beta_{0}+\beta_{1}+\mathbb{E}(\nu|D=1) \\ =& \beta_{0}+\beta_{1}\\ \mathbb{E}(\triangle Y|D=0)=& \beta_{0}+\mathbb{E}(\nu|D=0) \\ =& \beta_{0} \end{aligned}$$` --
Por independencia condicional `\(\Rightarrow\)` `\(\mathbb{E}(u_{i}|D_{i})=0\)`, por ende `\(\beta_{1}\)` es un estimador indicado. --- -- ## Panel general con diferencias en diferencias -- `$$Y_{it} = \alpha + \beta_1 \text{Tratado}_i + \beta_2 \text{Post}_t + \beta_3 (\text{Tratado}_i \times \text{Post}_t) + \gamma X_{it} + \epsilon_{it}$$` -- donde: -- - `\(Y_{it}\)` es la .hi-purple[variable dependiente] para el individuo `\(i\)` en el tiempo `\(t\)`. - `\(\text{Tratado}_i\)` es una variable **dicotómica** que toma el valor de 1 si el individuo pertenece al .hi[grupo tratado] y 0 si pertenece al grupo control. - `\(\text{Post}_t\)` es una variable **dicotómica** que toma el valor de 1 en el periodo posterior al tratamiento y 0 antes del tratamiento. - `\(\text{Tratado}_i \times \text{Post}_t\)` es el .ul[término de interacción] entre el tratamiento y el tiempo, que captura el efecto del tratamiento. - `\(X_{it}\)` es un vector de .hi[controles adicionales] que pueden afectar `\(Y_{it}\)`. - `\(\epsilon_{it}\)` es el término de error. --- -- ## Diferencias en diferencias con múltiples periodos -- `$$Y_{it} = \alpha + \beta_1 \text{Tratado}_i + \beta_2 \text{Post1}_t + \beta_3 \text{Post2}_t + \beta_4 (\text{Tratado}_i \times \text{Post1}_t) + \beta_5 (\text{Tratado}_i \times \text{Post2}_t) + \gamma X_{it} + \epsilon_{it}$$` -- En este modelo, los coeficientes `\(\beta_4\)` y `\(\beta_5\)` representan los estimadores de .hi[diferencias en diferencias] para los periodos `\(t=2\)` y `\(t=3\)`, respectivamente, mostrando el efecto causal del tratamiento en esos periodos. --- layout: false class: inverse, middle # Ejemplos <img src="images/lognig.png" width="280" /> --- # Ejemplo: Decreto de regalías -- Programa: Regalías .hi[Datos] : Encuesta de hogares (repetidas). .ul[Linea de base]: Antes de hallazgo de yacimiento *Seguimiento*: Después del experimento natural (hallar petroleo) .hi-red[Consideraciones]: **Grupo Control** Residentes de municipios **sin** petroleo que pertenecen al SISBEN 1 y 2. .hi-purple[Grupo Tratados] Residentes de municipios .hi[con] petroleo que pertenecen al SISBEN 1 y 2. --- # Ejemplo: Decreto de regalías -- Al no poseer un panel, pero si datos sobre individuos que residen en municipios petroleros (serán tratados después del decreto) y municipios no petroleros (que no serán tratados porque no poseen regalías). -- <img src="images/textit.png" width="780" /> --- # DID con PSM -- ## Dobles diferencias emparejadas --
Este método combina información longitudinal, PSM y diferencias en diferencias. -- - Se relajan los supuestos de cada método y, por lo tanto los resultados se vuelven mas robustos. - Al combinar PSM con Dif en Dif, se puede encontrar que la selección del programa pueda depender de características .ul[no observables] siempre que sean constantes en el tiempo. --- # DID con PSM -- ## Supuestos y estimador DDE -- - Independencia .hi[condicional] (CI): `$$u_{it1}-u_{it0} \perp D|X, \; \forall \; X$$` -- >Tratados y controles habrían evolucionado de la misma manera si ninguno hubiera sido objeto de tratamiento --
Soporte común: `$$0<P(D=1|X)<1$$` -- El Estimador ATT viene a ser: `$$\tau_{ATT} = \mathbb{E}_{P(X)|D=1} \left[ \mathbb{E}\left(Y_{t1}(1) - Y_{t0}(1) \mid D=1, P(X)\right) - \mathbb{E}\left(Y_{t1}(0) - Y_{t0}(0) \mid D=0, P(X)\right) \right]$$` --- # Ejemplo: DDE -- - Piense en lo siguiente -- | Tratados | Controles | |--------------------------------|---------------------------------| | Talla para la edad en T=2 | Talla para la edad en T=2 | | Talla para la edad en T=1 | Talla para la edad en T=1 | --- # Ejemplo: DDE -- Ya que tiene dos observaciones de talla para un mismo individuo (antes y después), podemos tener el ATT: -- `$$\triangle Y= Y_{t1}-Y_{t0}$$` .ex[Será la diferencia de talla de individuos por edad del grupo de tratados en comparación al control] -- Para el calculo de la .ul[probabilidad] de participación, dadas las características de los individuos. -- `$$D= \beta X+ \mu$$` -- D hace referencia a la `\(dummy\)` de tratamiento y `\(X\)` es el vector de variables tales como: *Ingreso del jefe de hogar, numero de personas del hogar, educación, etc.* --- class: inverse # Bibliografía
Angrist, J. D., & Pischke, J. S. (2009). *Mostly harmless econometrics: An empiricist's companion*. Princeton university press.
Rubin, E. (2021) *Econometrics Lectures class*.
Raze, K. (2022) *Labor Economics Lectures class*.
Angrist, J. (2022) *Mastering Econometrics* [Con Acceso abril 2022](https://mru.org/mastering-econometrics-joshua-angrist).
Wooldridge, J. M. (2015). *Introductory econometrics: A modern approach*. Cengage learning. --- name: adios class: middle, inverse .pull-left[ # **¡Gracias!** <br/> ## Econometría ### Seguimos aprendiendo ] .pull-right[ .right[ <img style="border-radius: 50%;" src="https://avatars.githubusercontent.com/u/39503983?v=4" width="150px" /> [
Syllabus/ Curso](https://carlosyanes.netlify.app/contenidoc/SyllabusEconometriaME.pdf)<br/> [
@keynes37](https://twitter.com/keynes37)<br/> [
cayanes@uninorte.edu.co](mailto:cayanes@uninorte.edu.co) ] ]