Entradas

Cortame la boleta...

Una pregunta que surge de las elecciones pasadas es: ¿cuál es la dirección del corte de boleta en Provincia de Buenos Aires? Es decir, se verifica una diferencia entre la cantidad de votos para los diferentes candidatos a presidente y los candidatos a gobernador en este distrito. Eso puede verse en la siguiente tabla: Votos presidente Votos gobernador Diferencia % diferencia sobre presidente % diferencia sobre gobernador FPV 3,419,041 3,098,900 320,141 9.36% 10.33% Cambiemos 3,031,168 3,478,505 -447,337 -14.8% -12.86% UNA 2,062,610 1,693,151 369,459 17.9% 21.82% FIT 341,734 329,432 12,302 3.6% 3.73% Progresistas 264,583 209,021 55,562 21.0% 26.58% Para los dos frentes mayoritarios (FPV y Cambiemos), ese corte de boleta representa en términos absolutos 320 141 votos y 447 337 votos, respectivamente; dicho de otra manera, entre el 9 y el 15% aproximadamente con respecto al caudal total de votos a para presidente y para gobernador. En cambio, para UNA se advierte una difere

Simulando espero

Hace unos días me acordé de este problemita posteado hace mucho tiempo acá   En un vuelo completamente vendido hay n asientos. Los pasajeros van subiendo uno detrás del otro al avión. En el primer lugar sube una vieja loca que en lugar de tomar su asiento elige aleatoriamente un lugar donde sentarse. El resto de los pasajeros siguen subiendo de a uno. Si su asiento está libre, lo toman. Si está ocupado, eligen entre aquellos que estén libres de manera aleatoria. ¿Cuál es la probabilidad de que el último pasajero pueda sentarse en su lugar? El caso más simple, obviamente, sería un avión de dos asientos. La cosa es simple: la vieja loca elige al azar. Hay dos posibilidades: o bien, se sienta en su asiento o no. En caso de que se siente en su asiento, el pasajero “U” –último- se sentará en su asiento. En la segunda opción, no. La probabilidad es 0.5. Ahora, ¿qué pasa si n empieza a aumentar? Nunca les tuve demasiada paciencia a estos “acertijos” de probabilidad. Pero este t

Número efectivo de partidos en elecciones presidenciales 1983-2011

Imagen
En este post vamos a tratar de armar una serie histórica de un indicador ampliamente utilizado en los estudios electorales: el número efectivo de partidos. El mismo está definido como sigue: $\LARGE N_{2}=\frac{1}{\sum_{i}^{n}p_{i}^2}$ donde $p_{i}^2$ es la proporción de votos que el partido i obtiene sobre el total de votos emitidos. Taagepera y Laakso (1979) dan una definición conceptual del "ENP" (effective number of parties): "es el número hipotético de partidos de igual tamaño que tendrían el mismo efecto total en la fraccionalización del sistema que el número 'real' [actual] de tamaño desigual" (p. 4) O sea, es una medida de la concentración de los votos en un sistema electoral determinado. Si todos los partidos tuvieran la misma participación en el total de votos N 2 sería igual al número "real" de partidos. Si un solo partido la totalidad de los votos, N 2 sería igual a 1. A mayor N 2 mayor "competencia" o &quo

PANELIZE. Una función -preliminar- en R para transformar datos a formato panel

Hace un tiempo @ftiberti planteó un problema: tenía una base de datos (formato serie de tiempo) de la evolución de PBI per cápita por país. Pero el formato era incómodo: los países estaban en las columnas y los años en las filas*. Year Austria Belgium ... 1946 1.956 4.574 ... 1947 2.166 4.800 ... ... ... ... ... Era necesario llevarlos a formato de datos de panel para trabajarlos más cómodamente. O sea, a algo parecido a esto: Year Country PBIpc 1946 Austria 1.956 1946 Belgium 4.574 ... ... ... 1947 Austria 2.166 1947 Belgium 4.800 ... ... ... Hacerlo a mano iba a resultar una tarea muy engorrosa. Especialmente si se tiene en cuenta que eran alrededor de 65 años -filas- y 165 países -columnas-. Esto da una base de datos (en formato panel) de 10.660 registros. A partir de ahí se me ocurrió tratar de automatizar el proceso. Así que armé est

Datos del Censo Penitenciario de Argentina - Año 2012

Imagen
Descargar en formato csv. Elaborados en base a este informe . No sean canutos y mencionen el blog... Un primer indicador: el porcentaje de superpoblación carcelaria por provincia en 2012. El indicador se define simplemente como la población encarcelada en la unidad dividido el total de plazas de la unidad, multiplicado por 100. La interpretación es simple: si es mayor a 100% hay superpoblación, si es menor, no. Cuanto mayor sea a 100%, mayor es el porcentaje de superpoblación y viceversa. Es bastante elocuente, ¿no?

PRELIMINAR. Inferencia ecológica I. El voto al FPV 2007-2011

Imagen
En el post anterior habíamos hecho una introducción al problema de la inferencia ecológica y como aplicarlo al caso de los cambios en el voto al Frente para la Victoria. (Ante cualquier duda sobre lo que viene, ver acá ). La idea, ahora, es exponer unos numeritos ( preliminares ) que comienzan a llevar esa tabla que habíamos armado antes. Una aclaración: la proporción de votos al FPV y no al FPV fueron computadas sobre el total de electores del padrón electoral y no sobre el total de votos efectivos. Tabla 1. Inferencia ecológica entre el voto FPV en 2007 Voto FPV 2011 Voto no FPV 2011 Error std. Voto FPV 2007 0,8066 (2011) 0,8068 (2007) 0,1934 (2011) 0,1932 (2007) 0,0164 (2011) 0,0186 (2007) Voto no FPV 2007 0,1992 (2011) 0,1969 (2007) 0,8008 (2011) 0,8031 (2007) 0,0080 (2011) 0,0090 (2007) Nota de lectura: el primer renglón de cada fila (con 2011 entre paréntesis) computa el modelo de King tomando como base la cantidad de electores del padrón del año 20

Inferencia ecológica (o una introducción a algunos posts que se vendrán)

La idea de este post es presentar algunas cuestiones que deberían servir para "interpretar" y hacer comprensibles algunos posts que se vienen. Una clave de lectura, digamos. Habíamos planteado antes que íbamos a tratar de estimar de alguna manera, la evolución del "voto kirchnerista" sobre la base de los datos de las elecciones de 2007, 2011 (presidenciales) y 2009 y 2013 (legislativas) desagregados a nivel departamental, la proporción del cambio de voto al kirchnerismo en esos momentos. Podríamos, también, tratar de estimar la pérdida del kirchnerismo entre 2011 y 2013. Sigamos el orden cronológico. Comencemos, entonces, por las elecciones presidenciales de 2007 y 2011. El mismo razonamiento que sigue podría utilizarse para los siguientes momentos. Lo que necesitamos conocer, para cada votante, el voto que emitió en 2007 y el que emitió en 2011. Podríamos representar el problema en una tabla de contingencia 2 x 2 (el planteo podría extenderse a una tabla r x c,