La rebelión de las máquinas I

I.

Por casualidad descubrimos el blog de Andy Tow quién propone un análisis de los cortes de ruta a nivel de departamento y basado en dos variables básicas: a) desigualdad en la distribución de la tierra (medida a través del índice de Gini); b) tamaño de las explotaciones. Tomaremos (con la debida cita) los datos que propociona Tow, en particular el coeficiente de gini para cada departamento y la cantidad de cortes de ruta.

Uno de los resultados principales a los que arriba es que los cortes de ruta se hallan asociados (de forma estadísticamente significativa) a una distribución igualitaria de la tierra (medida a través el índice de Gini). A su vez como el Gini se encuentra asociado al tamaño de la explotación, concluye que la protesta está protagonizada por los pequeños y medianos productores.

La sociología agraria ha debatido largamente sobre la utilidad de la superficie de una explotación como (principal) indicador válido para la construcción de tipologías de explotaciones. El concepto de “pequeño productor” lisa y llanamente, tiene un carácter ambiguo dado que no permite especificar de forma clara cuáles son los criterios sobre los cuales se construye. En efecto, un pequeño productor... ¿en función de qué? ¿Del tamaño de su explotación? ¿Del valor bruto de su producción? ¿De su inversión de capital y/ o de las posibilidades de reproducción de ese capital? ¿Del tipo, forma y cantidad de fuerza de trabajo que utiliza?

La consecuencia lógica de esta ambigüedad es se terminan asimilando bajo una misma categoría a fracciones sociales y agentes económicos sumamente diversos entre si: desde productores familiares pobres y “semi- proletarizados” (que se ven obligados a trabajar fuera del predio) hasta productores capitalizados que contratan personal. Pasando por productores tipo “farmer” altamente capitalizados pero con fuerza de trabajo familiar y muchas otras situaciones intermedias.

Para resumir: el hecho de tener explotaciones “pequeñas” y/ o “medianas” en términos de superficie no implican (por sí mismas y necesariamente) producciones “pequeñas” y “medianas”, y/ o inversiones de capital “pequeñas” o “medianas”, o un nivel de acumulación “bajo” o “medio”. De todas estas variables que faltan incorporar, nos centraremos en la “inversión de capital”.

En este breve informe nos referiremos solamente a cuatro provincias de la región pampeana: Entre Ríos, Buenos Aires, Córdoba y Santa Fé. Este recorte (que no está exento de problemas) tiene asidero en dos criterios que consideramos razonables: a) estas provincias parece ser las que concentran la mayor parte de los cortes de ruta; b) en tanto se trata de una región con una estructura agraria relativamente homogénea, es menos riesgoso trabajar con datos agregados que si se incorporaran al análisis otras regiones con estructuras más disimiles.

Una primera aproximación a este problema puede obtenerse a partir de los datos de existencia de maquinaria a nivel departamento, presentes en el Censo Nacional Agropecuario 2002. Con estos datos elaboramos un índice de mecanización de las explotaciones:



Fuente: elaboración propia sobre Censo Nacional Agropecuario 2002 y datos de Andy Tow.

Como se observa ni el coeficiente de Gini, ni la superficie media de los departamentos encuentran correlación con el nivel de mecanización de los departamentos.

II.

Ahora bien, ¿en que tipo de departamento se concentran las protestas (los cortes de ruta) de los productores rebeldes? Para ello veamos los cuadros 1 y 2.



Fuente: elaboración propia sobre Censo Nacional Agropecuario 2002 y datos de Andy Tow.

Lo que se observa en esta distribución es que entre aquellos departamentos con un alto nivel de mecanización, se verifica una mayor proporción de cortes de ruta. Así, del total de departamentos en que se producen cortes (97) el 70,4% eran departamentos dónde el índice de mecanización es alto. A la inversa, entre aquellos departamentos donde no se producen cortes de ruta, la proporción de departamentos con índice de mecanización alto es mucho menor: 29,6%.

Dicho en términos estadísticos: el coeficiente chi cuadrado da un valor de 34,310. Para un p valor igual a 0,00 (es decir, con un nivel de confianza superior al 99%), el valor teórico esperado es de 6,635. O sea que se rechaza ampliamente la hipótesis nula acerca de la independencia estadística entre la presencia de cortes de ruta y el grado de mecanización de los departamentos de las provincias en cuestión.

Confirmada la hipótesis que postula que la distribución no se debe al azar, calculamos dos coeficientes de asociación relativamente utilizados: se observa que Phi (y V de Cramer) revelan la existencia de asociación estadística, con un grado considerable (0,418). El coeficiente Q de Joule (que tiene un supuesto de asociación perfecta bastante menos restrictivo que los coeficientes basados en Chi cuadrado) arroja un valor de 0,712. Ambos valores, entonces evidencian la existencia de un grado fuerte de asociación.

Esto parece abonar la hipótesis que postula que no se trataría de “pequeños” productores (al menos en forma predominante) los que se están movilizando. Quizás sí puedan serlo en términos de superficie media, e incluso en términos de “igualdad” en la distribución al interior de los departamentos, pero claramente no parecen serlo en términos de mecanización e inversión de capital.

Una vez que se ha corroborado la existencia de asociación entre dos variables, el procedimiento más o menos típico, consiste en someter esta relación a prueba para explorar como se comporta la asociación, manteniendo constante el efecto de otras variables que resultan teóricamente relevantes. En próximos posts llevaremos esta tarea adelante.

Comentarios

MaxD ha dicho que…
Impecable. Por la exposición y elaboración. Espero la próxima entrega de lo que puede ser un interesante esclarecimiento del fenómeno este de "el campo".
Anónimo ha dicho que…
Cresto, celebro y saludo su aporte al análisis estadístico de la protesta rural.

Confieso ante todo ser lego en temas agrarios en general, y en particular de los debates de la sociología agraria. Así y todo, tengo algunos comentarios a hacer.

Primero, me parece que se incurre en un sesgo de selección al tomar solamente las provincias más grandes. La variabilidad del Gini se reduce al igual que la de la superficie de pequeños y medianos. También muy posiblemente se reduce la variabilidad de la mecanización. Me parece correcto el criterio de mayor homogeneidad de la estructura agraria, pero en ese caso habría que considerar la posibilidad que esa misma homogeneidad (traducida en indicadores empíricos) constituye una variable explicativa. Por otro lado, no veo muy bien por qué incluir en el análisis a departamentos que no tienen actividad agropecuaria (ver especialmente conurbano bonaerense).

Segundo, estimo que la superficie de la explotación es un buen predictor de la capacidad de producción porque la calidad de la tierra en un mismo departamento (o incluso en una región climática) no ostenta grandes variaciones. En una economía competitiva la asignación de esos recursos en iguales actividades tenderá a productividades semejantes. Es de esperar que el nivel tecnológico necesario para tal resultado no muestre significativas diferencias espaciales.

En ese sentido, la existencia de maquinaria es un indicador también ambiguo. Corríjanme si me equivoco, pero se me ocurre que los tractores y cosechadoras y otras maquinarias agrícolas tienen ruedas o se pueden cargar en acoplados. Es decir, se pueden llevar en alquiler a otros departamentos que no las tienen, entonces por sí solos no indican que los departamentos que sí las tienen vayan a ostentar capacidades diferenciadas. En todo caso lo que sugeriría es que la protesta es motorizada por aquellos a quienes las retenciones hace perder rentabilidad al alquiler de sus máquinas. La conexión de la maquinaria con la protesta solo parecería evidente a nivel de la disponibilidad de objetos contundentes para instalar en la vía pública con el propósito de impedir el paso eficazmente.

Tercero, no me queda muy clara la construcción del índice de mecanización. Igual, cabe destacar que la cantidad de máquinas está asociada a la cantidad de explotaciones. Por ejemplo en Buenos Aires, la correlación entre la cantidad de explotaciones y la cantidad de tractores es de 0,79 y entre la cantidad de cosechadoras de granos y la cantidad de explotaciones la correlación es de 0,67. Es decir, cuantas más explotaciones, más máquinas. El valor de Phi y V de Cramer de cantidad de explotaciones en dos categorías divididos por la media respecto a cortes de ruta es 0,447, superando al verificado con el índice de mecanización (0,418). Si se controla por la cantidad de explotaciones, probablemente la asociación de mecanización con protesta resulte espuria. Al respecto, recientemente he utilizado la cantidad de explotaciones como variable de control de Gini y escala, dada su alta significación.

Finalmente, aunque es menos importante, tengo entendido que Phi y V de Cramer se refieren a variables nominales, cuando el índice de mecanización y la ocurrencia de corte de rutas son más bien ordinales, de más o menos en lugar de denotar un atributo no sujeto a ordenamiento.
Anónimo ha dicho que…
Fe de erratas, se me coló un error en las correlaciones indicadas. La correlación de total de explotaciones respecto a cantidad de tractores en Buenos Aires es de 0,94 y respecto a cantidad de cosechadoras es 0,58, de modo que el punto se mantiene.
Cresto ha dicho que…
Andy: voy a quedar debiendo una contestación mucho más detallada e igualmente dedicada que su comentario; pero le pido que tenga paciencia para los otros posts, que (espero y supongo) que algunas cuestiones quedarán aclaradas.

Ahora bien: comentarios a sus comentarios:

a) el tema de homogeneidad de la estructura agraria… acuerdo en que es una variable independiente. Pero confieso que no fue solo un criterio teórico el que motivó limitarme a la pampeana, fue además un criterio de “escasez de recursos”. Se me hacía muy complejo incorporar el resto de las provincias, al menos en un primer análisis… pero trataré en un futuro hacerlo. Ahora, sí creo que justamente por ser una variable independiente es complicado trabajar con indicadores agregados… O sea, creo que debería incluirse como cruce para ponderar ciertos aspectos de la protesta. Por lo pronto estamos intentando incorporar el noreste al análisis.

b) La variabilidad del índice de mecanización es muy elevada: el coef. de variación da casi 68% y el histograma da cualquier cosa menos homogéneo. Con lo cual si fuera cierto que se reduce en la reg. pampeana, no debería ser demasiado importante esa reducción

c) Con respecto a la superficie como predictor de la capacidad de producción. Eso puedo asegurarle que en términos teóricos no es necesariamente así. Además estoy procesando datos de rindes para los departamentos y no están correlacionados. Creo que uno de los economistas seriales crónicos hicieron un trabajo similar.

d) Lo de la construcción del índice de mecanización…viene en otro post… Obviamente está sujeto a revisión (cosa que hubiera sido bueno aclararlo, no?) pero le comento que abarca tres subíndices: tractorización, sembradoras y (este es el más importante) superficie contratada (es decir, tercerizada, donde los productores contratan a alguien para que les haga el trabajo de maquinaria), con lo cual el problema de los que mueven “maquinaria” está metido por ahí. Igual (y no es que quiera sacar chapa de experto en el tema, porque lo cierto es que no lo soy) son indicadores más o menos estándar en los estudios agrarios.

e) Además está controlado por cantidad de explotaciones: el índice se construye a partir de tres tasas: tractores/ exp. totales, sembradoras/ exp totales, total de has. Contratadas/ total expl. Así las corrlaciones bajan mucho: por ejemplo para usar la provincia que usted dio (Buenos Aires) la tasa de tractores/ total explotaciones tiene una correlación con el total de explotaciones de 0.232 versus una de 0.865 entre el total de tractores y la cantidad de explotaciones.

f) Todos estos valores fueron estandarizados. Ja, al final ya le expliqué como lo construí. De cualquier forma lo vamos a controlar con un trivariado a ver que da… aunque no entiendo que es lo que cambiaria.

g) Pero más allá de eso, el tema es tener en cuenta que intenta funcionar como indicador de “inversión de capital”. Un elevado índice estaría implicando un elevado nivel de inversión.

h) Ultimo: phi y V de Cramer y Q de Joule. Es cierto son para variables nominales, pero como dicotomizamos el índice por la mediana, y la presencia de cortes por si hay o no cortes, resultan adecuados… Pero ahora me hizo dudar y voy a revolver apuntes y manuales.

Ja, quizás sea conveniente armar un post solamente defensivo…

Un saludo y desde ya que la vamos a seguir. Para mí, por lo menos, es muy estimulante el intercambio.
Anónimo ha dicho que…
Cresto, le contesto a cada punto.

a) La cuestión del sesgo de selección no solamente tiene que ver con la posibilidad que la estructura agraria sea variable independiente (y puesto así con esas palabras, "estructura agraria", de cajón tiene relación con la protesta), sino con la pertinencia de algunos indicadores. Si Ud. se fija, la asociación de las variables que yo postulo con la protesta carecen de significancia estadística si se toman solamente esas provincias. Esto tiene que ver, si Ud. se acuerda, con que para poder comparar el Gini para el conjunto Pampeana-NOA-NEA-Cuyo tuve que ajustar a intervalos equivalentes las escalas, con lo que se perdió cierta variabilidad. Usando los valores para todas las escalas (hasta más de 20.000 ha), la significancia se verifica y supera los tests de superficie sojera y número de explotaciones. Lo correcto para comparar sería usar el índice Gini para Pampeana en vez del general respecto a su índice de mecanización. Si quiere le paso los datos. Por cierto, sería interesante contar con su dataset, o al menos una explicación detallada de cómo obtener el índice de mecanización o inversión de capital.

b) La presencia de más observaciones para el índice puede tener impacto (a veces decisivo) en la construcción de las categorías, ya que modifica la posición de la mediana (que es la medida por Ud. elegida), más allá de las medidas de dispersión, que son más aplicables a la media.

c) Yo creo que la superficie es buen predictor de la capacidad productiva respecto a las explotaciones del mismo departamento. El tema de los rindes de zonas distintas es conocido. El mismo gobierno reconoce que explotaciones de mayor tamaño pueden acceder a las compensaciones a pequeños productores estando fuera de región Pampeana. De todas maneras, tenga en cuenta que mi variable de escala tiene un rango que va de 1 a 1.000 ha, es decir, cubre un espectro bastante amplio de "pequeños y medianos", con todas sus diferentes capacidades productivas. Por otra parte, si se quiere analizar el rol de los "pequeños y medianos" (al menos para refutar ciertos discursos políticos), no parece haber otra medida disponible.

d) Veo que consideró el tema de la tercerización. Como Ud. dijo que elaboró su índice de mecanización de las explotaciones con "los datos de existencia de maquinaria a nivel departamento", me pareció importante no confundir ausencia de máquinas con ausencia de mecanización. Creo que igual tal observación es aplicable a al menos dos de los tres subíndices del Imec, más allá de su carácter estándar, si pretende caracterizar nivel de mecanización, como su nombre lo indicaría.

e), f), g) Al respecto, noto que más que nivel de mecanización del departamento, el índice caracteriza el nivel de inversión de capital. En tal caso, sería interesante ver en qué escala de explotación se concentra dicha inversión. No es difícil advertir de los datos del INDEC que en las provincias seleccionadas la relación superficie contratada con servicios de maquinaria / superficie total tiende a ser más alta para las explotaciones de hasta 1.000 ha, sobre todo en el segmento "mediano" de 100 a 1.000 ha, que he caracterizado en otra parte como el de los "más iguales" de la rebelión. Creo que estos puntos de contacto entre su perspectiva y la mía merecen no ser soslayados. Estimando la porción de inversión que en cada departamento recibe la escala mencionada mediante métodos de inferencia ecológica sería posible revertir la aparente falta de correlación entre Gini, escala y el nivel de inversión de capital.

h) En el caso de variables ordinales, creo que es conveniente usar Gamma, que sin duda será alta para la asociación que Ud. postula.
Cresto ha dicho que…
Brevemente: el IMec, tal y como Ud. dice, intenta aproximarse a la inversión de capital. Pero en todo caso es una componente de la inversión total. La que refiere al capital fijo, e incluso tampoco al total del capital fijo, porque no estamos incluyendo, por ejemplo, materias primas. Pero creo que es lo más que se puede hacer con datos censales y sin recurrir a modelos econométricos (cosa que no manejamos del todo bien). Un adelanto: la relación IMEC / cortes se incrementa en los departamentos con alta proporción de asalariados.

Lo que dice acerca de que la ausencia de maquinarias no implica una ausencia de mecanización es cierto. Por eso es necesaria la construcción de un índice complejo que abarque esas dos dimensiones: existencia de maquinarias en las explotaciones y contratación de maquinaria para las labores. Eso es lo que humildemente intenté…

Pero, si, sí, finalmente me ha convencido de la necesidad de realizar algunas otras pruebitas de validación para IMec. Incorporaremos en principio el noreste para ver si el índice logra captar la heterogeneidad entre las dos regiones. Téngame paciencia... veremos, veremos… después lo sabremos.

Lo que Ud. dice del Gini me parece atinado. Yo me había olvidado que Ud. había tenido que armar intervalos más homogéneos. Intentaremos calcular el Gini “original”. Pero le adelanto que al controlar la relación IMec / cortes, por el Gini, lo que aparece es que se especifica la relación en el sentido que Ud. apunta: en aquellos departamentos con bajo Gini la relación IMEC / cortes se incrementa. Estoy armando un modelito de covarianzas de Lazarsfeld… cuando esté listo lo subo.
Habría que ver como funciona con el índice “original” calculado solo para la pampeana.

Ultimo: me intrigó la propuesta de inferencia ecológica que plantea. El problema es que esa técnica no la conozco en profundidad. Pero estoy dispuesto a aprender. De cualquier forma le recuerdo que no estoy en desacuerdo (al menos en principio) con su afirmación acerca de los “iguales”. De hecho, como le dije, hay más protestas en aquellos departamentos con gini bajo y con alta mecanización. La objeción es más bien a nivel conceptual: baja superficie no implica necesariamente baja inversión de capital (menos en la región pampeana; en mi opinión esto si podría darse en mayor medida en el noreste, pero justamente porque la estructura agraria es diferente). Ahora bien, para no quedarme en un planteo teórico abstracto (cosa que no me gusta para nada) es que armamos este índice…

Un saludo grande y mil gracias por los comentarios.
Anónimo ha dicho que…
Cresto, ante todo le agradezco por la oportunidad de intercambiar opiniones a un nivel técnico infrecuente en la heterogénea densidad de la blogósfera.

Le pido disculpas por insistir en ampliar la cobertura geográfica del estudio. Ciertamente recopilar y organizar los datos es muy costoso, especialmente una vez que con el conjunto de datos reunidos la asociación hipotetizada se verifica.

Respecto a la inferencia ecológica, hay links, bibliografía y software aquí. Sería necesario un indicador de la proporción de la superficie mecanizada o con inversión de capital para cada departamento. Si esta proporción correlaciona con la proporción de superficies con explotaciones pequeñas y medianas, puede estimarse su proporción de superficie mecanizada por varios métodos. Los resultados podrían controlarse por los datos por escala de explotación a nivel provincia que se hallan disponibles. Claro que todo esto no sería necesario si se obtuviera acceso a los datos base del INDEC, cosa no imposible pero probablemente no sin costos adicionales.

Le dejo acá el Gini original para Pampeana. Me gusta la posibilidad de replicación, por eso pongo a disposición mis datos. Que la información sea de conocimiento común por otra parte reduce la posibilidad de discusiones insustanciales o mal enfocadas.

Sin duda uno de los capítulos centrales de su investigación es la justificación metodológica de la construcción del índice de mecanización, ya que resulta fundamental al esquema teórico planteado.

También me parece importante desestimar la idea que explotación pequeña y mediana equivale a productor poco capitalizado, como si los "pequeños y medianos" (y en especial los medianos) fueran con mucha frecuencia campesinos pobres que a duras penas subsisten vendiendo al mercado lo que les queda de lo que producen para autoconsumo. Nada que ver. En un sentido general y se quiere marxista, el campo argentino está fuertemente integrado al sistema capitalista, porque produce para el mercado mundial en las condiciones impuestas por el sistema internacional.

En el contexto actual de agflación, buena parte de los pequeños y medianos son nuevos sujetos económicos que buscan asegurar su posición en la estructura social ante un orden político que muestra fuerte inclinación a apropiarse de sus beneficios en función de la centralización del poder, que es condición necesaria de reformas sociales de mayor alcance. Por eso la verificación del hecho que la protesta la protagonizan unos "iguales" (es decir, una clase definida por semejanzas típicas en su situación de mercado) tiene a mi juicio consecuencias sociológicas y políticas relevantes.
Cresto ha dicho que…
Vio? al final llegamos a un acuerdo. Quizá estábamos más de acuerdo de lo que suponíamos...

Voy a revisar lo de la inferencia ecológica, aunque será para dentro de un tiempo. Estoy trabajando (creo que se lo había comentando, pero en su blog) en algunos indicadores referidos a la base social del Kirchnerismo (que probablemente se convierta en "las bases actuales del peronismo"). Pero estoy lento en la confección de los datos electorales para el 2003.

Si me voy a poner a ver el tema del IMec, a eso me comprometo.

Espero que actualice su blog, a ver en que anda.

Ah, pregunta: ¿es estadístico o algo similar?
Anónimo ha dicho que…
No, estadístico no soy, aunque estudié algo de eso después de terminar ciencias políticas.

Entradas populares de este blog

El último teorema de Fermat y la unidad de la ciencia

La campaña blogueril por la "libertad de pronósticos de inflación"

Inferencia ecológica (o una introducción a algunos posts que se vendrán)