sábado, 25 de agosto de 2012

Si torturas lo suficiente a los datos acabarán confesando cualquier cosa

Me encanta Gapminder. La agregación de cientos de series temporales en una herramienta de visualización poderosa es algo maravilloso. Recuerdo hace años cuando para un trabajo de econometría en la facultad o para la elaboración de mi trabajo de investigación la localización y procesamiento previo de los datos era una tarea de chinos. Normalmente los datos eran más escasos y estaban publicados en papel. A veces había cambios metodológicos en las series que obligaban a procesarlos antes de poderlos utilizar. Sin duda la disponibilidad actual de grandes repositorios de datos a todos los niveles es algo fenomenal... y peligroso.

He comentado ya varias veces en este blog que 'correlación no implica causalidad' y que hay que tener mucho cuidado con la correlación en series temporales. En general, creo que hay que tener mucho cuidado con la interpretación de datos si no se tiene un conocimiento adecuado de la realidad que representan. La ubicuidad de datos, estadísticas, series temporales animan al más pintado a buscar cuatro datos que le permitan "verificar" cualquier idea peregrina.

Para tratar de ilustrar lo que quiero decir, permítame el lector guiarle a través de un sencillo ejemplo:

Una de las regularidades empíricas más contrastadas en Economía es la relación negativa entre precio y cantidad demandada: cuanto mayor es el precio de algo ceteris paribus menor será la cantidad demandada por parte de los consumidores. Las palabrejas en latín son importantes. Significa 'permaneciendo el resto de factores constantes'. Se entenderá fácilmente con un ejemplo físico hablando de gases: a mayor presión, menor volumen... ceteris paribus, esto es, siempre que mantengamos la temperatura constante. Si variamos la temperatura la relación entre presión y volumen no tiene por qué cumplir el enunciado anterior.

Es cierto que no siempre se cumple la relación entre precio y cantidad demandada, pero son casos muy extraños.

Supongamos que alguien nos quiere convencer de que en realidad esta relación es un cuento chino. Podría acudir al INE y descargar unos datos que presento en el siguiente gráfico:

Permítame el lector que no revele todavía de qué bien se trata. Lo que está claro es que cuando el precio (de hecho un índice de precios mensual) es más alto mayor es la cantidad demandada de ese bien. Los datos son aplastantes. Ahora podríamos proponer, por ejemplo, seguir incrementando los precios para estimular al sector. O podríamos criticar la Teoría Económica que se estudia en las facultades ya que evidentemente no sirve para nada cuando se enfrenta a los 'datos reales'.

Pero ¿es ésto así?. La clave está en las palabrejas latinas anteriores: ceteris paribus. En los datos que se presentan en la gráfica hay elementos que distorsionan profundamente la información que podemos extraer de ellos, pero para ello hace falta disponer de un contexto: tener suficiente información como para poner en duda las conclusiones anteriores. En este ejemplo, tan pronto como revele de qué se trata, todos estaremos de acuerdo. En otros casos, en relación a realidades económicas más complejas en las que es más difícil entender el contexto que se halla detrás de los datos es necesario dejarse "guiar" por la opinión de quienes estudian y conocen en profundidad los fenómenos en cuestión.

Pero desvelemos ya el misterio. La cantidad del ejemplo es el porcentaje de ocupación hotelera. El precio es la relación de los precios de los servicios de alojamiento respecto al índice general de precios. Es evidente que en temporada alta los hoteles están más llenos y son más caros... y todos entendemos por qué: la gente disfruta principalmente de sus vacaciones en verano.

En este caso todo es bastante evidente, pero invito al lector a que se pregunte ante evidencias tan aplastantes como las del gráfico anterior si las cosas son así de claras o si alguien está tratando de darle gato por liebre.

viernes, 17 de agosto de 2012

La amatxo busca trabajo

En  entradas anteriores comentábamos alguno de los efectos de la crisis en relación a la tasa de actividad (porcentaje de personas trabajando o buscando empleo) de los más jóvenes. Hoy, con un título un poco traído por los pelos vamos a tocar otro aspecto de la oferta de trabajo: el incremento de la tasa de actividad femenina.

En la última Encuesta de Población Activa uno de los datos más preocupantes era el número de hogares en las que todos sus miembros activos estaban en el paro: ¡más de 1.700.000 hogares!. Teniendo en cuenta que a comienzos de 2007 esta cifra apenas eran 400.000 está claro que la situación se ha deteriorado sensiblemente. La EPA proporciona datos sobre éstas familias: cuantos miembros tienen, cuantos son activos, etc., pero éste no es el tema que quiero mostrar hoy.

En España (y en la mayor parte del mundo) la tasa de actividad femenina  acostumbra a caer a partir de los 25-30 años de edad. En muchos países esa tasa tiende a recuperarse a partir de los 40-45 años, pero no es éste el caso español. 

Era muy típico en un porcentaje significativo de familias en este país que el hombre trabajara fuera de casa y la mujer (a la que se referían con la horrorosa expresión de 'la parienta') se quedara en casa al cuidado de los hijos y del hogar. Pero la crisis está cambiando algunas cosas. Muchas mujeres que anteriormente no participaban en el mercado laboral están trabajando o buscando empleo porque hay que apoyar como sea la economía familiar. Los datos se ven claros en el siguiente gráfico:
Las tasas de actividad de los hombres se ve que no cambian mucho. En los primeros grupos de edad (entre 15 y 25 años), tal y como vimos aquí, la tasa de actividad ha disminuido. Ha aumentado ligeramente entre los 55 y 59 años. Tal vez porque hay menores oportunidades de acogerse a jubilaciones anticipadas o quizás por no aceptar reducciones de ingresos derivadas de las mismas en un momento en el que otros miembros de la familia puedan estar necesitados. En cualquier caso, las curvas roja (hombres, 2007) y azul (hombres, 2012) son muy parecidas.

Sin embargo los perfiles de las curvas verde (mujeres, 2007) y amarilla (mujeres, 2012) sí que son muy distintas. Si bien apenas hay diferencias en las tasas de actividad de las mujeres jóvenes (de menos de 30 años) es sorprendente el aumento en la tasa para edades superiores. En concreto, en la franja entre 50 y 60 años la tasa ha subido prácticamente 13 puntos porcentuales (del 57 al 70% en la franja 50-55 y del 41 al 56% en la franja de 55-60).

Parece que, efectivamente, y como decía en el título... la 'amatxo' está buscando trabajo.

miércoles, 15 de agosto de 2012

Cosas que están cambiando

La crisis está siendo larga. Muy larga. Tan larga que está provocando ya algunos cambios importantes más allá de los asuntos que copan los titulares y las pancartas. Son muchos los detalles, las cifras que nos indican que algo está cambiando. Hoy sólo me voy a detener en uno de esos aspectos: la formación de nuestros jóvenes.

Según datos de la OCDE recogidos en la página 182 del libro Nada es Gratis en 2008 ésta era la situación del nivel educativo de la población española en relación a los principales países de nuestro entorno:


No sé si vale la pena entrar a comentar datos que hablan por si mismos. No nos faltan universitarios: tenemos más que Alemania. Nos falta gente con FPII, técnico especialista o similares. Mientras los alemanes tienen un 60% nosotros tenemos la tercera parte. El drama es que en muchas empresas se contratan universitarios para ocupar esos puestos... y lo hacen mal, de modo que tenemos gente muy preparada por un lado y una falta de formación brutal por el otro. Ponemos a los cirujanos a cavar zanjas porque no tenemos palistas...


Pero parece que la gente joven se va dando cuenta de que no es bueno abandonar los estudios demasiado pronto. El gráfico siguiente muestra las proporción de jóvenes entre 16 y 19 años estudiando en el primer trimestre de cada año según la EPA.


Parece que desde el comienzo de la crisis la tendencia a estudiar, o dicho de otra manera, a no abandonar los estudios se refuerza. Y esto es esperanzador.

En el rango de edad de 20 a 24 años los datos son parecidos:

Nuestra juventud se está formando. Y eso es bueno. Tal vez no hoy. Tal vez no el año que viene, pero creo que son millones de pasos en la buena dirección.

viernes, 10 de agosto de 2012

Actividad y paro juvenil

Esta mañana leía el siguiente artículo publicado en el Diario de Noticias de Navarra: La reforma laboral dispara el paro juvenil en Navarra, que supera en 11 puntos a la media estatal.  Independientemente de si la reforma laboral genera o no genera paro (está claro que la no-reforma ya generó muchísimo) el dato es erróneo. El paro juvenil en Navarra es inferior a la media estatal. Leyendo la noticia, los 11 puntos son los que, según los poco comparables datos de UGT, separan el paro 'juvenil' de la media de paro en la Comunidad Foral.

El batiburrillo de conceptos y cifras es tal que creo que vale la pena sentarse un poco a valorar los datos proporcionados por UGT y ver si aportan algo nuevo. He intentado localizar el mencionado informe en la página de UGT de Navarra pero me ha resultado imposible encontrarlo, razón por la que me veo en la obligación de referirme a él sólo por lo que se menciona en el periódico y no de primera mano tal y como me gustaría. 

Lo primero que llama la atención es cómo se define el paro juvenil. Normalmente el paro juvenil se refiere al paro entre 16 y 25 años pero por algún motivo, UGT prefiere darlo entre 16 y 34... ¿por qué?. La verdad es que si se quiere llamar la atención sobre el paro juvenil en Navarra es mucho mejor quedarse con la definición estándar: mientras UGT da un 27,6%, el dato comparable según el INE entre 16 y 25 años es mucho más alarmante: ¡un 42,65%!. Luego volveré sobre esta cifra.

Otra cosa llamativa es que comparan el dato del paro entre 16 y 34 años con el general... y hay que tener en cuenta que los parados entre 16 y 34 años están incluídos en el dato general. Puestos a dar un dato verdaderamente alarmante sería mucho mejor comparar el dato de paro joven contra el dato de paro 'viejo', o sea, de los mayores de 35 años. Con las divisiones de grupos de edad del INE no me es posible calcular ese dato, pero si el paro de los menores de 35 es del 27% y el medio es del 16,4% el paro de los 'viejos' en Navarra no estará muy lejos del 11%.

Pero vayamos al INE a ver cómo está la cosa. Lo primero que conviene mirar, tratándose de la tasa de paro juvenil es la tasa de actividad: ¿cuántos jóvenes entre 16 y 25 años están trabajando o buscando empleo?. En principio, son edades en las que los jóvenes deberían estar formándose, estudiando, por lo que una baja tasa de actividad no es un mal indicador. Estos son los datos para España por comunidades autónomas en la última EPA correspondiente al segundo trimestre de 2012. 
En Navarra, el 36,68% de los jóvenes entre 16 y 25 años están trabajando o buscando empleo. Es sorprendente, por ejemplo el dato de las Islas Baleares... si un 53% está en esa situación me pregunto si la formación de los jóvenes no estará bastante descuidada. De hecho, en los años del boom de la construcción muchos jóvenes abandonaron sus estudios porque era relativamente fácil encontrar trabajos bien pagados con baja cualificación. Después han llegado las vacas flacas y todos sabemos qué ha ocurrido con ellos. De hecho, la tasa de actividad juvenil en Navarra ha venido cayendo en los últimos años como puede verse en el gráfico siguiente elaborado a partir de datos del INE:


La tasa de paro juvenil se muestra en el siguiente gráfico. Las cifras son espectaculares (mucho más que los datos que da UGT...):



Ahí podemos ver cómo el 42,65% de los jóvenes navarros que quieren trabajar no puede hacerlo. Es un triste consuelo que seamos la tercera comunidad autónoma con menos paro juvenil... sigue siendo muy alto.

Pero pongámoslo todo en perspectiva. El 42,65% del 36,68% es el 15,73%: 16 de cada 100 jóvenes navarros están en el paro. 21 están trabajando. De los otros 63 estarán probablemente un porcentaje muy alto formándose o estudiando. Y eso no es malo. A modo de curiosidad he calculado la proporción de jóvenes parados en cada comunidad autónoma (tasa de actividad x tasa de paro):



En España, 23 de cada 100 jóvenes entre 16 y 25 años está en el paro. En Navarra 15,7. Sólo datos.


P.S.- Parece que en el Diario de Noticias se han dado cuenta del error en el titular y lo han corregido, por lo que el enlace que he puesto al comienzo no funciona. La nueva versión, sin errores en el titular, se puede leer aquí.