Los artículos publicados por mi buen amigo y brillante sociólogo Juan Diez Nicolas en la sección “El mundo tras el COVID”, que tan oportunamente ha abierto nuestra Academia, ponen sobre la mesa un tema que es objeto de polémica frecuente: la capacidad informativa de las estadísticas. Esta cuestión adquiere ahora un especial protagonismo ante la confusión que están creando en la ciudadanía las informaciones sobre algo tan candente como la pandemia y su evolución, a nivel nacional y en las diferentes regiones, provincias, comarcas, municipios y distritos. Quisiera aquí añadir algunos comentarios a sus acertados puntos de vista.
El objeto de las estadísticas es proporcionar un retrato esquemático, pero lo más informativo posible, de la realidad. Y este retrato debe servir, no solo para indicarnos lo que ocurre en un determinado contexto sino también para comparar la situación entre colectivos varios, como por ejemplo distintas regiones, o diferentes momentos en una misma población. Pero en realidad el dato estadístico es solamente una cifra, carente por sí misma de valor informativo mientras no se interprete dentro del contexto en el que ha sido recogida o calculada. Este contexto es lo que en términos técnicos se llama el metadato. El metadato debe acompañar necesariamente al dato para que éste adquiera su significado, y debe incluir como mínimo a) unas definiciones claras e inequívocas del fenómeno a medir, b) un sistema consistente de clasificación de los posibles resultados del fenómeno, c) una determinación precisa tanto del ámbito poblacional y geográfico como del periodo de tiempo a que corresponden los datos y d) una descripción detallada de las metodologías utilizadas en el proceso.
Los organismos productores de estadísticas oficiales publican siempre los metadatos junto con los datos. Otra cosa distinta es la presentación que puedan hacer de esos datos los medios de comunicación que, además de verse limitados en espacio o tiempo, pueden eventualmente albergar intencionalidades que vayan más allá de la de informar como, por ejemplo, la de tratar de contrarrestar en lo posible el pánico natural de los ciudadanos ante una pandemia, transmitiendo tranquilidad. Así, la publicación de la cifra de contagiados en Brasil junto a la de contagiados en España puede generar una cierta sensación inicial de alivio en los lectores o telespectadores españoles, en tanto no caigan en la cuenta de que Brasil tiene una población que es aproximadamente 4,5 veces la nuestra.
La realidad resulta un poco mejor retratada si calculamos el cociente entre los contagiados y la cifra de población, con objeto de aproximarnos a algo así como la tasa de contagios “per cápita”. Pero tampoco este cociente es un buen indicador, ni para reflejar la situación ni para establecer comparaciones, porque la cifra de contagiados se obtiene en condiciones que sesgan el significado del cociente. Sería muy informativo si se calculara tras hacer pruebas a la totalidad de la población en estudio, pero la realidad es que solamente se hacen cada día a un cierto número de personas, que no es necesariamente proporcional al tamaño de la población y que además puede variar de un día a otro. Parece razonable suponer que el número de casos detectados crezca si se aumenta el número de tests realizados, lo que hará subir la tasa, aunque la incidencia de la pandemia siga siendo la misma.
Una segunda posibilidad es considerar el cociente entre casos detectados y personas examinadas. Sin duda existe una cierta relación entre estas dos cifras, y algunos países las publican conjuntamente, por considerar que el número de tests realizados en el día es un marco de referencia útil para la interpretación de la otra cifra, pero ninguno de ellos facilita el cociente entre ambas porque, en general, tampoco sería informativo. La intencionalidad de las pruebas diagnósticas no es tanto proporcionar datos estadísticos como tratar de frenar los contagios estableciendo cuarentenas para los afectados, y seguramente este objetivo sanitario se consigue mejor intensificando las pruebas, es decir, seleccionando preferentemente la población a examinar, dentro de las zonas en las que el virus está más extendido. En este caso el cociente que se obtenga sobreestimará la tasa de contagios en el total de la población.
Existe un procedimiento de estimar la verdadera incidencia de la epidemia sin necesidad de hacer pruebas a toda la población, y es seleccionar las personas a analizar mediante una muestra aleatoria en la que todos los segmentos de la población estén adecuadamente representados, del tipo de las que utiliza el Instituto Nacional de Estadística para estudiar el mercado laboral, o el consumo de los hogares. Pero estas encuestas no están exentas de problemas. En primer lugar, resultan muy caras, lo que lógicamente reduce la frecuencia con la que se puede actualizar la información. De hecho, en algunos países esta posibilidad se ha desechado tras largas discusiones, en base al argumento de que el dinero que cuestan estas encuestas puede ser mejor aprovechado en la lucha contra la pandemia haciendo selecciones no aleatorias y aumentando las muestras en las zonas más afectadas. En segundo lugar, un tamaño de muestra asequible, tanto en términos técnicos como presupuestarios, limita la posibilidad de desagregaciones geográficas, de manera que sería problemático obtener estimaciones fiables a nivel de municipio y, por supuesto, de distrito. Además, las encuestas son operaciones complejas cuyos resultados tardan algún tiempo en procesarse, con lo que el retrato de la realidad nos va a llegar con un cierto retraso, un aspecto crucial cuando se precisa tomar medidas urgentes. Por último, no olvidemos que el éxito de una encuesta depende en muy buena medida de la cooperación de los ciudadanos participantes. Si en las zonas donde abunda la economía sumergida los informantes se mostrasen más renuentes a realizar la prueba por miedo a ver reducidos sus ingresos -o incluso a perder su precario empleo- en caso de ser identificados como asintomáticos, este segmento de la población quedaría infrarrepresentado y las cifras resultantes estarían también sesgadas, es decir, no proporcionarían un buen retrato de la realidad.
Hasta aquí los problemas metodológicos. Pero el metadato va más allá: requiere unas definiciones y clasificaciones inequívocas y estables, y comunes a todos los colectivos que vayan a ser comparados. Y aquí entramos ya en el terreno sanitario. ¿Se están haciendo los mismos tests en todos los hospitales? ¿Tienen todos ellos una fiabilidad similar? Hay que tener en cuenta, además, que nos enfrentamos a un fenómeno totalmente nuevo sobre el que la medicina ha ido realizando progresos muy rápidos, en un proceso de “learning by doing” contra reloj. Los métodos de detección se han ido perfeccionando, afortunadamente, pero cada avance ha supuesto un cambio y, por consiguiente, una ruptura en la consistencia de la serie de datos, lo que limita bastante el significado de las curvas que se publican.
Una variable aparentemente menos problemática es el número de ingresados en hospitales y en UCI. Estos datos (como casi todos los referidos a la pandemia) los compila la Red Nacional de Vigilancia Epidemiológica, RENAVE -organismo vinculado al Instituto de Salud Carlos III- quien a su vez los recibe de las Consejerías de Salud de las CCAA. Son datos de origen registral, y tienen todas las ventajas que caracterizan a este tipo de información: pueden producirse a un coste asequible, con mucha mayor frecuencia, y ser compilados y difundidos en tiempo prácticamente real. Su calidad va a depender de lo rigurosamente que se cumplan los requisitos de buen funcionamiento de un registro administrativo. En primer lugar, que exista un protocolo claro y compartido por todos los centros sanitarios sobre las condiciones bajo las cuales un enfermo debe -o no debe- ser ingresado, y que esta decisión no se vea afectada por criterios de disponibilidad de camas u otros ajenos al estado del enfermo. En segundo lugar, que se registren adecuadamente todos los casos y solo ellos, sin que se produzcan omisiones, duplicaciones o inclusiones indebidas. Por último, es también importante que las conexiones de los centros de salud con las respectivas Consejerías y las de estas con el RENAVE sean fluidas para que se minimicen los desfases temporales en la transmisión de la información. Alguno de estos puntos parece que todavía presenta problemas. Pero el funcionamiento de los registros administrativos suele ir mejorando a medida que se utilizan sus datos, pues al aprendizaje que naturalmente genera la práctica se une el estímulo que para los gestores del registro suponen las demandas y críticas constructivas de los usuarios. Es lo que se conoce como “el círculo virtuoso de las estadísticas”: su uso frecuente propicia generalmente una mejora de su calidad.
Un tercer indicador importante es la cifra de fallecidos. Y aquí también ha habido algunos problemas, sobre todo al principio de la pandemia. Los hospitales han registrado las defunciones por coronavirus ocurridas en ellos. Respecto a los fallecidos fuera de los hospitales no siempre ha sido fácil identificar las causas de muerte, lo que en ocasiones solo hubiese sido posible mediante una autopsia. Esto ha supuesto un desfase entre las defunciones por coronavirus registradas y las reales, desfase cuya magnitud no conocemos realmente.
El INE recoge de los Registros Civiles los fallecimientos con especificación de la causa de muerte, y publica estas cifras. Aunque la especificación de las causas de muerte haya podido presentar problemas durante las fases más agudas de la pandemia, la cifra de defunciones sí es muy fiable. Por ello se ha intentado estimar el número de fallecidos por coronavirus restando de las defunciones en los meses de pandemia las ocurridas en los mismos meses del año anterior. Esta estimación parte de la hipótesis de que, de no haber sobrevenido la pandemia, las defunciones hubieran sido las mismas en 2020 y en 2019. Pero la pirámide de la población, es decir, su estructura por edades evoluciona con el tiempo, y esto afecta lógicamente a las tasas de mortalidad. Por eso algunos organismos sanitarios elaboran previsiones de fallecimientos para cada año teniendo en cuenta estos cambios. La diferencia entre las defunciones así previstas y las realmente ocurridas es otra forma de estimar las atribuibles al COVID. Pero en ambos casos estamos hablando de estimaciones. La cifra exacta de fallecidos como consecuencia del COVID no la conocemos.
Con objeto de facilitar estas estimaciones el INE ha empezado a estimar a su vez la cifra de defunciones semanales: las viene publicando cada dos semanas, con un desfase de diez días. Hay que advertir que las engloba dentro del grupo de “estadísticas experimentales” es decir, estadísticas que son especialmente demandadas pero que están aún en periodo de estudio, y para las que no se garantizan los niveles de calidad de las estadísticas habituales. En realidad, lo que ocurre en este caso es que existe todavía en España un pequeño porcentaje de registros civiles (aproximadamente un 8%) que no están informatizados y envían los datos en soporte papel. Esto ralentiza su incorporación a las cifras totales, de manera que para poder publicar éstas en un plazo de tan solo diez días el INE se ve obligado a estimar los datos de esos registros con modelos matemáticos, aún en vías de experimentación.
No es éste el único desafío que el INE ha tenido que afrontar. La vida en tiempos del COVID no ha sido fácil para nadie, tampoco para los productores de estadísticas oficiales, en España y en el mundo. No ha sido fácil, por ejemplo, calcular el Índice de Precios de Consumo cuando muchos de los establecimientos donde éstos se recogen estaban cerrados. Ni obtener la información habitual sobre la economía de los hogares sin poder hacer encuestas domiciliarias. Y podríamos enumerar una larga lista de impedimentos similares originados por la pandemia y sus restricciones. El INE se ha visto obligado a identificar rápidamente fuentes complementarias de información y a desarrollar contra reloj nuevas metodologías con objeto de suplir estas carencias. A esto hay que añadir que, ante una situación imprevisible y que bien puede calificarse de catástrofe, los gobiernos han tenido que tomar decisiones muy rápidas y han necesitado para ello conocer la evolución de la economía prácticamente en tiempo real. Ha sido necesario construir indicadores adelantados, o estimaciones previas de los indicadores más relevantes, para facilitarlas lo antes posible. Es decir, los estadísticos se han visto obligados a producir más datos, más rápidamente y sorteando nuevos impedimentos y dificultades. Y por añadidura, todo ello en teletrabajo. Afortunadamente el alto nivel de profesionalidad del INE ha permitido superar estos obstáculos, y los indicadores han podido ser publicados con los niveles de calidad acostumbrados y sin retrasos en el calendario. Una auténtica hazaña digna de reconocimiento.
También ha colaborado el INE con las instituciones sanitarias en varios estudios relacionados con el COVID, y continúa haciéndolo. Es muy importante disponer de buenas estadísticas sobre la evolución de la pandemia, entre otras razones porque son fundamentales para valorar la eficacia real de las diversas medidas que se están tomando. Pero de momento no es fácil establecer comparaciones fiables sobre un fenómeno que está todavía en una fase transitoria, de evolución incierta, y del que se desconocen aún muchos aspectos, pues como dice el famoso economista Amartya Sen, “ninguna medición puede aspirar a ser más precisa que el fenómeno que trata de medir”
A medida que el proceso se vaya estabilizando y se vayan conociendo mejor sus características también las estadísticas irán mejorando. Y todo esto podría tener su lado positivo: las carencias de que ahora nos lamentamos pueden resultar un estímulo para el desarrollo de nuevas metodologías– pensemos en los avances gigantescos de las técnicas matemáticas y estadísticas inducidos por la segunda guerra mundial- y, adicionalmente, un acicate para mejorar el funcionamiento de nuestros registros administrativos.
Los artículos publicados por mi buen amigo y brillante sociólogo Juan Diez Nicolas en la sección “El mundo tras el COVID”, que tan oportunamente ha abierto nuestra Academia, ponen sobre la mesa un tema que es objeto de polémica frecuente: la capacidad informativa de las estadísticas. Esta cuestión adquiere ahora un especial protagonismo ante la confusión que están creando en la ciudadanía las informaciones sobre algo tan candente como la pandemia y su evolución, a nivel nacional y en las diferentes regiones, provincias, comarcas, municipios y distritos. Quisiera aquí añadir algunos comentarios a sus acertados puntos de vista,
El objeto de las estadísticas es proporcionar un retrato esquemático, pero lo más informativo posible, de la realidad. Y este retrato debe servir, no solo para indicarnos lo que ocurre en un determinado contexto sino también para comparar la situación entre colectivos varios, como por ejemplo distintas regiones, o diferentes momentos en una misma población. Pero en realidad el dato estadístico es solamente una cifra, carente por sí misma de valor informativo mientras no se interprete dentro del contexto en el que ha sido recogida o calculada. Este contexto es lo que en términos técnicos se llama el metadato. El metadato debe acompañar necesariamente al dato para que éste adquiera su significado, y debe incluir como mínimo a) unas definiciones claras e inequívocas del fenómeno a medir, b) un sistema consistente de clasificación de los posibles resultados del fenómeno, c) una determinación precisa tanto del ámbito poblacional y geográfico como del periodo de tiempo a que corresponden los datos y d) una descripción detallada de las metodologías utilizadas en el proceso.
Los organismos productores de estadísticas oficiales publican siempre los metadatos junto con los datos. Otra cosa distinta es la presentación que puedan hacer de esos datos los medios de comunicación que, además de verse limitados en espacio o tiempo, pueden eventualmente albergar intencionalidades que vayan más allá de la de informar como, por ejemplo, la de tratar de contrarrestar en lo posible el pánico natural de los ciudadanos ante una pandemia, transmitiendo tranquilidad. Así, la publicación de la cifra de contagiados en Brasil junto a la de contagiados en España puede generar una cierta sensación inicial de alivio en los lectores o telespectadores españoles, en tanto no caigan en la cuenta de que Brasil tiene una población que es aproximadamente 4,5 veces la nuestra.
La realidad resulta un poco mejor retratada si calculamos el cociente entre los contagiados y la cifra de población, con objeto de aproximarnos a algo así como la tasa de contagios “per cápita”. Pero tampoco este cociente es un buen indicador, ni para reflejar la situación ni para establecer comparaciones, porque la cifra de contagiados se obtiene en condiciones que sesgan el significado del cociente. Sería muy informativo si se calculara tras hacer pruebas a la totalidad de la población en estudio, pero la realidad es que solamente se hacen cada día a un cierto número de personas, que no es necesariamente proporcional al tamaño de la población y que además puede variar de un día a otro. Parece razonable suponer que el número de casos detectados crezca si se aumenta el número de tests realizados, lo que hará subir la tasa, aunque la incidencia de la pandemia siga siendo la misma.
Una segunda posibilidad es considerar el cociente entre casos detectados y personas examinadas. Sin duda existe una cierta relación entre estas dos cifras, y algunos países las publican conjuntamente, por considerar que el número de tests realizados en el día es un marco de referencia útil para la interpretación de la otra cifra, pero ninguno de ellos facilita el cociente entre ambas porque, en general, tampoco sería informativo. La intencionalidad de las pruebas diagnósticas no es tanto proporcionar datos estadísticos como tratar de frenar los contagios estableciendo cuarentenas para los afectados, y seguramente este objetivo sanitario se consigue mejor intensificando las pruebas, es decir, seleccionando preferentemente la población a examinar, dentro de las zonas en las que el virus está más extendido. En este caso el cociente que se obtenga sobreestimará la tasa de contagios en el total de la población.
Existe un procedimiento de estimar la verdadera incidencia de la epidemia sin necesidad de hacer pruebas a toda la población, y es seleccionar las personas a analizar mediante una muestra aleatoria en la que todos los segmentos de la población estén adecuadamente representados, del tipo de las que utiliza el Instituto Nacional de Estadística para estudiar el mercado laboral, o el consumo de los hogares. Pero estas encuestas no están exentas de problemas. En primer lugar, resultan muy caras, lo que lógicamente reduce la frecuencia con la que se puede actualizar la información. De hecho, en algunos países esta posibilidad se ha desechado tras largas discusiones, en base al argumento de que el dinero que cuestan estas encuestas puede ser mejor aprovechado en la lucha contra la pandemia haciendo selecciones no aleatorias y aumentando las muestras en las zonas más afectadas. En segundo lugar, un tamaño de muestra asequible, tanto en términos técnicos como presupuestarios, limita la posibilidad de desagregaciones geográficas, de manera que sería problemático obtener estimaciones fiables a nivel de municipio y, por supuesto, de distrito. Además, las encuestas son operaciones complejas cuyos resultados tardan algún tiempo en procesarse, con lo que el retrato de la realidad nos va a llegar con un cierto retraso, un aspecto crucial cuando se precisa tomar medidas urgentes. Por último, no olvidemos que el éxito de una encuesta depende en muy buena medida de la cooperación de los ciudadanos participantes. Si en las zonas donde abunda la economía sumergida los informantes se mostrasen más renuentes a realizar la prueba por miedo a ver reducidos sus ingresos -o incluso a perder su precario empleo- en caso de ser identificados como asintomáticos, este segmento de la población quedaría infrarrepresentado y las cifras resultantes estarían también sesgadas, es decir, no proporcionarían un buen retrato de la realidad.
Hasta aquí los problemas metodológicos. Pero el metadato va más allá: requiere unas definiciones y clasificaciones inequívocas y estables, y comunes a todos los colectivos que vayan a ser comparados. Y aquí entramos ya en el terreno sanitario. ¿Se están haciendo los mismos tests en todos los hospitales? ¿Tienen todos ellos una fiabilidad similar? Hay que tener en cuenta, además, que nos enfrentamos a un fenómeno totalmente nuevo sobre el que la medicina ha ido realizando progresos muy rápidos, en un proceso de “learning by doing” contra reloj. Los métodos de detección se han ido perfeccionando, afortunadamente, pero cada avance ha supuesto un cambio y, por consiguiente, una ruptura en la consistencia de la serie de datos, lo que limita bastante el significado de las curvas que se publican.
Una variable aparentemente menos problemática es el número de ingresados en hospitales y en UCI. Estos datos (como casi todos los referidos a la pandemia) los compila la Red Nacional de Vigilancia Epidemiológica, RENAVE -organismo vinculado al Instituto de Salud Carlos III- quien a su vez los recibe de las Consejerías de Salud de las CCAA. Son datos de origen registral, y tienen todas las ventajas que caracterizan a este tipo de información: pueden producirse a un coste asequible, con mucha mayor frecuencia, y ser compilados y difundidos en tiempo prácticamente real. Su calidad va a depender de lo rigurosamente que se cumplan los requisitos de buen funcionamiento de un registro administrativo. En primer lugar, que exista un protocolo claro y compartido por todos los centros sanitarios sobre las condiciones bajo las cuales un enfermo debe -o no debe- ser ingresado, y que esta decisión no se vea afectada por criterios de disponibilidad de camas u otros ajenos al estado del enfermo. En segundo lugar, que se registren adecuadamente todos los casos y solo ellos, sin que se produzcan omisiones, duplicaciones o inclusiones indebidas. Por último, es también importante que las conexiones de los centros de salud con las respectivas Consejerías y las de estas con el RENAVE sean fluidas para que se minimicen los desfases temporales en la transmisión de la información. Alguno de estos puntos parece que todavía presenta problemas. Pero el funcionamiento de los registros administrativos suele ir mejorando a medida que se utilizan sus datos, pues al aprendizaje que naturalmente genera la práctica se une el estímulo que para los gestores del registro suponen las demandas y críticas constructivas de los usuarios. Es lo que se conoce como “el círculo virtuoso de las estadísticas”: su uso frecuente propicia generalmente una mejora de su calidad.
Un tercer indicador importante es la cifra de fallecidos. Y aquí también ha habido algunos problemas, sobre todo al principio de la pandemia. Los hospitales han registrado las defunciones por coronavirus ocurridas en ellos. Respecto a los fallecidos fuera de los hospitales no siempre ha sido fácil identificar las causas de muerte, lo que en ocasiones solo hubiese sido posible mediante una autopsia. Esto ha supuesto un desfase entre las defunciones por coronavirus registradas y las reales, desfase cuya magnitud no conocemos realmente.
El INE recoge de los Registros Civiles los fallecimientos con especificación de la causa de muerte, y publica estas cifras. Aunque la especificación de las causas de muerte haya podido presentar problemas durante las fases más agudas de la pandemia, la cifra de defunciones sí es muy fiable. Por ello se ha intentado estimar el número de fallecidos por coronavirus restando de las defunciones en los meses de pandemia las ocurridas en los mismos meses del año anterior. Esta estimación parte de la hipótesis de que, de no haber sobrevenido la pandemia, las defunciones hubieran sido las mismas en 2020 y en 2019. Pero la pirámide de la población, es decir, su estructura por edades evoluciona con el tiempo, y esto afecta lógicamente a las tasas de mortalidad. Por eso algunos organismos sanitarios elaboran previsiones de fallecimientos para cada año teniendo en cuenta estos cambios. La diferencia entre las defunciones así previstas y las realmente ocurridas es otra forma de estimar las atribuibles al COVID. Pero en ambos casos estamos hablando de estimaciones. La cifra exacta de fallecidos como consecuencia del COVID no la conocemos.
Con objeto de facilitar estas estimaciones el INE ha empezado a estimar a su vez la cifra de defunciones semanales: las viene publicando cada dos semanas, con un desfase de diez días. Hay que advertir que las engloba dentro del grupo de “estadísticas experimentales” es decir, estadísticas que son especialmente demandadas pero que están aún en periodo de estudio, y para las que no se garantizan los niveles de calidad de las estadísticas habituales. En realidad, lo que ocurre en este caso es que existe todavía en España un pequeño porcentaje de registros civiles (aproximadamente un 8%) que no están informatizados y envían los datos en soporte papel. Esto ralentiza su incorporación a las cifras totales, de manera que para poder publicar éstas en un plazo de tan solo diez días el INE se ve obligado a estimar los datos de esos registros con modelos matemáticos, aún en vías de experimentación.
No es éste el único desafío que el INE ha tenido que afrontar. La vida en tiempos del COVID no ha sido fácil para nadie, tampoco para los productores de estadísticas oficiales, en España y en el mundo. No ha sido fácil, por ejemplo, calcular el Índice de Precios de Consumo cuando muchos de los establecimientos donde éstos se recogen estaban cerrados. Ni obtener la información habitual sobre la economía de los hogares sin poder hacer encuestas domiciliarias. Y podríamos enumerar una larga lista de impedimentos similares originados por la pandemia y sus restricciones. El INE se ha visto obligado a identificar rápidamente fuentes complementarias de información y a desarrollar contra reloj nuevas metodologías con objeto de suplir estas carencias. A esto hay que añadir que, ante una situación imprevisible y que bien puede calificarse de catástrofe, los gobiernos han tenido que tomar decisiones muy rápidas y han necesitado para ello conocer la evolución de la economía prácticamente en tiempo real. Ha sido necesario construir indicadores adelantados, o estimaciones previas de los indicadores más relevantes, para facilitarlas lo antes posible. Es decir, los estadísticos se han visto obligados a producir más datos, más rápidamente y sorteando nuevos impedimentos y dificultades. Y por añadidura, todo ello en teletrabajo. Afortunadamente el alto nivel de profesionalidad del INE ha permitido superar estos obstáculos, y los indicadores han podido ser publicados con los niveles de calidad acostumbrados y sin retrasos en el calendario. Una auténtica hazaña digna de reconocimiento.
También ha colaborado el INE con las instituciones sanitarias en varios estudios relacionados con el COVID, y continúa haciéndolo. Es muy importante disponer de buenas estadísticas sobre la evolución de la pandemia, entre otras razones porque son fundamentales para valorar la eficacia real de las diversas medidas que se están tomando. Pero de momento no es fácil establecer comparaciones fiables sobre un fenómeno que está todavía en una fase transitoria, de evolución incierta, y del que se desconocen aún muchos aspectos, pues como dice el famoso economista Amartya Sen, “ninguna medición puede aspirar a ser más precisa que el fenómeno que trata de medir”
A medida que el proceso se vaya estabilizando y se vayan conociendo mejor sus características también las estadísticas irán mejorando. Y todo esto podría tener su lado positivo: las carencias de que ahora nos lamentamos pueden resultar un estímulo para el desarrollo de nuevas metodologías– pensemos en los avances gigantescos de las técnicas matemáticas y estadísticas inducidos por la segunda guerra mundial- y, adicionalmente, un acicate para mejorar el funcionamiento de nuestros registros administrativos.
Pilar Martín-Guzmán
Catedrática Emérita de Economía Aplicada
Universidad Autónoma de Madrid