¿Por qué los ratings ESG son tan diferentes?
A menudo, cada vez que una empresa, gestora, fondo o persona se interesa por el mundo de la sostenibilidad suele sorprenderse de que los ratings ESG sean tan diferentes.
Pedro Olazabal, CEO de Hands-on Impact, nos da las claves para entender por qué esto es así y cuáles son las medidas y regulaciones que se están trabajando para entender y reforzar la confianza y comparativa entre ratings de sostenibilidad.
Habitualmente, cada vez que una empresa, gestora, fondo o persona se interesa por el mundo de la sostenibilidad suele sorprenderse de que los ratings ESG sean tan diferentes.
Es algo sobre lo que reflexionamos todos porque sería ideal poder tener un índice de referencia que nos dijera “esto es sostenible y esto no lo es”. Pero una vez que uno entiende cómo se construye un rating ESG, entonces pasa a comprender que lo normal es que sean diferentes. Lo raro sería que fueran similares.
El objetivo final de un rating es obtener un “número” que me muestre cuán sostenible es una empresa. Para poder obtener ese número, el proceso de creación de un rating ESG* sigue 4 pasos que pueden originar divergencias en el resultado final.

1- Selección de categorías de evaluación
El primer paso consiste en seleccionar qué categorías de evaluación se van a considerar. Este listado de categorías o temas relevantes no está escrito en piedra en ningún sitio. Por tanto, cada institución que genere su propio rating se enfrenta a la decisión de incluir o excluir los temas que considere importantes.
Todos tenemos en la cabeza determinados temas que estarán con mucha probabilidad en cada uno de los ratings. Por ejemplo, cambio climático, diversidad e inclusión, residuos, derechos humanos, etc. Sin embargo, puede haber determinados temas que no sean tan conocidos y que se puedan encontrar en algunos ratings y no en otros. Este podría ser el caso de temas como acidificación o accesibilidad de producto.
Esto significa que en este primer paso ya podemos tener ratings ESG diferentes.
2- Evaluación o medición de las categorías
El segundo paso consiste en medir cada una de las categorías. Por ejemplo; ¿cómo vamos a medir si una empresa está actuando frente al cambio climático? ¿Preguntamos por su huella de carbono de Alcance 1 y 2? ¿Incluimos Alcance 3? ¿Preguntamos por su evolución? ¿Por sus compromisos futuros?
La evaluación de cada una de las categorías seleccionadas conlleva realizarse preguntas muy pertinentes para poder ser capaz de captar su complejidad, y la forma en la que la empresa está respondiendo ante ella.
En este paso, cada entidad que realiza un rating ESG entenderá de diferente manera qué preguntas ha de responder cada empresa. Por eso, en este momento nos encontramos con otro punto de divergencia que aumentará probablemente la diferencia entre resultados de ratings ESG.
3- Normalización
El tercer paso consiste en normalizar. Es a lo que coloquialmente llamamos como “solo se pueden sumar peras con peras, no peras con manzanas”. Resulta que uno de los indicadores que hemos obtenido se encuentra en m3 de agua, otro en kg CO2, otro en % de brecha salarial, y otros pueden ser respuestas cualitativas del tipo “disponemos de un plan de due dilligence de derechos humanos en nuestra cadena de suministro”.
La pregunta que sigue es “¿y ahora cómo obtenemos un solo número?”, “¿cómo sumamos cada una de esas respuestas?”
Necesitamos convertir las manzanas, los plátanos y los aguacates todos a peras. Y ese proceso de normalización puede ser muy complejo o muy sencillo.
En general, en los ratings ESG, los procesos de normalización suelen ser bastante sencillos y consisten en lo siguiente:
Cada una de las preguntas tiene diferentes opciones o unos baremos para asignar la puntuación máxima (1) u otras puntuaciones (entre 0 y 1). Por ejemplo, en una pregunta sobre brecha salarial podría ser:
- 0 puntos si la brecha salarial es mayor a 25%
- 0,2 puntos si la brecha salarial es mayor a 20% pero menor de 25%
- 0,4 puntos si la brecha salarial es mayor a 15% pero menor de 20%
- 0,6 puntos si la brecha salarial es mayor a 10% pero menor de 15%
- 0,8 puntos si la brecha salarial es mayor a 5% pero menor de 10%
- 1 punto si la brecha salarial es menor de 5%
Este mismo modelo se puede aplicar a cualquier tipo de preguntas.
En este paso se puede ver fácilmente que, dependiendo de cómo se normalice, los resultados pueden ser muy diferentes. Los puntos se pueden asignar de formas muy distintas y, por tanto, los ratings serán también muy dispares.
4- Ponderación
El cuarto paso consiste en ponderar. Una vez que ya se obtienen todas las respuestas con su número, surge la pregunta de si todas las categorías deben valer lo mismo. “¿Es más importante el cambio climático que la diversidad?” O incluso puede considerarse que algunas presuntas dentro de una misma categoría sean más importantes que otras.
Las preguntas que se estimen más importantes serán más ponderadas e influirán más en el resultado final.
El paso de la ponderación es, por tanto, otro paso en el que pueden surgir divergencias entre diferentes ratings ESG.
¿Y esto no debería ser dinámico por sectores?
Una vez terminado el rating siempre surge la pregunta. ¿No debería depender todo esto del sector de la empresa? ¿Y del tamaño? ¿Y de los países en los que opera? ¿Y de…?
Cada una de estas variables puede influir en cada uno de los pasos anteriores.
- Selección de categorías de evaluación. Por ejemplo: se puede hacer dependiente del sector, de tal manera que algunas categorías de evaluación no sean relevantes para algunos sectores.
- Evaluación o medición de las categorías. Por ejemplo: el número de preguntas o incluso las preguntas en sí mismo pueden ser diferentes dependiendo del tamaño de la empresa, del sector, etc.
- Normalización. Los puntos asignados a cada respuesta pueden variar según el sector. Por ejemplo: una huella de carbono puede ser muy alta en un sector y muy baja en otro.
- Ponderación. El valor que otorgamos a cada pregunta puede ser muy diferente dependiendo del tamaño o sector. Por ejemplo, la diversidad en una empresa muy pequeña puede ser poco relevante, pero muy relevante en una empresa grande.
Tabacaleras y ratings ESG
Cada cierto tiempo aparece una tabacalera con un rating ESG elevado. Esto genera un debate público interesante.
Sin entrar en el debate ético, lo que ocurre en estos casos es que los ratings de ESG suelen centrarse en las operaciones de las compañías pero no en los productos y servicios que proveen al mercado.
Así, puede ocurrir que una tabacalera tenga buenas prácticas en sus operaciones (estrategia net zero, cadena de suministro respeta derechos humanos, techo de cristal ausente, etc.) aunque tengan un producto dañino para la salud. Esto puede provocar que su rating sea elevado.
No es objetivo de esta entrada de blog mostrar nuestro parecer a este respecto, sino describir qué es lo que explica que esto ocurra.
Conclusiones
La elaboración de un rating de sostenibilidad conlleva un proceso de diferentes pasos inevitables. Cada uno de estos pasos requiere tomar decisiones que van a influir en el resultado final. Y estas decisiones dependen de cada institución y no es extraño que sean diferentes en cada entidad evaluadora.
El papel del regulador
Ante esto, la unión europea ya está empezando a dar señales de que va a organizar esta cuestión. La comisión ha anunciado que propone una regulación para los proveedores de ratings ESG: “This initiative aims to strengthen the reliability and comparability of ESG ratings”. Estaremos atentos.
*En realidad esto aplica a cualquier indicador sintético. Un indicador sintético o agregado es aquel que sintetiza o agrega varios indicadores con el objetivo de intentar captar realidades complejas.