El potencial del big data en la economía

POR CARLOS GARCÍA / PRINCIPAL DATA ENGINEER EN HTECH
Vivimos en una época plagada de información y disrupción y, aunque el estudio financiero nos puede ayudar a identificar estos riesgos es momento de dar la milla extra combinándolo con nuestro expertise tecnológico para amplificar el impacto de nuestras acciones. Y aquí es donde el big data nos abre un sinfín de oportunidades.

Hay que tomar en cuenta que el conocimiento de nuestro entorno económico siempre es fundamental para poder entender el desempeño de nuestras organizaciones. Por lo tanto, verlas como una entidad separada de lo que vive el mercado como conjunto no sólo puede llegar a ser ingenuo, sino también peligroso, debido a que siempre habrá riesgos externos que influyan en la rentabilidad de nuestras operaciones.

Les invitamos a leer: El big data y su impacto en la rentabilidad de las empresas

¿Qué es big data?

Desde una perspectiva no técnica es posible que la respuesta a esta pregunta se limite a hablar de la cantidad de datos que tenemos que manejar como humanidad, pero la realidad es que el concepto también considera la velocidad y la variedad de los datos con los que contamos.

La velocidad de los datos se refiere al gran valor que éstos pueden llegar a tener cuando se procesan en tiempo real y no de manera histórica, como estamos acostumbrados a procesar. Por ejemplo, ¿de qué sirve a un banco un algoritmo de detección de fraude si no lo puede implementar en tiempo real para asegurar las millones de transacciones que procesa cada minuto?

Por otro lado, el concepto de variedad de los datos juega con la idea de que nuestro mundo físico no está siempre descrito con información tabular, sino que también produce una cantidad gigantesca de datos no estructurados como imágenes, fragmentos de noticias, sonido e incluso reacciones sociales de 280 caracteres llamados tuits.

Es aquí donde el concepto se eleva en varias magnitudes de dificultad, ya que no únicamente tenemos que encontrar formas de guardar e indexar grandes cantidades de datos (como ya lo habíamos hecho con los sistemas tradicionales de bases de datos), sino que también debemos construir tecnología que lo haga en tiempo real, que tenga la capacidad de manejar datos no estructurados y que, además de todo lo anterior, pueda procesar y relacionar los distintos datos para producir información de utilidad.

Big data dentro de la investigación económica

Actualmente, podemos observar cómo esta tecnología empieza a influir en el estudio académico de la economía y las finanzas debido al gran volumen de datos en tiempo real que podemos obtener, tanto de la industria privada como del sector público.

Hoy podemos observar el nacimiento de nuevos índices económicos. Uno de ellos es el Billion Prices Project (BPP) del Instituto Tecnológico de Massachusetts (MIT, por sus siglas en inglés), en el que la academia se une con la iniciativa privada para obtener millones de precios (y atributos) de productos, para así crear un índice de precios diarios.

A pesar de que estos datos están sesgados a productos comercializados en línea, es interesante que, aun así, el comportamiento entre este método y el Índice de Precios al Consumidor (CPI, por sus siglas en inglés) publicado en Estados Unidos es bastante similar.

Por ende, podemos concluir que el BPP sirve como:

● Una buena guía diaria de comparación con el CPI.
● Una alternativa para países en los que los gobiernos no publican este tipo de índices con frecuencia.
● Una referencia para los países en los que es muy difícil, o casi imposible, llevar un registro correcto del CPI, como es el caso de Argentina, donde el BPP aumenta más rápido que el CPI oficial reportado (esto en 2014).

Como mencionamos anteriormente, no sólo el volumen define al big data, sino también la variedad de la que surgen índices completamente nuevos basados en datos no relacionados, como el de Baker, Bloom y Davis, en el que se analizan los textos completos de los periódicos líderes en difusión, para calcular un index of economic policy uncertainty (EPU).

Machine learning y la economía

El estudio económico y financiero tiene una fuerte relación con el uso de modelos matemáticos. Apoyarnos en modelos estadísticos nos ayuda a entender de una mejor manera lo que ocurre a nuestro alrededor y cómo las diferentes variables observables influyen en el resultado que intentamos medir.

Aquí es donde entra la pregunta: ¿es el machine learning una alternativa viable a los métodos tradicionales estadísticos en la investigación económica? La respuesta, como en la mayoría de las ocasiones es: depende.

Aunque podemos reconocer que las diferentes técnicas de machine learning (que utiliza los datos procesados por el big data) son fundamentales para entender de mejor manera nuestro entorno, no siempre son las soluciones a nuestras necesidades en la toma de decisiones económicas.

La mayor parte del tiempo la tecnología asociada al término machine learning va fuertemente relacionada con la necesidad de “predecir” resultados específicos a partir de un conjunto de variables descriptivas, mediante el uso de un modelo generado y entrenado a partir de código.

Muchas veces este modelo termina siendo una caja negra, ya que podemos ignorar cómo fue que se llegó al resultado, mientras la predicción sea correcta. Es aquí donde las ventajas del uso de las técnicas de machine learning se desvían un poco de las necesidades de la investigación económica.

Mientras que en el machine learning nos preocupamos por predecir, en la economía el enfoque va más relacionado con el poder explicativo que podemos asociar con las variables que investigamos. No nos interesa la predicción, nos interesa la composición del modelo para poder formular estrategias fiscales, económicas y financieras, que nos ayuden a afianzarnos dentro del mercado en el que tratamos de competir.

Por lo anterior, es indispensable tener talento en ingeniería dentro de nuestras organizaciones, pero también talento económico y financiero que nos ayude a utilizar de mejor manera todos los datos que podemos llegar a recolectar de nuestras operaciones diarias.

Aunque el machine learning es una herramienta fundamental en esta época, hay que usarla con cuidado dentro de nuestra percepción financiera. En ocasiones lo que nos interesa al momento de formar criterios económicos y financieros es la causa de los fenómenos y no tanto su predicción.

Por lo anterior, es fundamental cuestionarnos cuál es el motivo de nuestra investigación para poder decidir si lo que se usará son métodos econométricos tradicionales o un enfoque más sofisticado con métodos de machine learning.