Entendiendo la economía de los datos

Por: Enrrique Dans

Un interesante artículo sobre la economía de los datos escrito por Martin Casado y Peter Lauten en la página de Andreessen Horowitz, titulado «The empty promise of data moats«, plantea algunos postulados interesantes sobre la supuesta ventaja competitiva que los datos pueden significar, y bajo qué tipo de condiciones realmente pueden llegar a hacerlo.

Según los autores, los datos como tal no son una ventaja que permita a una compañía plantear una especie de foso que sus competidores no podrán cruzar. Poseer datos de calidad sobre los clientes y sobre las operaciones, y haber sido capaz de establecer una cultura analítica sólida puede ayudar a una compañía a establecer un conocimiento del negocio, de las variables importantes en el mismo o de sus clientes que puede permitirle establecer propuestas de valor diferenciales, pero en la práctica, los datos no responden a unas economías de escala o efectos de red como tales: el hecho de acumular más datos, a lo largo del tiempo, no permite disfrutar de mejores costes o de mejores sistemas analíticos, sino que incluso suele redundar en lo contrario: en mayores costes de almacenamiento, procesamiento y análisis.

Disponer de más datos puede ayudar a la hora de permitirte utilizar metodologías analíticas más potentes para extraer conclusiones y reglas de negocio. Sin embargo, ese efecto de la cantidad de datos desaparece en cuanto esas conclusiones son obtenidas con una calidad razonable y son evaluadas positivamente. A partir de ahí, el crecimiento en volumen de datos aporta realmente poco o nada, y menos aún configura algún tipo de barrera de entrada para posibles competidores que intenten plantear un modelo de negocio similar. Pasar de unos pocos clientes en un servicio a un millón de clientes es indudable que permite aprender mucho más del negocio y derivar reglas, sistemas de recomendación, etc. que posibles competidores pueden no tener, y por tanto, permite competir con ventajas frente a ellos. Sin embargo, cuando el número de datos ya posibilita obtener esas reglas, seguir acumulando datos es algo que, en muchos casos, no mejora las conclusiones obtenidas, y solo genera más costes, más ruido y más complejidad.

Con el tiempo, tus competidores no tienen que plantearse cómo obtener más datos que tú, sino simplemente cómo obtener en conjunto mínimo necesario de datos que les permita extraer conclusiones y análisis significativos y útiles. En ese sentido, nos alejaríamos, por tanto, de una concepción lineal de las economías de los datos, y pasaríamos a valorar una serie de conceptos más prácticos, como el ser capaces de evaluar qué dimensión tiene ese conjunto mínimo eficiente de datos, de entender los costes de adquisición de datos, su valor incremental o su nivel de frescura. Generar y almacenar nuevos datos puede ayudar a mantener unas reglas de negocio actualizadas, unos procesos de automatización avanzados que efectivamente tengan sentido o incluso a descubrir nuevos efectos, pero eso no debe llevarnos a convertirnos en data hoarders, no debe generar una obsesión por el almacenamiento de datos como si tuviéramos síndrome de Diógenes, porque eso, en realidad, contribuye muy poco a la generación de una ventaja competitiva sostenible.

Entender las reglas de la economía de los datos resulta cada vez más importante para todo tipo de compañías. En todo proyecto de analítica, de machine learning o de automatización avanzada, los costes verdaderamente significativos son aquellos en los que tenemos que incurrir para definir los objetivos que buscamos, para recoger y transformar los datos, y para plantear el análisis, limpieza y estructuración de los campos de datos que separa el ruido de la señal. Todos esos factores precisan, por supuesto, de una gran cantidad de datos, pero el efecto de esos datos no es lineal ni acumulativo, y plantear políticas adecuadas en ese sentido puede permitir el desarrollo de modelos no solo con más sentido económico, sino también más ágiles y dinámicos. A partir de unos datos adecuadamente estructurados y sin una obsesión por lo masivo, la aplicación de modelos es cada vez más sencilla. Y con el tiempo, lo será más aún.