Hablemos sobre precios de datos – Parte I

Vamos a sumergirnos más profundo. Imagina que ahora tienes un conjunto de datos de datos médicos que deseas poner a disposición para entrenar modelos de aprendizaje automático. Estos datos médicos se refieren a un problema de nicho pero muy importante, y hasta donde usted sabe, nadie más ha puesto un conjunto de datos similar en el mercado. Tal vez alguna otra organización médica o empresa ha reunido datos sobre el tema y ha vendido el acceso al mismo, pero eso sucedió a puerta cerrada como una negociación directa entre las dos partes. Por lo tanto, desea poner un precio inicial en su conjunto de datos como una señal para compradores potenciales. ¿Cuál debería ser el precio?

Aspecto de los datos de compra actuales (fuente: https://www.dowjones.com/dna/)

Hoy en día, la gran mayoría de las transacciones en torno a los datos se realizan como se describió anteriormente: se publica un precio fijo por adelantado o se requieren largas negociaciones. Los jugadores existentes que operan bajo una política de precios fijos son en su mayoría agregadores de datos, que compran datos de una variedad de fuentes, los agregan y transforman, antes de revenderlos, así como proveedores de datos con marcas fuertes, como Bloomberg (2). En ambos casos, su fuerte posición les otorga un alto poder de mercado, que utilizan naturalmente para maximizar las ganancias, ya que son empresas. Otros vendedores de datos con menos poder de mercado generalmente operan por consulta: permiten que los compradores interesados ​​se pongan en contacto con ellos y negocien el precio directamente con ellos.

Estos enfoques funcionan por ahora pero son muy ineficientes desde el punto de vista del mercado. La falta de precios transparentes beneficia a los jugadores más grandes, ya que pueden mantener precios altos debido a sus fuertes marcas. Incluso los proveedores que ofrecen precios fijos para sus productos no los muestran abiertamente. Los proveedores que toman el otro camino operan de una manera de alta fricción, en un intento de maximizar el valor negociando un precio apropiado para cada cliente.

Sin embargo, imaginamos un mundo donde los datos de precio y los bienes comunes de datos estén fácilmente disponibles, obtener datos para su investigación o modelo de aprendizaje automático solo requiere unos pocos clics y los mercados de datos manejan cientos de miles de transacciones todos los días. Dados los problemas mencionados anteriormente, es justo decir que el mercado actual de datos no está estructurado de una manera que pueda escalar para respaldar esta visión.

Ya existen algunos mercados de datos privados, pero se ven afectados rápidamente por dos problemas clave: parálisis del vendedor y una falta de estructura de mercado.

Parálisis del vendedor

El primer problema surge cuando los vendedores potenciales llegan a la plataforma y se enfrentan a la tarea de fijar el precio de sus propios activos. La fijación de precios de los activos de datos es una tarea difícil: tienen propiedades económicas diferentes de los bienes privados regulares (por ejemplo, un conjunto de datos puede duplicarse y venderse varias veces) y, por lo tanto, requieren métodos diferentes. Cuando se deja solo a esta tarea, o solo con una guía muy general y sin herramientas específicas, la mayoría de los vendedores potenciales terminan sin pasar por todo el proceso de ventas simplemente porque no tienen idea de cómo valorar sus activos. La falta de precios transparentes en el mercado actual de datos también hace que la tarea sea mucho más difícil.

Falta de estructura de mercado

El segundo problema se refiere al proceso real de venta de datos en un mercado. Imagine que un comprador se encuentra con un activo que le interesa. El enfoque actual en muchos mercados requeriría que contacte al vendedor y comience a negociar un precio final para el activo o servicio en el que está interesado (3). Dado que los datos no tienen un valor intrínseco en sí mismo, la idea es que, para maximizar los ingresos, el vendedor quiera saber cuánto valora el comprador los datos e idealmente venderlos a ese precio. El proceso de negociación introduce mucha fricción y no es escalable a un gran número de ventas, lo contrario de lo que debería permitir un mercado de datos.

En esta serie de artículos, buscamos proporcionar un marco para la fijación de precios de los datos, reconociendo que se necesitan nuevos mecanismos económicos y técnicas muy prácticas, con el objetivo de reducir la fricción existente en los mercados de datos y ayudar a que surja un mercado de datos eficiente.

Nota: Usaré el término "activo de datos" para referirme tanto a los activos (un conjunto de datos, un algoritmo) como a los servicios relacionados con ellos (acceso a un conjunto de datos para el cálculo, como el derecho a consultar un modelo ML para una predicción … ) La mayoría de los argumentos y mecanismos descritos en esta serie se aplican a ambos por igual.