El diluvio de datos
The Economist
Hace 18 meses, Li & Fung, una firma que maneja cadenas de abastecimiento para comerciantes minoristas, veía 100 gigabytes de flujo informativo a través de su red cada día. Ahora la cantidad ha aumentado 10 veces.
Durante 2009, el avión teledirigido estadounidense que volaba sobre Irak y Afganistán envió una película de video que equivaldría a 24 años. Los nuevos modelos que se están desplegando este año producirán 10 veces más flujos de datos que sus predecesores, y los de 2011 producirán 30 veces más.
Adonde quiera que mire, la cantidad de información en el mundo está aumentando abruptamente. De acuerdo con un cálculo, la humanidad creó 150 exabytes (mil millones de gigabytes) de datos en 2005. Este año, creará 1.200 exabytes.
Transformación en negocios
Simplemente, seguir el paso de este torrente, y almacenar los fragmentos que podrían ser útiles es bastante difícil. Analizarlo, ubicar los patrones y extraer información útil es incluso más difícil.
No obstante, el diluvio de datos ya está empezando a transformar los negocios, el gobierno, la ciencia y la vida cotidiana. Tiene un gran potencial, mientras los consumidores, las compañías y los gobiernos hagan las elecciones correctas sobre cuándo restringir el flujo de datos y cuándo estimularlo.
Algunas industrias han liderado el camino en su habilidad para recopilar y explotar datos. Las empresas de tarjetas de crédito monitorean cada compra y pueden identificar las fraudulentas con un alto nivel de precisión, utilizando reglas derivadas al procesar miles de millones de transacciones.
Es más probable que las tarjetas de crédito robadas se utilicen para comprar licor fuerte que vino, por ejemplo, porque es más fácil de vender. Las firmas aseguradoras son también buenas en combinar pistas para identificar reclamaciones sospechosas: es más probable que las reclamaciones fraudulentas se hagan un lunes que un martes, puesto que los tenedores de pólizas que montan accidentes tienden a reunir amigos como testigos falsos durante el fin de semana.
Al combinar varias de esas reglas, es posible resolver qué tarjetas han sido robadas y cuáles reclamaciones son tramposas.
Los operadores de teléfonos móviles, mientras tanto, analizan los patrones de llamadas de los suscriptores para determinar, por ejemplo, si la mayoría de sus contactos frecuentes son a una red de la competencia. Si esa red rival está ofreciendo una promoción atractiva que podría lograr que el suscriptor desertara, a éste se le puede ofrecer un incentivo para que se quede.
Las industrias más antiguas operan datos con tanto entusiasmo como las nuevas en estos días. Los comerciantes minoristas, tanto en línea como fuera de ésta, son maestros en la extracción de datos (o "inteligencia de negocios", como ahora se conoce).
Al analizar los "datos en el papelero", los supermercados pueden hacer promociones a la medida según las preferencias de clientes en particular.
La industria petrolera utiliza supercomputadoras para rastrear datos sísmicos antes de hacer perforaciones. Y es muy probable que los astrónomos apunten un instrumento tipo software de búsqueda de información hacia un estudio del cielo digital como también apunten un telescopio hacia las estrellas.
Se puede llegar más lejos. A pesar de años de esfuerzo, las bases de datos de las entidades a cargo de la aplicación de la ley y de inteligencia no están, en general, vinculadas. En salud, la digitalización de expedientes haría que fuera mucho más fácil ubicar y monitorear las tendencias de salud y evaluar la eficacia de los distintos tratamientos. Pero los esfuerzos a gran escala por computarizar los expedientes de salud tienden a toparse con problemas burocráticos, técnicos y éticos.
La publicidad en línea ya está dirigida a un público específico en forma mucho más precisa que aquella que no está en línea, pero hay un campo de acción para una personalización incluso mayor. Los avisadores estarían dispuestos a pagar más, lo que a su vez significaría que a aquellos consumidores que están preparados para optar por tales cosas se les podría ofrecer una gama más espléndida y amplia de servicios en línea gratuitos.
Y los gobiernos están aceptando tardíamente la idea de poner más información -tal como cifras de delincuencia, mapas, detalles de contratos de gobierno o estadísticas sobre el desempeño de los servicios públicos- a disposición del público. Las personas pueden luego volver a utilizar esta información en nuevas formas para crear empresas y lograr que los funcionarios elegidos den cuenta de sus actos.
Las compañías que aprovechan estas nuevas oportunidades, o proporcionan las herramientas para que otros lo hagan, tendrán éxito. La inteligencia de negocios es una de las partes que crecen más rápido de la industria del software.
Ahora las malas noticias
Sin embargo, el diluvio de datos también presenta riesgos. Abundan los ejemplos de robos de bases de datos: discos llenos de datos sobre el seguro social desaparecen, laptops cargados con registros tributarios que quedan en taxis, sustracción de números de tarjetas de crédito desde los comerciantes minoristas en línea.
El resultado es violación de la privacidad, robo de identidad y fraude. Igualmente son posibles las violaciones de la privacidad incluso sin esas maniobras sucias: lo atestiguan las disputas periódicas cuando Facebook o Google cambian inesperadamente los ajustes de privacidad en sus redes sociales en línea, y hacen que los miembros revelen información personal en forma inadvertida.
Una amenaza más siniestra proviene de la Gran Hermandad de diversos tipos, en especial cuando los gobiernos instan a las empresas a que entreguen información personal sobre sus clientes. Más bien que poseer y controlar sus propios datos personales, las personas muy a menudo encuentran que han perdido el control de éstos.
La mejor forma de abordar estos inconvenientes del diluvio de datos es, paradójicamente, lograr que haya más datos disponibles en la forma correcta, exigiendo una mayor transparencia en diversas áreas.
En primer lugar, a los usuarios se les debería dar mayor acceso y control sobre la información que se tiene de ellos, lo que incluye con quienes ésta se comparte. Google les permite a los usuarios que vean qué información tiene de ellos y les permite borrar sus historias de búsqueda o modificar el blanco de la publicidad, por ejemplo.
En segundo lugar, se debería exigir a las organizaciones que revelen detalles de las violaciones de seguridad, como ya es el caso en algunas partes del mundo, con el fin de instar a los jefes a que tomen la información de seguridad más en serio.
En tercer lugar, las organizaciones deberían estar sometidas a una auditoría de seguridad anual, y que se diera a conocer públicamente el nivel resultante. Esto estimularía a las compañías a mantener sus medidas de seguridad actualizadas.
Los incentivos del mercado entrarán en juego entonces a medida que las organizaciones que manejan datos correctamente se vean favorecidas por sobre aquellas que no lo hacen bien.