l escándalo de Cambridge Analitica y su manipulación de la información de Facebook para ayudar a la campaña de Donald Trump a construir fake news han puesto el tema de Big Data en el foco de la atención. Debería llevar a una discusión mucho más amplia sobre los usos y abusos de las grandes bases de datos. Lo que está en juego va más allá de la manipulación electoral y tiene en el centro la privacidad y la protección de la información personal de cada uno de nosotros.
Una primera cuestión a aclarar es que los usuarios de las redes o buscadores como Facebook, Whatsapp, Google, Explorer, etcétera, no son los clientes de estas empresas. Lo son otras empresas que usan los datos, por ejemplo, para promover cierto consumo o influir en la visión del mundo de decenas de millones de personas. El negocio es vender los datos de los usuarios de las redes gratuitas a estos verdaderos clientes. Recomiendo el artículo de Curran en The Guardian sobre este tema, que demuestra fehacientemente que nuestros datos no son confidenciales y que quien los tiene nos conoce mejor que nosotros mismos.
El gran valor de estas bases de datos ha llevado a prácticas monopólicas. Por ejemplo, Facebook ha comprado Instagram y Whatsapp para evitar la competencia. Otras grandes bases de datos, hackeados o vendidos clandestinamente, como el padrón electoral mexicano, también pueden ser aprovechadas para distintos fines de lucro.
Estos usos comerciales han sido bastante documentados en el ámbito de salud, en el que generalmente se parte de las historias clínicas electrónicas (HCE) con datos de millones de personas o alternativamente de los registros de farmacias sobre la prescripción de medicamentos. (Ver Paul Taylor: Whose property; Big Medical Data). Se suele argumentar que las HCE son invaluables para hacer investigación epidemiológica o para establecer el costo-beneficio de distintos tratamientos. Se sostiene, además, que como son anónimas la información no pertenece a los pacientes ni al médico que recopiló los datos. Por tanto, no pueden ser utilizadas en perjuicio de los pacientes. Sin embargo, se ha demostrado que el anonimato no existe, ya que los registros contienen suficiente información para poder identificar a las personas.
El uso comercial de Big Data en salud se ha extendido a varias áreas interrelacionadas. Una es la venta de la información independientemente de su uso. Esto se hace, por ejemplo, para la investigación a un costo tan alto que tiende a excluir a las universidades públicas. Los compradores son principalmente las compañías que hacen investigación bajo contrato (CRO, por sus iniciales inglés). Ejemplo de ellas es la IMS Health, presente en México, que se promueve sosteniendo que tiene datos de 500 millones de personas.
Las compañías farmacéuticas también explotan esa información para elaborar argumentos a sus visitadores médicos con el propósito de reforzar pautas de prescripción o cambiarlas. Las aseguradoras usan los datos con el fin de construir perfiles de riesgo de enfermar de padecimientos de alto costo y fijar primas diferenciadas de sus seguros o de plano negarse a vender uno.
Las bases de datos se explotan, además, para controlar el trabajo del médico, fijando normas sobre qué puede hacer y qué no, generalmente con un enfoque estrictamente de costo-beneficio. Por último, sirven, además, para desarrollar la inteligencia artificial con la finalidad de sustituir a los médicos por aplicaciones basadas en algoritmos.
A raíz de estos sucesos se ha abierto una intensa discusión pública en varios países sobre cuáles son usos legítimos de Big Data y sobre la privacidad de los datos que la componen. Varios países han creado una agencia reguladora para vigilar y regular su uso, pero sin resultados significativos, y existen propuestas antimonopólicas valiosas. En cuanto a la privacidad de los datos se han dado batallas importantes con distintos argumentos, incluyendo el derecho a la información de las empresas (sic). Sólo Dinamarca ha logrado protegerlos contra la explotación comercial.
Es básico entender que el negocio de Big Data constituye uno de los campos más importantes del llamado infocapitalismo
. La conciencia al respecto debe llevar a una discusión a fondo sobre cómo proteger los datos personales para que no sean violados sistemáticamente. También es necesario discutir a fondo qué usos dar a estas bases de datos para que sirvan al interés común y no a los intereses comerciales de las grandes empresas.