Page 391 of "Bell telephone magazine". American Telephone and Telegraph Co., New York, 1922.

Documento o dato: el ojo que todo lo ve

Este artículo es parte de la serie Guerras Semánticas

Otros artículos de esta serie:

  1. Semio Capitalismo y Control del Relato
  2. Representación, Fotografía y Relato
  3. Cultura Análoga: Representación y Significado

Guerras semánticas, construcción del logos y territorialidad del internet (vigésima segunda parte)

Este artículo fue publicado originalmente en la revista mexicana “etcétera” en mayo del 2017.

En lo que quizás nunca se hayan equivocado las visiones distópicas del futuro que hoy vivimos (las visiones que nos anticiparon: sí, a usted y a mí, sentados frente a dispositivos digitales una parte sustancial de nuestra vida) es en la naturaleza hegemónica, totalitaria y violenta de quienes pretenden para sí el control de la información; la mayor parte del tiempo para su propio beneficio económico y/o político. Ese control, como premisa del poder, no es necesariamente nuevo ni necesariamente contingente, sino que forma parte de la naturaleza misma de la preeminencia como ejercicio, del poder como afán y cotidianidad. Por lo menos desde el siglo XIX y desde la invención del periodismo, la “verdad” no es únicamente “un hecho comprobable en la medida de lo posible” (lo que sería una definición canónica, alejada de la definición dogmática que ve a la verdad como algo absoluto e inamovible) sino un flujo perceptual, una carga de opinión cuyas polaridades, nos guste o no, lo definen todo. Desde el siglo XIX, pues, la comunicación nos dejó claro que, más allá de lo que nos haya dicho nuestra mamá, la verdad es posible de ser sesgada, la historia susceptible de ser manipulada y las conclusiones pueden ser variadas según vire, natural o artificialmente, el carrito de madera de la opinión pública (que todo lo sabe en su infinita sabiduría, claro está).

Sin embargo, la información como tal ha cambiado de muchas y muy diversas maneras. Tal vez la más contundente a la que hoy nos enfrentamos es a la evolución del documento-como-hecho transformándose en el documento-como-dato; una transformación imposible de imaginar en el mundo análogo y únicamente posible en la digitalia; y, al mismo tiempo, una transformación que reconecta lo análogo con lo digital de un modo definitivo, dramático si a usted le va lo superlativo.

La prueba documental como base para el análisis, la comprobación o, si se quiere, como artilugio para aplicar a mansalva el método científico, ha sido la piedra fundacional de la sociología y de la ciencia política, de la historia como disciplina e incluso de algunos afanes artísticos menores, como la fotografía, el cine o el video (a los que se gusta de adornar con el adjetivo “documental” para darles un poder “transformador” que muy rara vez tienen).  El documento se nos anuncia con una serie de características sine qua non que, aun así, son muy precarias: es usualmente tangible, es usualmente verificable y es usualmente (peligrosa, artificialmente) neutral. El documento “es lo que es”; no opina ni se apasiona, no se inclina ni tiene preferencias. Es factual, y en eso radica su naturaleza de “punto de partida”, según nos hacen creer sus entusiastas adoradores.

Sin embargo, esta posición del documento está siendo severamente cuestionada por la inteligencia artificial y, particularmente, por las posibilidades analíticas de los algoritmos. Si bien la subjetividad de quien documenta (la circunstancia de relación con el poder de quien emite el documento, la lectura subjetiva de la persona que documenta, la posición respecto al hecho de quien sostiene la cámara que documenta) y las particularidades sociales del momento que se está documentando (las percepciones preeminentes respecto a grupos sociales específicos en una época específica, la aceptación o rechazo del sujeto documentado) han sido todas constantes como criterios en el cuestionamiento de lo documental –y también, por supuesto, de la idea general y pedestre de “lo objetivo”–, lo cierto es que la Inteligencia Artificial está avanzando vertiginosamente en la posibilidad de dotar a las máquinas de herramientas suficientes para la lectura analítica de datos no alfanuméricos basados únicamente en datos gráficos. Es decir, el análisis de documentos en su naturaleza objetual.

Para resumir la idea: los algoritmos están ya en la capacidad de ver imágenes y de arrojar datos a partir de lo que ven. Esta capacidad lleva ya varios años en desarrollo y está marcando un cambio de paradigmas en lo que se refiere a la interacción de la Inteligencia Artificial con la realidad análoga. Esto, aunado al hecho de que la fotografía y el video se han convertido en un hecho preeminente en la documentación del hecho humano en nuestra contemporaneidad, no únicamente por la presencia omnímoda de dispositivos móviles equipados con cámara (el estimado más reciente es el de más de mil millones de teléfonos móviles conviviendo alegremente en el mundo, y un estimado de mil millones de fotografías diarias subidas únicamente a Facebook por esa única vía, sin contar la relativamente nueva capacidad de transmitir video en vivo, que seguramente pronto arrojará números similares) sino por la masiva digitalización de imágenes análogas que se lleva a cabo por los usuarios llanos e incluso por instituciones formales en las más diversas plataformas de internet (por ejemplo, la colección de fotografías “vintage” de la red social fotográfica “Flickr” –conocida como “The Commons” – cuenta ya con 117 instituciones científicas, archivísticas y museográficas de varios países de lengua inglesa[1]). Es decir, el hecho fotográfico y videográfico de la historia humana (por lo menos el de nuestra historia desde finales del siglo XIX hasta el presente) está ya en la digitalia, en una indiscutible plenitud[2].

Las máquinas están aprendiendo rápidamente a leerlo. Y quizás no nos sorprenda saber que suelen ver mucho más de lo que nosotros nos permitimos ver.

Uno de los primeros ejemplos contundentes y exitosos, aunque de una naturaleza extrañamente policiaca e inquietante, ha sido el desarrollo de la tecnología DeepFace de Facebook, que hasta el momento ha sido capaz de reconocer rostros en fotografías tomadas en las más diversas condiciones de luz y desde los más diversos ángulos. Aunado a esto, la multitud de rostros etiquetados en esa red social y otros datos disponibles únicamente en las bases de datos ligadas a su “ecosistema social” hace que no sea nada difícil agregar un nombre, ubicación geográfica, historial académico y toda otra multitud de datos (que nosotros hemos dado alegremente, claro) a casi cada rostro. Y no importa si, por ejemplo, la resolución de nuestro rostro es muy precaria o si, de hecho, la resolución aceptada por Instagram o Facebook es todavía muy mala: el pasado febrero, el equipo de Google Brain publicó un avance al que llaman “súper resolución”: un algoritmo con la capacidad de extrapolar una imagen de altísima resolución a partir de una imagen pixelada o de baja resolución.

Algo muy parecido está comenzando a ocurrir con la geolocalización, los mapas a pie de calle y otros desarrollos que ya llevan tiempo con nosotros: actualmente, una fotografía tomada en un lugar público únicamente necesita de un signo o señalización visible, y de una sombra en un ángulo verificable, para que una computadora nos indique con precisión el lugar y la hora del día en el que una fotografía fue tomada; aun incluso cuando el usuario se haya tomado la molestia de desactivar las coordenadas del GPS y/o los datos EXIF de su cámara.

Quizás todavía más inquietantes sean las llamadas “lecturas ambientales”. Hace algunos años, una empresa llamada Jetpac desarrolló un algoritmo que era capaz de leer y analizar en las millones y millones de fotografías de Instagram para concluir la clase de “ambiente” que tenía un lugar. Digamos que en las fotografías de un restaurante aparecían mayoritariamente mujeres vistiendo lápiz labial: el algoritmo concluiría que el sitio era “formal”, aun si en las fotografía la ropa de las personas no era visible. Digamos que en la mayoría de las fotografías hubiera únicamente hombres: el algoritmo concluiría que el restaurante era un restaurante gay. Si bien a primera vista estas nos podrían parecer generalizaciones o prejuicios, el análisis estadístico de Jetpac demostró que el algoritmo tenía un nivel de lectura muy preciso y racional. Por supuesto, Jetpac fue comprada por Google en el 2014.

La pregunta no es antojadiza: ¿estas capacidades de lectura frente a una fuente documental humana constituyen el primer análisis perceptual máquina/humano? Y de ser así: ¿es este análisis más preciso, más desapasionado, más neutral, que cualquiera que antes haya podido salir de la mente humana?

Es decir: ¿estamos llegando por primera vez a la objetividad?

El pensamiento es inquietante: usted y yo, en la verdad documentada de nuestra existencia, somos ahora, también, un dato cada vez más preciso destinado a trascendernos.

Daniel Iván
www.danielivan.com


[1] Principalmente de Inglaterra, Irlanda, Australia y los Estados Unidos. Si bien la ausencia de instituciones latinoamericanas o en lengua española es notable, lo cierto es que el mundo de habla hispana está muy bien representado fotográficamente, ya que el acervo incluye documentos de guerra, viaje, misiones diplomáticas, etc.; amén de que no son pocos los usuarios de países de habla hispana –o, para el caso, de otras lenguas­– que suben fotografías familiares o colecciones personales de la más amplia valía.

[2] Esto, circunscribiéndonos a las fechas de los primeros desarrollos de la fotografía y la reprografía y sus documentos disponibles. Tomando en cuenta que muchas instituciones y personas están digitalizando libros, dibujos, objetos y otros documentos ligados con la historia antigua, clásica, etc., el margen de la “historia disponible” es, por supuesto, mucho mayor.

Page 391 of "Bell telephone magazine". American Telephone and Telegraph Co., New York, 1922.
Page 391 of “Bell telephone magazine”. American Telephone and Telegraph Co., New York, 1922.

Continúa leyendo esta serie:

Comparta sus opiniones

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.