la realidad numérica del JPEG


La fotografía no tiene nada que ver con la ciencia… la fotografía es arte… no se puede resumir la creación fotográfica con números…Resulta que la fotografía digital tiene que ver mucho con las matemáticas y si alcanzas a comprenderlas todo será más lógico a la hora de disparar.

Soy muy malo con las matemáticas. Nunca me he llevado bien con ellas. Y mucha culpa la tiene un profesor de EGB que, si no llega a ser por la gente que me rodea, me hubiera hecho llorar muchas veces. Era tan malo que el primer día de clase nos señaló con el dedo a unos pocos y vaticinó que íbamos a suspender… incluso dijo delante de mis padres algo que nunca se debería decir de un niño… Una pésima persona que nunca debería haber tenido el título de maestro.

Pero no hemos venido a hablar del pasado y de las malas personas, sino de la dependencia de la fotografía digital de las matemáticas. Antes tenía que ver más con la física y la química. Pero esta última ciencia se ha visto sustituida por la de los números.

Las matemáticas están presentes en muchos de los pasos que damos para revelar una fotografía, desde la formación de la imagen hasta el análisis y revelado de la misma. Cuando te pones a investigar un poco del tema echas de menos no haber tenido mejores profesores que te hubieran animado más a meterte de lleno en los números.

Por suerte ahora la información es más accesible y no puedo dejar de recomendar el vídeo de Eduardo Sáenz de Cabezón que ha desencadenado este artículo. Aquí están las claves para entender y comprender de una vez por todas qué es realmente un formato JPEG y por qué se forma una imagen digital.

Las matemáticas del formato JPEG

Muchos de los que nos dedicamos a enseñar fotografía, en el momento que nos toca hablar de los diferentes tipos de formatos, explicamos que el popular JPEG es un formato comprimido. Y empezamos a desarrollar en qué consiste con el miedo de adentrarnos en un terreno que no dominamos.

Sabemos que se divide la información en grupos de 64 píxeles. Y que gracias a complejas fórmulas matemáticas consigue aligerar el peso de información con una cierta pérdida de calidad en función de la compresión que se aplique y de las veces que se guarde. Pero nunca he utilizado términos matemáticos correctos.

Matematicasiii

Los 64 pixeles

Era incapaz de profundizar más fuera de la fotografía. Sabemos lo que pasa, recomendamos lo que no se puede hacer fruto de la experiencia, pero no podíamos explicarlo en términos matemáticos. Hasta ahora.

Gracias a Eduardo Sáenz de Cabezón que lleva el canal Derivando, entre otras muchas cosas, empezaremos a hablar de la transformada discreta del coseno en dos dimensiones y la tabla de cuantización sin hacer mucho el ridículo…:

Básicamente tenemos que pensar en convertir los colores en números. En este caso utilizamos la escala RGB que va de 0 a 255 por cada uno de los tres colores para conseguir una representación numérica del color de cada pixel. Como tenemos millones de ellos necesitamos un formato que ocupe poco espacio como el jpeg para poder trabajar.

El jpeg divide la imagen en segmentos de 8×8 y trabaja en cada uno de esos segmentos, divididos a su vez en los tres canales.

El jpeg divide la imagen en segmentos de 8×8 y trabaja en cada uno de esos segmentos, divididos a su vez en los tres canales. Si nos quedamos con uno de los segmentos de uno de los colores tenemos varios valores de ese color. Y es aquí cuando se aplica la transformada discreta del coseno.

Seguro que nos cuesta entender que la representación de los píxeles no es más que información compleja en dos dimensiones y gracias a la transformada discreta del coseno es posible simplificar esa información. Tiene hasta una fórmula que sirve para obtener los coeficientes de cada uno de eso 64 píxeles para obtener la imagen con todos sus matices.

Matematicasii

La famosa fórmula (fotograma del vídeo)

Eso sería la información completa. El JPEG lo que hace es dividir los números obtenidos en esa tabla de 8×8 por otra tabla, la tabla de cuantización. Y redondea los resultados. Así, por arte de las matemáticas, consigue, tras redondear los resultados, una tabla mucho más sencilla llenas de 0 que podemos obviar y que por lo tanto ocupará mucho menos espacio.

La imagen no será idéntica pero sí muy parecida. Y según como sean de grandes los números de la tabla de cuantización más comprimida estará la imagen final…

Todavía me tocará ver diez veces más este vídeo, y buscar por las redes más cosas, para entender realmente lo que pasa dentro de un JPEG. Ojalá mi profesor de matemáticas no hubiese tenido un bigote negro perfecto y fuera como Eduardo. Pero como siempre digo, nunca es tarde para aprender incluso en los campos que nunca has tocado.



Fuente