¿Cómo funciona la compresión de archivos?

¿Cómo funciona la compresión de archivos? / Tecnología explicada

Todos hemos oído hablar de la compresión de archivos. Cualquiera que descargue regularmente archivos de la web está familiarizado con formatos como ZIP y RAR, y quien edite archivos multimedia sabe que la compresión es necesaria para compartir imágenes, música y videos en la web sin tener que utilizar todo su ancho de banda. La compresión de archivos es la base de cómo funciona la web, podría argumentar, porque nos permite compartir archivos que, de lo contrario, tardarían mucho en transferir. Pero como funciona?

No es nada mágico, pero es el resultado de mucho trabajo duro realizado por muchas personas muy inteligentes. Exploremos cómo funciona la compresión de archivos examinando los dos tipos principales de compresión: sin pérdida y sin pérdida.

Solo una advertencia: voy a simplificar demasiado las cosas aquí para hacer que esto sea legible para los estudiantes que no están en matemáticas. Consulte los artículos de Wikipedia vinculados para obtener más información y las fuentes de Wikipedia para obtener más información..

Compresión sin perdidas

La compresión sin pérdida básicamente funciona eliminando la redundancia. Qué significa eso? Simplifiquemos las cosas. Esta pila de ladrillos representará nuestros datos:

Como puedes ver tenemos dos ladrillos rojos, cinco amarillos y tres azules. La forma más sencilla de representarlo es como se ve arriba: los ladrillos en sí mismos. Pero no es la única manera en que puedo representar esto. También podría hacer esto:

En la imagen anterior puede ver exactamente la misma información: dos rojas, cinco amarillas y tres azules, pero ocupa mucho menos espacio. He representado ladrillos redundantes usando números, lo que significa que solo necesito tres ladrillos para representar diez.

Esto le da una idea aproximada de cómo la compresión sin pérdida es posible. La información que es redundante se reemplaza con instrucciones que le indican a la computadora la cantidad de datos idénticos que se repiten. Otro ejemplo simplificado:

fffffffuuuuuuuuuuuu

Puede ser “comprimido” a:

f7u12

Este es solo un método de compresión sin pérdida, por supuesto, pero apunta a cómo esto es posible. Se utilizan otros trucos matemáticos, pero lo más importante que debe recordar acerca de la compresión sin pérdida es que, si bien el espacio se guarda temporalmente, es posible reconstruir el archivo original completamente a partir del comprimido. Si ves tres ladrillos con números, sabes exactamente cómo hacer la pila. No se pierde información, tal como el nombre sin pérdida implica.

Programas como WinZip se basan en la compresión sin pérdida. Eliminan esta información redundante cuando comprime (o “cremallera”) el archivo y restaurarlo cuando descomprima (o “abrir la cremallera”). Nada se pierde.

En el mundo de la imagen, los archivos PNG también usan compresión sin pérdida. Es por eso que ofrecen un tamaño de archivo más pequeño para imágenes con mucho espacio uniforme: la información redundante se representa mediante instrucciones.

Por supuesto, todo esto es una simplificación excesiva, pero tiene el punto básico. Lea más sobre la compresión sin pérdida en Wikipedia, si está interesado.

Compresión con pérdida

Por supuesto, hay tanto que puedes lograr usando solo métodos sin pérdidas. Felizmente, no son la única opción: también puede simplemente eliminar información. Esto se llama compresión con pérdida, y no es tan loco como parece; de hecho, es probable que tenga muchos archivos en su computadora creados con compresión con pérdida.

Un MP3, por ejemplo. Si eres como la mayoría de las personas, tu computadora almacena miles de ellas para ti, pero ¿sabías que no contienen toda la información de audio que contenía la grabación original? Algunos sonidos, que los humanos no pueden o apenas pueden escuchar, se eliminan como parte de la compresión. Cuanto más comprime un archivo, más información se elimina, por lo que un archivo demasiado comprimido comenzará a sonar turbio.

La compresión con pérdida tiende a usarse principalmente para archivos multimedia: imágenes, sonido y video. El uso de la compresión con pérdida para un archivo de texto sería problemático, ya que la información resultante sería confusa. Sin embargo, no siempre es necesario que los archivos multimedia incluyan toda la información..

Otro ejemplo de compresión con pérdida es la imagen JPEG. En general, las imágenes que se ven en la web no tienen que ser de alta calidad como las imágenes destinadas a la impresión. Como tal, puede eliminar una gran cantidad de información redundante en una imagen web, incluso si lo hace, se verá muy mal impreso..

Por supuesto, la compresión repetida de un archivo utilizando métodos con pérdida disminuye la calidad: cada vez que lo haces, se pierden más datos. A continuación se muestra una foto que he comprimido tres veces para demostrar esto:

Puedes ver de izquierda a derecha cómo disminuye la calidad. Puede que no importe, dependiendo de para qué se usará la imagen, y es por eso que existe una compresión con pérdida.

Es importante recordar que los archivos comprimidos que usan métodos con pérdida realmente pierden datos, lo que significa que no puede recrear el archivo original a partir de uno comprimido con métodos con pérdida. Es obvio cuando lo piensas, pero muchos proyectos de impresión se han arruinado por no entender este punto clave.

Realmente solo he arañado la superficie aquí, así que por favor: lea más sobre la compresión con pérdida en Wikipedia. Es un poco fascinante.

Conclusión

La compresión ayudó a hacer de la web lo que es. En los días de acceso telefónico, las imágenes comprimidas trajeron fotos a nuestro navegador, al menos no a una velocidad aceptable. El video comprimido hace que sitios como YouTube sean posibles, y cualquiera que use redes para compartir archivos está familiarizado con los archivos ZIP y RAR.

¿Tienes algo que añadir? Estoy seguro de que me he perdido algunos puntos clave, así que edúcame a mí (ya los demás lectores) en los comentarios a continuación..

Crédito de la imagen: imagen de primavera a través de Shutterstock

Explorar más sobre: ​​Compresión de archivos.