Todo lo que necesitas saber sobre los formatos de archivo y sus propiedades

Todo lo que necesitas saber sobre los formatos de archivo y sus propiedades / Tecnología explicada

los expediente es uno de la Partes fundamentales de la experiencia informática. Pero que es un “expediente” ¿de todas formas? Es un ícono en su escritorio, una entrada en una lista que abre su presupuesto como una hoja de cálculo y un nombre que puede darle a su último selfie. Al final del día, un “expediente” es una colección de bits (ceros y unos) organizados en un patrón que alguna aplicación entiende.

Los desarrolladores pueden mantener estos patrones en secreto, lo que puede hacer que los usuarios mantengan un programa en particular a pesar de las alternativas. La guía completa del convertidor de archivos de Microsoft Office La guía completa del convertidor de archivos de Microsoft Office Si alguna vez ha convertido un archivo de texto, como PDF a Word, está familiarizado con el reto. A veces es tan fácil como imprimir, otras veces necesitas herramientas especiales. Entra en esta guía del convertidor. Lee mas . Otros desarrolladores pueden realmente alentar la adopción de sus formatos. En algunos casos, puede abrir e interpretar fácilmente el formato, o puede ser imposible utilizarlo fuera de su aplicación nativa. Exploraremos ejemplos de todo lo anterior en este artículo..

Formatos de archivo basados ​​en texto vs. binarios

El primer aspecto importante de los diferentes tipos de archivos es si es binario o basado en texto. Echemos un vistazo a cada uno de estos a su vez.

Formatos basados ​​en texto

El archivo de texto es el formato de archivo más básico. Puede ser leído por casi cualquier sistema con un procesador. Este formato es una secuencia de bits (unos y ceros) que se adhiere al estándar ASCII (ignoraremos Unicode por el momento), lo que significa que una computadora puede interpretar cada byte (8 bits) como un carácter entre los siguientes:

  • A-Z (incluyendo mayúsculas y minúsculas
  • 0-9
  • Personaje espacial
  • Una selección de símbolos (por ejemplo, puntuación)
  • Caracteres de control (por ejemplo,. “DEL”)

Dado que los datos se almacenan como texto, puede ver el contenido de un archivo abriéndolo en un editor de texto, incluso los más sencillos como Windows Notepad 2 Editores de texto minimalistas que probablemente nunca haya escuchado de [Windows] 2 Editores de texto minimalistas que probablemente nunca haya escuchado de [Windows] Aparte de estar basados ​​preferentemente en tiempos de carga rápidos, algunas aplicaciones simplemente no requieren demasiado Muchas características de uso intensivo de recursos. Las aplicaciones minimalistas son pequeñas y limpias, y siempre y cuando terminen el trabajo, usted ... Leer más (o equivalentes para Mac Los mejores editores de texto para Mac en 2018 Los mejores editores de texto para Mac en 2018 ¿Necesita un nuevo editor de texto para ¿Tu Mac? Aquí están los mejores editores de texto macOS gratuitos y de pago para texto sin formato, codificación y todo lo demás. Leer más, Linux Advanced Linux Editores de texto Comparado: kate vs gedit Avanzado Linux Text Editors Comparado: kate vs gedit Cualquier usuario de Linux Decirle que un buen editor de texto es un componente vital de un sistema informático, sin importar si es un usuario nuevo o un profesional experimentado. Al usar un texto de Terminal… Lea más, la aplicación de escritura iOS: un hermoso editor de texto iOS con Markdown Aplicación de escritura de soporte y docenas de acciones: un hermoso editor de texto iOS con Markdown Soporte y docenas de acciones Las aplicaciones de escritura para el iPad y el iPhone son abundantes. Tenemos la suerte de vivir en un momento en el que los desarrolladores encuentran nuevas formas de editar texto usando Características únicas en nuevas aplicaciones. Esto ... Leer más, y Android 7 Editores de texto sin distracciones para Android en comparación: ¿Cuál es el mejor? Se comparan 7 editores de texto sin distracciones para Android: ¿cuál es el mejor? Realice un trabajo real en su dispositivo Android utilizando uno de estos increíbles editores de texto. Lee mas ). Dado que casi todas las plataformas informáticas se envían con un editor de texto básico, puede colocar cierta información (de texto) en uno de estos archivos y tener la seguridad de que siempre podrá acceder a ella. Otras aplicaciones no necesitan saber nada más para al menos leer los datos correctamente.

Sin embargo, las cosas se complican más cuando necesita representar algo como la fuente del texto o una fecha de llenado automático en la portada. En estos casos, los caracteres ASCII contribuyen a una formato basado en texto como Markdown ¿Qué es Markdown? 4 razones por las que deberías aprenderlo ahora ¿Qué es Markdown? 4 razones por las que deberías aprenderlo ¿Estás cansado de los editores HTML y WYSIWYG? Entonces Markdown es la respuesta para ti, no importa quién seas. Leer más o XML. Si bien esto confiere los beneficios del texto plano como la transparencia, estos archivos a menudo requieren más espacio para elementos como etiquetas. Considere el siguiente archivo de una oración en texto plano, y luego en Formato de documento abierto “ODT plana” Formato (FODT), que utiliza XML. La siguiente imagen muestra que la versión de texto sin formato es de 53 bytes, mientras que la versión ODT es 25,000 bytes.

Formatos binarios

En contraste, los formatos binarios ¿Qué es binario? [Tecnología explicada] ¿Qué es binario? [Tecnología explicada] Dado que el binario es absolutamente fundamental para la existencia de las computadoras, parece extraño que nunca hayamos abordado el tema antes, así que hoy pensé que daría una breve descripción de qué binario ... Leer más son Archivos que una aplicación lo construirá poco a poco. Puede intentar abrir estos archivos con un editor de texto, pero es probable que no sepa cómo interpretarlos. A continuación se muestra el resultado de intentar abrir un archivo de Microsoft Excel con un editor de texto.

La aplicación necesita procesar los datos en un archivo binario de una manera específica. Al abrir un archivo XLS, una aplicación debe tratar los primeros dieciséis bytes del archivo como la “principio de archivo” (BOF) marcador. Dentro de ese marcador, el quinto elemento es un bit único que indica si el archivo se editó por última vez en la plataforma de Windows o no.“fWin”). Viene después de otros cuatro elementos, cada uno de dos bytes, lo que significa que “fWin” El elemento es el bit 65 en el archivo de Excel.

Crédito de la imagen: Microsoft

Como vimos, si intentas abrirlo con una aplicación que no maneja el bit 65 como el “fWin” bandera, esa aplicación no la abrirá correctamente. Puede mostrar muchos caracteres ilegibles en la pantalla (que se muestra arriba), manejarlos correctamente con un mensaje de error (que también se muestra arriba, porque Linux) o fallar. En cualquier caso, no sabrá cómo leer los datos correctamente, por lo que no los mostrará correctamente. Pero las aplicaciones, una vez programadas, pueden manejar tantos formatos de archivo como se desee.

Formatos abiertos vs. propietarios

La siguiente consideración es si un formato de archivo está abierto (es decir, está disponible para que otros puedan usarlo fácilmente) o si es propietario. Tenga en cuenta que “propiedad” No es lo mismo que cerrado, al menos no en todos los casos. Mientras que la “texto vs. binario” El debate anterior fue técnico., “abierto vs. propietario” tiene más que ver con los términos de licencia de un formato de archivo. Más sobre esto en las siguientes secciones..

Formatos abiertos

Los formatos abiertos son aquellos en los que la licencia les permite a los usuarios adoptarlos para sus propias aplicaciones. Un cuerpo de normas de algún tipo también debería supervisar su desarrollo continuo por parte de una comunidad de contribuyentes para que los formatos sean verdaderamente “abierto.” Los formatos abiertos también están libres de costos y restricciones de licencia; pueden ser utilizados por cualquier persona, para cualquier propósito. Quizás el formato abierto más famoso es el Formato de documento abierto (ODF) 9 Formatos de archivos de Office raros que debes conocer 9 Formatos de archivos de Office raros que debes conocer ¿Alguna vez te has encontrado con formatos de archivos extraños en tu suite de oficina? Le daremos una introducción rápida sobre los tipos de archivos de Office poco comunes pero útiles y para qué puede usarlos. Leer más, lanzado por primera vez en 2005 por OASIS. Su propósito era ofrecer una alternativa al bloqueo que Microsoft tenía en el mercado de la productividad..

Con los formatos abiertos, nunca debe temer que su información esté bloqueada dentro de un archivo en particular. Considere lo siguiente, que muestra nuestro archivo de formato Flat ODT. Si bien hay mucha información extraña a su alrededor, puede ver los datos reales allí, tan claros como el día..

Otro beneficio de los formatos abiertos es su completa documentación. Una cosa es que un archivo sea fácil de leer. Un programador todavía (a través de prueba y error) tendrá que averiguar qué hace exactamente cada función. Pero en el caso de ODF, la especificación de la versión 1.2 le brinda al programador todo lo que necesita saber para implementar el soporte de manera eficiente..

Formatos propietarios

Por último, los formatos propietarios están protegidos por sus desarrolladores. Puede deberse a que incluyen secretos comerciales, a los fines de seguridad (percibida), o simplemente porque el desarrollador no quiere compartir su trabajo. Cualquiera que sea la razón, estos formatos son propietarios en virtud de Acuerdos de licencia de usuario final (EULA) u otros términos que prohíban al usuario intentar realizar ingeniería inversa o de otra manera “grieta” el formato de archivo.

Una vez simplemente “prohibido,” La Ley de Derechos de Autor del Milenio Digital ¿Qué es la Ley de Derechos de Autor de los Medios Digitales? ¿Qué es la Ley de Derechos de Autor de Medios Digitales? Leer más (DCMA) ha cambiado las cosas. Los desarrolladores ahora tienen el respaldo legal para perseguir a aquellos que trabajan en ingeniería inversa en su trabajo. Debe pensar en el futuro antes de invertir en una aplicación que utiliza un formato propietario. ¿Necesitará migrar esa información a otro lugar en el futuro? Si es así, ¿cuán doloroso será? ¿Estará la compañía en un año o cinco? Debería considerar si las características de una aplicación valen la pena si también significa estar bloqueado en ese desarrollador debido a formatos propietarios.

Ejemplos de formatos de archivo

Si observas lo anterior, un par de combinaciones te atacarán. Es cierto que los formatos de archivo basados ​​en texto. se prestan a ser abiertos. Del mismo modo, si el objetivo de un formato es ser propietario, es más fácil mantenerlo de esta manera al convertirlo en binario. Pero este no es siempre el caso..

El formato de imagen XCF de GIMP es un formato abierto que también es binario. El proyecto incluye una descripción detallada de cómo el formato contiene los gráficos, el texto y las capas que conforman un archivo GIMP como bits y bytes en bruto (se muestra a continuación). Los desarrolladores pueden usar esto para codificar su propia implementación, por lo que aplicaciones externas como ImageMagick Cómo recortar y redimensionar fácilmente las imágenes en Linux Cómo recortar y redimensionar fácilmente las imágenes en Linux Si desea hacer un recorte básico y cambiar el tamaño en Linux, tal vez para ayudar con un proyecto o facilite la carga de una imagen en sus redes sociales favoritas; luego intente con estos ... El kit de herramientas Leer más puede importarlos.

Por el contrario, el formato más nuevo de Microsoft Visio (VSDX) es un formato basado en XML (y por lo tanto, basado en texto). Publica una referencia detallada de la composición de estos archivos. Sin embargo, el documento de referencia señala que Microsoft “Tiene patentes que podrían cubrir su implementación.” de soporte .VSDX. Además, la Biblioteca del Congreso establece el uso de la especificación VSDX “no garantiza la licencia libre de regalías de todas las patentes relevantes” si lo usas Esta es otra forma de decir que puedes tirar los dados e incluir este soporte. Pero Microsoft puede o no querer que pagues más tarde, dependiendo de qué tan cerca compita con Visio.

Si cree que son complicados, ¿qué le parece el formato ODT no plano? Es un archivo en formato ZIP (binario y abierto, a menos que también esté utilizando su cifrado) que contiene el texto de un documento (content.xml, Formato abierto basado en texto) y gráficos (por ejemplo, PNG, binario pero abierto).

¿Qué tan importantes son los formatos de archivo, realmente?

Esta es una pregunta dificil. Por un lado, algunos sistemas operativos como iOS han intentado aislar a los usuarios para que no traten con archivos en absoluto. Tiene la aplicación que creó el archivo para abrirlo, ¿a quién le importa su estructura o su extensión? Sin embargo, muchas organizaciones (especialmente los gobiernos) han estado presionando para asegurarse de que los datos públicos estén en un formato abierto.

Si eres un idealista de software (no es que haya nada de malo en eso), entonces al evaluar nuevas aplicaciones, asegúrate de que estén en un formato abierto (preferiblemente) basado en texto. Si solo quiere ponerse a trabajar, los formatos propietarios pueden no ser un problema para usted..

¿Qué piensas? ¿Exige que su información se encuentre en formatos abiertos basados ​​en texto que pueda convertir y verificar? ¿O son los formatos que usan los desarrolladores, propietarios o no, suficientes para ti? Háganos saber más abajo en los comentarios.!

Créditos de la imagen: Edilus / Shutterstock