Cómo convertir fácilmente entre formatos de documentos en Linux

Cómo convertir fácilmente entre formatos de documentos en Linux / Linux

Uno de los problemas que se citan con frecuencia al cambiar a Linux es la compatibilidad de archivos. Invariablemente enviará a los usuarios de otros archivos de sistemas operativos, y no se verán igual cuando se abran en aplicaciones como Word. Si bien puede instalar fuentes o probar máquinas virtuales o emuladores 4 maneras de hacer que Linux sea compatible con más software 4 maneras de hacer que Linux sea compatible con aún más software Lea más para tratar de asegurar que las cosas salgan con una apariencia coherente, otro enfoque es hacer su trabajo en un formato de texto plano, luego conviértalo después de que haya terminado.

Una herramienta que puede usar para convertir entre formatos es pandoc, una herramienta esencial en la caja de herramientas de cualquier usuario de Linux..

Instalación y uso básicos de Pandoc

Instalar pandoc en la mayoría de las distribuciones de Linux es cuestión de un simple viaje a los repositorios. En los sistemas basados ​​en Ubuntu, el siguiente comando lo instala por usted:

sudo apt-get install pandoc

Una vez instalado, puedes comenzar a usar el programa de línea de comandos para convertir archivos. Excelente para manejar Markdown y otros lenguajes de marcado de peso ligero, si tiene un .Maryland En el archivo, puede convertirlo a HTML con lo siguiente:

pandoc -o myfile.html myfile.md

los -o bandera dice el nombre de la archivo de salida usted quiere. En este caso, también infiere el formato de salida (HTML) por la extensión de nombre de archivo. Puedes usar el -r (para leer) y -w (para escribir) banderas para indicar a pandoc el tipo de conversión que desea. Supongamos que estás acostumbrado a escribir en Markdown, pero necesitas publicar algo en una página basada en Mediawiki:

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md 

En sus versiones anteriores, pandoc se centró en “mejorando” archivos, en el sentido de que podría convertir formatos más simples (como Markdown) a otros más complejos (por ejemplo, ODT o DOCX de Microsoft). Pero lo hará ahora leer Estos formatos más complicados también. Esto significa que si está acostumbrado a un procesador de textos pero está tentado por todas las razones para usar un formato de texto simple más pequeño y portátil, ¿Qué es Markdown? 4 razones por las que deberías aprenderlo ahora ¿Qué es Markdown? 4 razones por las que deberías aprenderlo ¿Estás cansado de los editores HTML y WYSIWYG? Entonces Markdown es la respuesta para ti, no importa quién seas. Leer más, se ha vuelto mucho más fácil.

Dado un directorio lleno de archivos de Word, el siguiente comando convertirá cada uno de ellos a Markdown:

para el archivo en * do pandoc -r docx -w markdown -o "$ file" .md "$ file" hecho

Ten en cuenta que esto te dejará con los archivos nombrados. nombredearchivo.docx.md, así que tendrá que ejecutar un comando de cambio rápido de nombre (o mejor aún, agregarlo a lo anterior como un script de shell 5 Ideas de configuración de Linux para principiantes para Cron Jobs y Shell Scripts) Ideas de instalación de Linux para principiantes para Cron Jobs y Shell Scripts Con scripts de bash , puede realizar una serie de tareas complejas de una sola vez, por lo que es ideal para necesidades complejas y repetitivas. También es una excelente manera de conocer el terminal. Leer más).

Opciones de línea de comando de Pandoc

Ahora que tiene algunos conceptos básicos, veremos algunas de las opciones más avanzadas de las opciones de línea de comando de pandoc..

Archivos de referencia ODT / DOCX

Supongamos que ha convertido todos los archivos de procesador de textos antiguos y voluminosos a Markdown. Mientras se deleita con la alegría de escribir en texto sin formato, en algún momento deberá compartirlos con alguien. Y ese alguien puede no ser tan iluminado como tú. Usted puede simplemente revertir la leer y escribir banderas para convertir su archivo de nuevo a formato Word:

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

Pero a algunas personas les gustan sus archivos de Word con fuentes particulares, encabezados numerados, etc. Pandoc's DOCX back-end soporta archivos de plantilla, llamados archivos de referencia, para tal ocasión. Estos son ODT o DOCX archivos que ha configurado con todo el estilo que necesita. Luego, pandoc aplica estos estilos cuando se convierte si le pasa el archivo de referencia en la línea de comando:

pandoc -r markdown -w odt --reference-odt = / home / user / path / to / ref-file.odt -o lowriter.odt lowriter.md

Observe cómo las fuentes configuradas en el archivo de referencia anterior (Arial Black for Heading 1, etc.) se muestran en el archivo convertido a continuación. Puede crear tantos archivos de referencia como necesite (por ejemplo, uno por cliente). Luego ignore el formato por completo mientras escribe, y aplique el estilo en un solo paso mientras convierte.

Back-Ends de renderizado de PDF

Crear archivos PDF también es un ejercicio simple, una vez que instala algunos paquetes necesarios. Una forma ligera de obtener la capacidad de escritura de PDF es instalar el wkhtmltopdf paquete, una herramienta de línea de comandos para convertir HTML a PDF. pandoc soporta esto de forma nativa, así que si configura el escribir bandera a HTML, pero la archivo de salida como PDF, interpretará esto como su intención de usar wkhtmltopdf todo por sí mismo!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

Alternativamente, puede optar por la opción con todas las funciones utilizando el sistema de composición TeTex. Aproveche el hecho de que estos paquetes son Instalaciones sugeridas para el paquete pandoc reinstalándolo con el siguiente comando:

sudo apt-get install --install-sugiere pandoc

Luego, recuéstese mientras se instalan una gran cantidad de paquetes (en realidad, muchos). Una vez que estén completos, puede convertir su archivo directamente a PDF especificándolo como escribir bandera:

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

Mientras que la wkhtmltopdf La opción requiere la instalación de un solo paquete, puede obtener algunos resultados más fáciles de imprimir con TeTex. Es decir, las fuentes serif se utilizan de forma predeterminada, y las páginas se numeran automáticamente.

Generador de libros electrónicos

Finalmente, pandoc puede convertir sus archivos en libros electrónicos adecuados para leer en un teléfono o un lector electrónico. Cómo administrar su colección de libros electrónicos para Amazon Kindle con calibre Cómo administrar su colección de libros electrónicos para Amazon Kindle con calibre El mayor problema con un lector electrónico como El Kindle de Amazon es que requiere un esfuerzo irrazonable para mover libros entre diferentes dispositivos. Antes de Kindle, me enamoré de Calibre. Un poco en el pesado ... Leer más. los epub y epub3 back-ends le dará un ebook formateado correctamente:

pandoc -r markdown -w epub -o mybook.epub mybook.md 

Consejos avanzados

Las ventajas de pandoc van más allá de su poder como una utilidad de línea de comandos ... por ejemplo, incluye soporte para una versión mejorada de Markdown y se puede integrar fácilmente con aplicaciones gráficas..

Sabor Markdown de Pandoc

Además de ser una herramienta de conversión, pandoc admite una versión ligeramente mejorada de Markdown. Mediante el uso de pandoc en lugar de la norma reducción comando, tiene algunas características adicionales disponibles, incluyendo las siguientes:

  • Metadatos - La versión de Markoc de Pandoc le permite incluir información en el encabezado de su documento, como el autor, la fecha, la dirección de correo electrónico, etc..
  • Decoraciones de texto - Puede aplicar decoraciones de texto como tachado o super / subíndice que no son compatibles con Markdown estándar a través de pandoc.
  • Mesas - Solo esto hace que valga la pena pandoc en comparación con “vainilla” Reducción. Al utilizar el carácter de canalización para separar las celdas de la tabla, puede crear una tabla que varíe de muy feo a legible para humanos en texto sin formato, así como en formato renderizado..
  • Listas de lujo - Pandoc le permite formatear listas con niveles de estilo de contorno, por ejemplo,. “1.,” entonces “UNA.,” entonces “yo.,” etc. También puede especificar un número de inicio para las listas, desde donde comienzan las listas en Markdown simple “1.”
  • Resaltado de sintaxis de código - Puede hacer que el resaltado se aplique a sus bloques de código diciéndole a pandoc cuál es el idioma.

Lo anterior es solo una selección de las características de Pandoc Markdown. Visite la página del manual en pandoc.org para obtener una lista completa de los extras que este sabor de Markdown proporciona.

Usa un GUI con pandoc

Si bien pandoc es efectivo como herramienta de línea de comandos, contiene muchas opciones. Si eres nuevo en Linux, es posible que prefieras usar pandoc con una interfaz GUI. Si bien no contiene una interfaz gráfica de forma predeterminada, puede instalar PanDocElectrion para convertir tus documentos con apuntar y hacer clic. Descargue el script de instalación desde el sitio web de la aplicación, luego ejecútelo para instalar todos los paquetes necesarios y el propio programa..

Una vez instalado, el npm start comando en el PanDocElectron directorio lanzará la aplicación. Con listas desplegables para formatos y la posibilidad de elegir el archivo de entrada con un cuadro de diálogo, esto le ayudará a acostumbrarse a la “dentro y fuera” de pandoc, por así decirlo.

Si te sientes cómodo con las innumerables opciones y banderas de pandoc, pero solo quieres una forma fácil llamada Usted puede integrarlo con su editor de texto GUI. Por ejemplo, el editor Atom contiene una serie de paquetes que permiten guardar el archivo actual en diferentes formatos utilizando pandoc (paquete pandoc-convert):

Otra opción es ejecutar comandos pandoc usando las funciones integradas de un editor, como el comando build. Del átomo herramientas de construcción paquete le da la capacidad de especificar comandos personalizados:

Luego, puede invocar el comando de compilación en sus archivos compatibles con pandoc, tal como lo haría en el código fuente:

Pandoc elimina parte del estrés de los cambios

Con pandoc en su caja de herramientas, puede estar más tranquilo sabiendo que siempre puede entregar sus documentos a otras personas en el formato que necesitan. Al mismo tiempo, puede aprovechar algunas de las excelentes características de Linux (considere dar a uno de los editores de texto basados ​​en terminales como empuje un intento).

¿A menudo te encuentras convirtiendo archivos de un lado a otro entre formatos? Si tiene problemas de compatibilidad, háganoslo saber en los comentarios y veremos si podemos usar pandoc para solucionarlo.!

Crédito de la imagen: Nirat.pix a través de Shutterstock.com

Explorar más sobre: ​​Conversión de archivos, Markdown.