¿Cuál es el mejor programa gratuito de OCR o ICR para la transcripción de manuscritos?

¿Cuál es el mejor programa gratuito de OCR o ICR para la transcripción de manuscritos? / Pregunte a los expertos

Javier pregunta:

Soy un escritor de cuentos y cuentos. Estoy buscando un programa gratuito de Reconocimiento óptico de caracteres (OCR) o Reconocimiento inteligente de caracteres (ICR) para escanear mis manuscritos antiguos de imágenes o fotografías para poder convertirlos en archivos de Microsoft Word.

¿Hay algún programa gratuito y preciso que pueda hacer esto? Desafortunadamente, no tengo un escáner, pero sí tengo acceso a una cámara digital con una resolución de 20 megapíxeles.

La respuesta de Kannon:

Como ya mencionó, hay varios tipos de tecnologías de reconocimiento de caracteres que pueden convertir automáticamente la escritura manuscrita o mecanografiada en caracteres digitales. El nivel de precisión de este tipo de software varía mucho entre las diferentes implementaciones. Algunos se convierten letra por letra y otros pueden convertir palabras completas. Hay tres categorías generales de este software:

  • Reconocimiento óptico de caracteres (OCR)
  • Reconocimiento Inteligente de Caracteres (ICR)
  • Reconocimiento Inteligente de Palabras (IWR)

Reconocimiento óptico de caracteres

En verdad, OCR es un término genérico y, a menudo, todos los métodos descritos en este artículo se conocen como OCR. Sin embargo, Wikipedia otorga a OCR su propia clasificación, pero las implementaciones modernas tienden a agrupar múltiples métodos. Entonces ¿Qué es lo que hace? OCR convierte letras individuales o escritas a mano en caracteres digitales. Así que el software mira un documento y luego intenta convertirlo en texto plano adivinando qué es cada carácter.

El software no es perfecto. El software OCR puede malinterpretar caracteres individuales con apariencias similares, lo que da lugar a palabras mal escritas y resultados inexactos. La mayoría de las veces, los usuarios pueden copiar el texto generado por un programa OCR en un procesador de textos y corregir automáticamente los errores de ortografía. A menudo los errores aparecerán como caracteres similares. Por ejemplo la carta “re” podría ser representado como “cl”.

Pero cuando se trata de textos escritos a mano, OCR no lo hace muy bien. Al menos, la mayoría de las implementaciones gratuitas son trágicamente malas. Hay algunos productos comerciales que pueden De Verdad Clave la transcripción manuscrita, pero su precio los coloca completamente fuera del alcance del público en general. Por ejemplo, existe el software ReadSoft OCR de Lexmark. Este software solo para empresas cuesta miles de dolares.

Reconocimiento Inteligente de Caracteres

ICR es un subconjunto de OCR que se especializa en convertir texto escrito a mano en caracteres digitales individuales. Dado que sus notas y manuscritos están escritos a mano, un programa de ICR es el más útil. Sin embargo, no estoy seguro de la precisión con la que pueden convertir textos escritos en idiomas extranjeros, como el español. Al igual que con OCR, los usuarios pueden mejorar la calidad de los textos de salida copiándolos en un procesador de textos con la corrección de ortografía activada y luego revisando a mano.

Reconocimiento inteligente de palabras

La última evolución de OCR e ICR es el software Intelligent Word Recognition. En lugar de reconocer caracteres individuales, intenta traducir palabras escritas a mano completas. Al igual que OCR e ICR, el Reconocimiento inteligente de palabras a menudo traduce palabras erróneas y requiere que el usuario corrija manualmente los errores cometidos..

¿Cuál es el mejor software gratuito de OCR??

Tesseract

Hay muchas opciones disponibles. Tesseract es probablemente el mejor fuente abierta (y gratis) software de OCR por ahí. Que yo sepa, solo mira caracteres individuales y no palabras completas.

Porque está utilizando Microsoft Word (que tiene el mejor y más personalizable corrector ortográfico Cómo corregir ortografía y gramática en Microsoft Word Cómo corregir ortografía y gramática en Microsoft Word Puede personalizar las herramientas integradas de corrección ortográfica y gramatical de Microsoft Word para cumplir sus necesidades. Incluso puede usar Autocorrección para acelerar la escritura. Lea más en las empresas), puede copiar todo el texto en Word y luego realizar una revisión ortográfica para eliminar las faltas de ortografía..

Tesseract es en realidad un motor de OCR que se ejecuta desde la línea de comandos. A menos que esté dispuesto a lidiar con la dificultad de manejar una herramienta de línea de comandos, es probable que desee instalar algo más fácil de usar. Hay un descargable “Interfaz” (o una interfaz de usuario gráfica) que le permite usar Tesseract como herramienta de arrastrar y soltar: PDF OCR X. Primero, instale el paquete de software y luego ejecútelo. Luego verás una ventana:

Luego simplemente arrastra y suelta el archivo de imagen en la ventana. Una vez que la imagen se cargue, ejecute el software de transcripción OCR. Puede tardar un minuto más o menos.

Desafortunadamente, resultó totalmente inadecuado para manejar su texto. Así es como se ve después de extraer el texto del documento:

Microsoft OneNote

Como parece que ya está utilizando Microsoft Office, la mejor opción probablemente sea también de Microsoft. Voy a adivinar que tienes una copia de Microsoft Office, que incluye OneNote. Esto viene equipado con tecnología OCR bastante avanzada..

Además, tanto en iOS como en Android, también está la lente de Microsoft Office completamente gratuita, que puede convertir JPEG (y otros formatos de imagen) directamente en texto. Lo que hace que las versiones móviles sean tan maravillosas es que puede capturar una imagen, cargarla en el sistema de computación en la nube de Microsoft y luego ejecutar la extracción de texto de OneNote en un escritorio..

El proceso es bastante simple.. Primero, toma una foto de tu texto.. Si ha decidido utilizar la aplicación OneNote, solo tendrá que guardar el archivo en su cuenta OneDrive. De lo contrario, transfiera la imagen a su computadora y colóquela en OneNote.

Luego haga clic derecho en la imagen y seleccione Dupdo Texto de la imagen desde el menú contextual.

Luego haga clic con el botón derecho en una parte en blanco de OneNote (o en una aplicación de lectura de texto) y pega el texto en. El texto generado de su documento se ve así:

Desafortunadamente, los resultados de OneNote no lo hacen en cualquier sitio Cerca de un buen trabajo, produciendo un completo disparate. Esto puede deberse a una combinación de factores, como una imagen distorsionada o escritura que no se realiza en línea recta, o simplemente porque el software no es lo suficientemente bueno.

Google Keep

En este momento, la mejor solución para OCR en documentos escritos a mano se relaciona con el aprendizaje automático: Específicamente, el aprendizaje profundo. El aprendizaje profundo es un método sofisticado de entrenamiento de una computadora para realizar tareas en las que anteriormente solo se destacaba el humano, como el reconocimiento facial (Picasa hace reconocimiento facial Cómo utilizar el reconocimiento facial en los álbumes web de Picasa Cómo usar el reconocimiento facial en los álbumes web de Picasa Leer más , lo creas o no). Google adquirió recientemente DeepMind, que desarrolla tecnología de aprendizaje profundo. Proyectos de investigación frescos que podrían cambiar el futuro. Proyectos de investigación geniales que podrían cambiar el futuro. Mega corporaciones como Google, Microsoft, IBM e Intel irán a dar a las generaciones futuras el mundo que podamos. solo imagino ahora? Estos emocionantes proyectos de investigación dicen que es una promesa que mantendrán. Lee mas . Esta adquisición clave tuvo un gran efecto: Microsoft pierde a Google en OCR Microsoft vs Google: ¿Quién lidera la carrera de inteligencia artificial? Microsoft vs Google: ¿Quién lidera la carrera de la inteligencia artificial? Los investigadores de inteligencia artificial están haciendo progresos tangibles, y las personas están empezando a hablar seriamente sobre la IA nuevamente. Los dos titanes que lideran la carrera de inteligencia artificial son Google y Microsoft. Lee mas . En este momento, Google ofrece uno de los métodos más avanzados (y gratuitos): Google Keep.

Google Keep (que revisamos por primera vez en 2013 Simple Notes On The Go: Google Keep para Android revisado Simple Notes On The Go: Google Keep para Android revisado Hay algunas aplicaciones sorprendentes para tomar notas por ahí, pero hay una que merece una mirada más detallada : Google Keep, un guardián de notas que tiene una aplicación de Android de excelente apariencia y una aplicación web elegante. Leer más) también ofrece una versión móvil de su aplicación para Android. Al igual que con OneNote, puede capturar la imagen y transferirla directamente a la nube de Google. Simplemente arrastre la imagen a la ventana de Google Keep. Luego haga clic en el botón de menú (tres puntos verticales) y seleccione Tomar el texto de la imagen desde el menú contextual.

Esto es lo que parece después de extraer el texto:

Google sigue ganando

Como puedes ver, Google Keep domina en la competencia. Los resultados se pueden mejorar aún más mediante el uso de una herramienta de edición de imágenes. 10 herramientas gratuitas del editor de fotos para sacar el máximo provecho de sus fotos. 10 herramientas gratuitas del editor de fotos para sacar el máximo provecho de sus fotos. Lo que haya sucedido con todas las instantáneas que haya tomado en el pasado. ? Si tiene planes e ideas, aquí hay algunas herramientas excelentes de Windows y algunas plataformas cruzadas para procesarlas. Leer más para aumentar el contraste y enderezar la imagen..

Esperemos que esas opciones ayuden. En caso de que necesite más opciones de OCR, consulte las 5 mejores herramientas de OCR Las 5 mejores herramientas de OCR para extraer texto de las imágenes Las 5 mejores herramientas de OCR para extraer texto de las imágenes Cuando tiene un montón de papel, ¿cómo imprime todo eso? ¿Texto convertido en algo que un programa digital podrá reconocer e indexar? Mantenga un buen software de OCR cerca. Leer más, para más información..

Explorar más sobre: ​​OCR, Transcripción.