Las 5 mejores herramientas gratuitas de software OCR para convertir imágenes en texto
Francamente, me gustaría saber sobre esta forma sencilla de usar el software de OCR disponible gratuitamente en mis días escolares. Por supuesto, no teníamos teléfonos móviles con cámara o Digicams de bajo costo, pero ¿no habría ahorrado horas de copiar notas?!
Ah, la tecnología moderna es maravillosa; tome una imagen escaneada (o tome una foto con una cámara móvil / Digicam) y el software presto-OCR extrae toda la información de la imagen en un formato de texto fácilmente editable.
Reconocimiento óptico de caracteres (OCR) es un sistema para convertir archivos de imagen escaneados / manuscritos escaneados a su formato de texto legible por máquina. El software OCR funciona analizando un documento y comparándolo con las fuentes almacenadas en su base de datos y / o observando las características típicas de los caracteres. Algunos software de OCR también lo ponen a través de un corrector ortográfico para “adivinar” Palabras no reconocidas. La precisión del 100% es difícil de lograr, pero lo que más se esfuerza por lograr es la aproximación cercana..
Tal vez ya haya encontrado nuestro anterior Cómo extraer texto de imágenes (OCR) Cómo extraer texto de imágenes (OCR) Cómo extraer texto de imágenes (OCR) La mejor manera de extraer texto de una imagen es usar el reconocimiento óptico de caracteres (LOC). Te mostramos siete herramientas gratuitas de OCR para el trabajo. Lea más, publique y use JOCR, una herramienta de software OCR gratuita. O es posible que haya establecido su preferencia por algunas herramientas de OCR en línea. Entonces, nuevamente, si ha pensado en maneras de explotar el software OCR para accesos directos de productividad, entonces permítanos darle algunas herramientas más para jugar..
Buscaremos 5 piezas gratuitas de software de OCR y, para comenzar, veamos las dos que ya se han pasado por alto y que ya están instaladas en nuestros sistemas..
OCR utilizando Microsoft OneNote 2007
Para las cosas OCR básicas ocasionales, la característica de reconocimiento óptico de caracteres de MS OneNote es un ahorro de tiempo. Puede que te lo hayas perdido; se llama Copiar texto de la imagen.
- Arrastre un escaneo o una imagen guardada a OneNote. También puede utilizar OneNote para acortar parte de la pantalla o una imagen en OneNote.
- Haga clic derecho en la imagen insertada y seleccione Copiar texto de la imagen. El texto reconocido ópticamente copiado entra en el portapapeles y ahora puede pegarlo en cualquier programa como Word o Notepad.
OneNote es la simplicidad personificada. Pero no es demasiado bueno para los personajes escritos a mano o incluso para los borrosos. Pero para un trabajo rápido, soy todo para el clip y pegado de OneNote.
OCR utilizando Microsoft Office Document Imaging
Otra herramienta poco utilizada dentro de la familia Microsoft. Está justo debajo Menú> Microsoft Office> Herramientas de Microsoft Office> Microsoft Office Document Imaging.
Hacer OCR usando la herramienta de imágenes de documentos es un poco limitante porque acepta solo formatos TIFF (o MDI). Pero eso no es una molestia ya que cualquier aplicación gráfica se puede usar para convertir una imagen a TIFF. En la captura de pantalla a continuación, he usado MS Paint para convertir un JPEG a un TIFF.
- Abre el archivo en Microsoft Office Document Imaging> Archivo> Abrir.
- Haga clic en el icono de ojo pequeño: Reconocer texto usando OCR.
- Haga clic en el icono de MS Word-Enviar texto a la palabra.
- Se abre un archivo de MS Word con el texto convertido editable..
- Alternativamente, también puede usar MS Paint para seleccionar un área específica y copiarla en el portapapeles. Abierto MS Office Document Imaging > seleccionar Página - Pegar Página para copiar la selección para OCR.
De nuevo, MODI manejó hábilmente el texto impreso, pero mi texto escrito a mano se encontró con un “OCR realizado pero no pudo reconocer texto” rápido'. Por supuesto, prueba con tu propia letra..
Entonces, dejemos atrás a la familia de Microsoft y veamos tres herramientas gratuitas que se llaman a sí mismas Software OCR.
SimpleOCR
La dificultad que tuve con el reconocimiento de escritura usando herramientas MS, podría haber encontrado una solución en SimpleOCR. Pero el software ofrece reconocimiento de escritura solo como una prueba gratuita de 14 días. Reconocimiento de impresión de la máquina sin embargo no tiene alguna restricción.
- El software se puede configurar para leer directamente desde un escáner o agregando una página (formatos jpg, tiff, bmp).
- SimpleOCR ofrece cierto control sobre la conversión mediante la selección de texto, la selección de imágenes y las funciones de ignorar texto.
- La conversión a texto lleva el proceso a una validación escenario; un usuario puede corregir las discrepancias en el texto convertido utilizando un corrector ortográfico incorporado.
- El archivo convertido se puede guardar en un formato doc o txt.
SimpleOCR estaba bien con el texto normal, pero su manejo de diseños de varias columnas fue un error. En mi opinión, la precisión de conversión de las herramientas de Microsoft fue considerablemente mejor que SimpleOCR..
SimpleOCR (v3.1) es una descarga de 9 MB y es compatible con Windows.
TopOCR
Justo de lo que estaba hablando al principio! TopOCR, en una ruptura con el software típico de OCR, está diseñado más para cámaras digitales (al menos 3 MP) y teléfonos móviles junto con escáneres. Al igual que SimpleOCR, tiene una interfaz de dos ventanas: la fuente Imagen ventana y el Texto ventana.
La imagen obtenida de una cámara o un escáner en la ventana izquierda se convierte al formato de texto en el editor de texto a la derecha. El editor de texto funciona como WordPad y puede usar Microsoft Texto a voz motor.
- El software es compatible con los formatos JPEG, TIFF, GIF y BMP..
- La configuración de la imagen, como brillo, color, contraste, nivelación, nitidez, etc., se puede utilizar para mejorar la legibilidad de la imagen..
- Los ajustes del filtro de la cámara también se pueden configurar para mejorar la imagen..
- El archivo convertido se puede guardar en una variedad de formatos-PDF, RTF, HTML y TXT.
- TopOCR funciona bien con texto orientado directamente, pero la falla habitual de OCR con texto en columnas permanece.
- Sin embargo, el software analiza bien una página mixta (texto más gráficos) y procesa el texto solamente.
- El software funciona con 11 idiomas..
Para obtener los mejores resultados con su cámara, lea Cómo obtener los mejores resultados con la página TopOCR.
TopOCR (v3.1) es una descarga de 8MB y es compatible con Windows (no probado en Vista).
FreeOCR
Este software gratuito de OCR utiliza Tesseract OCR motor. El código OCR de Tesseract se desarrolló en los laboratorios HP entre 1985 y 1995 y actualmente se encuentra en Google. Se considera como uno de los motores de OCR de código abierto más precisos disponibles..
FreeOCR es una interfaz simple de Windows para ese código subyacente.
- Es compatible con la mayoría de los archivos de imagen y archivos TIFF de varias páginas.
- Puede manejar formatos PDF y también es compatible con dispositivos TWAIN como escáneres.
- FreeOCR también tiene la interfaz familiar de doble ventana con configuraciones fáciles de entender.
- Antes de iniciar el proceso de conversión de un solo clic, puede ajustar el contraste de la imagen para mejorar la legibilidad.
FreeOCR (v.2.03) requiere el marco de Microsoft Net 2.0. El software de 4.38MB compatible con Windows XP / Vista también se puede descargar desde este sitio alternativo.
Las herramientas gratuitas de OCR vienen con sus propias limitaciones. Y escanear una página tiene mucho que ver con las resoluciones, los contrastes y la claridad de las fuentes. Desde el punto de vista de un usuario promedio, el 100% de precisión de OCR sigue siendo un flujo continuo. Cómo funciona la imagen a texto (también conocido como reconocimiento óptico de caracteres) Cómo funciona la imagen a texto (también conocido como reconocimiento óptico de caracteres) Extraer texto de las imágenes nunca ha sido tan fácil Es hoy gracias a la tecnología de reconocimiento óptico de caracteres (OCR). ¿Pero qué es OCR? ¿Y cómo funciona OCR? Lee mas .
El software gratuito de OCR que elegiría
Aunque las herramientas gratuitas eran adecuadas con el texto impreso, fallaron con el texto manuscrito cursivo normal. Mi preferencia personal por el uso de OCR de antemano se inclina hacia los dos productos de Microsoft que mencioné al principio.
Tu propia opinión importa. ¿Cuál es tu herramienta de elección? ¿Reconoce el software gratuito de OCR lo que has superado? Y lo que es más importante, ¿reconoces lo que te devuelven? Haznos saber!
Tenga en cuenta que si está buscando resultados profesionales, debe probar el software de OCR profesional. Software de OCR gratuito vs. pago: Microsoft OneNote y Nuance OmniPage. Texto en imágenes o archivos PDF en documentos de texto editables. ¿Una herramienta OCR gratuita como OneNote es suficientemente buena? ¡Vamos a averiguar! Leer más, como Nuance OmniPage.
Crédito de la imagen: kalleboo
Explorar más sobre: Editor de imágenes, OCR.