4 herramientas en línea gratuitas de OCR puestas a prueba definitiva

4 herramientas en línea gratuitas de OCR puestas a prueba definitiva / Internet

Si desea convertir cualquier texto impreso en texto digital que pueda copiar, pegar, editar y buscar, deberá utilizar los escáneres de reconocimiento óptico de caracteres (OCR).

Cuando elige escanear o tomar una foto de un documento, esto se guardará en un formato como JPEG o PDF. El software de OCR puede reconocer las letras y los números dentro de estos documentos y convertirlos en un PDF 4 Métodos para crear y editar archivos PDF de forma gratuita 4 Métodos para crear y editar archivos PDF de forma gratuita De todos los tipos de archivos comunes que se encuentran en nuestro En el mundo de la computación, el PDF es probablemente uno de los más restrictivos, mientras que al mismo tiempo está disponible para que todos lo usen (principalmente para leer) ... Leer más, o en un archivo que puede editar en programas como Microsoft Word.

El problema es que algunos escáneres OCR funcionan mucho mejor que otros, ya que lo mejor es bastante pesado en la billetera.

Omnipage18, por ejemplo, cuesta $ 150, pero es especialmente bueno para reconocer diferentes idiomas. Adobe Acrobat Pro DC cuesta $ 400, pero tiene una precisión increíble. ABBYY FineReader cuesta $ 150, pero es fantástico para convertir documentos como revistas y folletos en texto con capacidad de búsqueda. Probaremos la oferta en línea de ABBYY más adelante en este artículo.

Sin embargo, si buscas alternativas gratuitas que puedas descargar y usar en Windows u OS X, debe probar estas herramientas de OCR Las 5 mejores herramientas de OCR para extraer texto de las imágenes Las 5 mejores herramientas de OCR para extraer texto de las imágenes Cuando tiene un montón de papel, ¿cómo obtiene todo el texto impreso? ¿Convertido en algo que un programa digital podrá reconocer e indexar? Mantenga un buen software de OCR cerca. Lee mas . Pero si prefieres usar una gratis, en línea Herramienta de OCR, siga leyendo, ya que hemos probado algunos de los mejores, con los resultados a continuación.

La prueba

Parece que la mayoría de las personas ahora usan sus teléfonos inteligentes para escanear por ellos. Escanee y administre sus recibos, ahorre espacio, papel y tiempo Escanee y administre sus recibos, ahorre espacio, papel y tiempo Los recibos en papel se pierden fácilmente y son difíciles de encontrar cuando los necesita más. Afortunadamente, ir digital resuelve ambos problemas. Leer más, decidí usar la aplicación Scannable de Evernote (gratis en iOS y Android). He escaneado la primera página de Richard Dawkin Montañismo Improbable, Para ver qué resultados podríamos obtener con un formato muy básico. También escaneé una página de Tim Ferriss El chef de 4 horas Para probar los escáneres con un formato un poco más complicado. Guardé cada uno de estos archivos como PDF.

Luego, estos documentos se ejecutaron a través de algunas de las herramientas supuestamente mejores de OCR en línea para ver qué tan bien les fue..

OCR en línea gratis

Afortunadamente, no es necesario registrarse para utilizar el OCR en línea gratuito. Y quedé doblemente impresionado cuando vi su reclamo de mantener el formato y el diseño de mi documento.

El sitio afirma poder admitir PDF, GIF, BMP, JPEG, TIFF y PNG como entrada. Las salidas pueden ser DOC, un documento de texto PDF, RTF y TXT. Desafortunadamente, no pude averiguar si tenían un límite de tamaño de archivo.

Documento básico a PDF
Convertido absolutamente perfectamente. ¡No hay mucho más que decir! Nos vamos a un muy buen comienzo.

Documento básico a DOC
Las palabras reales parecen haberse convertido perfectamente, aparte de la “ount” desde “Monte Rushmore” de alguna manera va sin permiso. Sin embargo, el formato es una historia diferente. Muchas comas fueron reemplazadas por guiones bajos, y se insertaron espacios al azar en los puntos a lo largo del documento. Sin embargo, cuando más tarde vea cómo le fue al software premium en esta prueba, este no es un mal esfuerzo. en absoluto.

Documento complejo a PDF
¡Convertir el documento tomó 120 segundos! Una vez completado, todo el texto se había convertido con aproximadamente el 95% de precisión, aunque el texto en el cuadro separado en la parte superior derecha de la página no se podía buscar. Algunos otros personajes a lo largo del PDF fueron incorrectos, también.

Documento complejo a DOC
Esta vez, la conversión solo tomó 10 segundos, con el texto nuevamente convertido con aproximadamente el 95% de precisión. Hubo algunos problemas de espaciado extraños, y el software tuvo problemas para convertir la fuente en la parte superior derecha del documento, y perdió algunos caracteres aquí y allá..

Veredicto
Si desea convertir documentos de formato simple a PDF, esta es una herramienta fantástica. En términos de conversión a DOC, los resultados no fueron nada del otro mundo..

i2OCR

i2OCR hace algunos reclamos impresionantes. La herramienta reconoce más de 60 idiomas, puede manejar diseños de varias columnas (eliminando el formato), no tiene límites de tamaño de archivo, puede convertir archivos cargados y de URLs. Y tampoco es necesario registrarse para utilizar esta herramienta..

El servicio funciona simplemente extrayendo el texto de su imagen y luego generando texto sin formato. Puede corregir rápidamente cualquier error en la vista en paralelo, antes de copiar el texto en otros programas o descargarlo como DOC, PDF o HTML..

Nota: cuando intenté cargar mis documentos PDF, estos fueron rechazados por i2OCR, por lo que tuve que convertirlos a JPEG (tomando una captura de pantalla de ellos, luego subiendo los archivos).

Documento básico a texto sin formato
Debido a la forma en que funciona esta herramienta, se pierde todo el formato, aunque la conversión de imagen a texto fue casi perfecta. Hubo algunos pequeños errores, como el espaciado entre párrafos, y algunas comas se reemplazaron con puntos, pero estos son pequeños niggles.

Documento complejo a texto sin formato
La mayoría del texto se convirtió sin demasiados errores, aparte del título y la receta en la parte superior derecha, que era ilegible para esta herramienta. La forma en que las columnas se convirtieron a texto plano estaba lejos de ser ideal. Si desea que esta conversión sea viable, se necesitaría mucho tiempo para reorganizar las líneas en oraciones coherentes..

Veredicto
Para documentos básicos, i2OCR funciona muy bien. La posibilidad de editar el texto antes de descargarlo también es un buen toque. Sin embargo, para documentos más complejos, la conversión sigue siendo bastante precisa, pero la forma en que se imprime el texto no hará su vida mucho más fácil.

OCR en línea

El OCR en línea actualmente es compatible con 46 idiomas diferentes y puede convertir PDF, JPG, BMP, TIFF y GIF a formato Word, Excel o Texto sin formato. El sitio reclama “Los documentos convertidos se ven exactamente como el original: tablas, columnas y gráficos”.

La versión que puede usar sin registrarse le permite convertir hasta 15 imágenes por hora (límite de 5 mb). Si se registra para obtener una cuenta, puede comprar más páginas por encima de este límite, al tiempo que también puede convertir documentos de varias páginas y archivos ZIP..

Documento básico a DOC
El documento básico convertido impecablemente aparte del número romano yo no siendo recogido. Como prometió el sitio, el formato fue exactamente como estaba en el libro. Felicitaciones a esta herramienta.

Documento complejo a DOC
Después de estar decepcionado por las herramientas anteriores de OCR al convertir el documento complejo, el OCR en línea me impresionó enormemente. El diseño era casi perfecto, como se puede ver arriba. Una vez más, sin embargo, la receta no fue recogida demasiado bien, pero cualquier otro error menor fue insignificante.

Veredicto

Resultados absolutamente fantásticos de OCR en línea. El único inconveniente que veo es que no hay forma de descargar los documentos convertidos como archivos PDF, ya que los formatos de salida mencionados incluyen DOCX, XLSX y TXT solamente..

ABBYY FineReader Online (versión de prueba de 10 páginas)

Como se mencionó anteriormente, ABBYY es uno de los líderes del mercado en software OCR, que cuesta alrededor de $ 150 por su programa completo y descargable. Ellos ofrecen una Prueba gratuita de 10 páginas para su herramienta en línea, aunque (registro requerido). Para una suscripción de $ 5, su herramienta en línea le permitirá convertir 200 páginas cada mes.

Los archivos aceptados pueden ser de hasta 100 mb, en cualquiera de estos formatos: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP y PNG. ABBYY también reconoce casi 200 idiomas. Las salidas son especialmente impresionantes, con una opción entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 y EPUB.

Incluso puedes probar un par de funciones BETA durante tu prueba. La primera es la opción de traducir su documento a otro idioma. La otra es exportar su documento convertido a su cuenta de almacenamiento en la nube, ya sea Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.

Documento Básico a DOCX
Los resultados generales fueron buenos, pero no sorprendentes, ya que se trata de un producto premium. Se intercambiaron varias comas y puntos, se reemplazaron varias comillas invertidas por un asterisco, faltaban un par de letras mayúsculas y una palabra (literalista) se escribía incorrectamente.

Documento complejo a DOCX
Una vez convertidos, hubo muy pocas fallas en el texto dentro del documento (¡aparte del OCR que está luchando con la fuente de esa receta otra vez!), Pero el formato dejó mucho que desear.

Las tres columnas de alguna manera ocuparon dos páginas, con la columna central solamente Apareciendo en la segunda página. Si quisieras en realidad hacer Cualquier cosa con este documento convertido, terminarías sacándote el pelo..

Documento básico a PDF
Mientras revisaba el PDF convertido, no pude encontrar ningún fallo. Tal vez hemos encontrado donde sobresale ABBYY. Resultados fantasticos.

Documento complejo a PDF
De nuevo, no pude encontrar ningún error en este archivo convertido. ABBYY obviamente sabe cómo convertir a PDF excepcionalmente bien.

Veredicto
Si está satisfecho pagando unos pocos dólares, la conversión a PDF parece funcionar extraordinariamente bien con este servicio, y poder sincronizar los archivos convertidos a su almacenamiento en la nube es especialmente útil si está escaneando un gran volumen de documentos. Sin embargo, como con las otras opciones, ABBYY todavía no ha descubierto cómo convertir documentos a DOC sin problemas para facilitar la edición..

El resultado final

Si, como la mayoría de las personas, solo busca escanear algunos artículos de revistas y algunas facturas del hogar, no necesitará editar estos documentos. Por lo tanto, la conversión directa a PDF será adecuada para usted, ya que aún podrá buscar esos documentos. Para esto, Free Online OCR fue definitivamente la mejor herramienta gratuita que probamos. Dicho esto, si está dispuesto a pagar $ 5 por mes por casi la perfección, el FineReader Online de ABBYY fue un poco más preciso..

Cuando se trata de convertir documentos a DOC, no logramos encontrar ninguna solución que fuera perfecta, pero con mucho, los mejores resultados provienen de Online OCR. La conversión no fue perfecta, pero la integridad del formato se mantuvo en gran parte intacta, y los errores fueron insignificantes. Cuando comparamos estos resultados con el “prima” ofreciendo de ABBYY, usted no puede dejar de estar impresionado masivamente.

No incluimos las capacidades de OCR de Google Drive en esta publicación; un poco por la simplicidad de Google, pero más por el hecho de que queríamos probar algunos otros servicios gratuitos de OCR en línea por ahí.

A usted: ¿Qué otras herramientas de OCR en línea recomendaría a nuestros lectores? ¿Y qué has probado que nunca volverías a usar??

Explorar más sobre: ​​Conversión de archivos, OCR.