4 herramientas de OCR en línea gratuitas sometidas a la última prueba

Con los avances en la tecnología de OCR, la conversión de texto e imágenes de su documento PDF escaneado a los formatos de texto editables es más fácil. Probamos algunas herramientas gratuitas de OCR en línea para que no tenga que hacerlo.

Con los avances en la tecnología de OCR, la conversión de texto e imágenes de su documento PDF escaneado a los formatos de texto editables es más fácil.  Probamos algunas herramientas gratuitas de OCR en línea para que no tenga que hacerlo.
Anuncio

Si desea convertir cualquier texto impreso en texto digital que pueda copiar, pegar, editar y buscar, necesitará utilizar escáneres de reconocimiento óptico de caracteres (OCR).

Cuando elige escanear o tomar una foto de un documento, esto se guardará en un formato como JPEG o PDF. El software OCR puede reconocer las letras y números dentro de estos documentos y convertirlos en un PDF con capacidad de búsqueda. 4 Métodos para crear y editar archivos PDF de forma gratuita. 4 Métodos para crear y editar archivos PDF de forma gratuita. mundo de la informática, PDF es probablemente uno de los más restrictivos, mientras que al mismo tiempo está disponible para que todos lo usen (principalmente para leer) .... Leer más, o en un archivo que puede editar en programas como Microsoft Word.

El problema es que algunos escáners de OCR funcionan mucho mejor que otros, y los mejores son bastante pesados.

Omnipage18, por ejemplo, cuesta $ 150, pero es especialmente bueno para reconocer diferentes idiomas. Adobe Acrobat Pro DC cuesta unos deslumbrantes $ 400 pero tiene una precisión increíble. ABBYY FineReader cuesta $ 150, pero es fantástico para convertir documentos como revistas y folletos en texto con capacidad de búsqueda. Estaremos probando la oferta en línea de ABBYY más adelante en este artículo.

Sin embargo, si busca alternativas gratuitas que puede descargar y usar en Windows o OS X, debe probar estas herramientas de OCR. Las 5 mejores herramientas de OCR para extraer texto de imágenes. Las 5 mejores herramientas de OCR para extraer texto de imágenes. tener resmas de papel, ¿cómo se puede convertir todo ese texto impreso en algo que un programa digital podrá reconocer e indexar? Mantenga un buen software de OCR cerca. Lee mas . Pero si prefiere usar una herramienta gratuita de OCR en línea, siga leyendo, ya que hemos probado los primeros, con los resultados a continuación.

La prueba

Parece que la mayoría de la gente usa ahora sus teléfonos inteligentes para escanearlos. Escanee y administre sus recibos, ahorre espacio, papel y tiempo Escanee y administre sus recibos, ahorre espacio, papel y tiempo Los recibos de papel se pierden fácilmente y son difíciles de encontrar cuando los necesita más. Afortunadamente, ir digital resuelve estos dos problemas. Leer más, decidí usar la aplicación Escaneable de Evernote (gratis en iOS y Android). Escaneé la primera página de Climbing Mount Improbable de Richard Dawkin, para ver qué resultados podíamos obtener con un formato muy básico. También escaneé una página del The 4-Hour Chef de Tim Ferriss para probar los escáneres con un formato ligeramente más complicado. Guardé cada uno de estos archivos como PDF.

Prueba de OCR en línea

Luego, estos documentos se procesaron a través de algunas de las supuestas mejores herramientas de OCR en línea para ver qué tan bien les iba.

OCR gratuito en línea

Afortunadamente, no se requiere registrarse para usar Free Online OCR. Y quedé doblemente impresionado cuando vi su afirmación de mantener el formato y el diseño de mi documento.

OCR gratuito en línea

El sitio afirma ser capaz de soportar PDF, GIF, BMP, JPEG, TIFF y PNG como entrada. Las salidas pueden ser DOC, un documento de texto PDF, RTF y TXT. Lamentablemente, no pude averiguar si tenían un límite de tamaño de archivo.

Documento básico a PDF
Convertido absolutamente perfectamente. ¡No hay mucho más para decir! Hemos tenido un buen comienzo.

Documento Básico para DOC
Las palabras reales parecen haberse convertido impecablemente, aparte del "ount" del "Monte Rushmore" que de alguna manera estaba sin permiso. El formateo es una historia diferente, sin embargo. Muchas comas se reemplazaron por guiones bajos y se insertaron espacios aleatorios en los puntos a lo largo del documento. Sin embargo, cuando ve más adelante cómo le fue en esta prueba al software premium, este no es un mal esfuerzo.

Documento complejo a PDF
¡Convertir el documento tomó 120 segundos! Una vez completo, todo el texto se había convertido con aproximadamente el 95% de precisión, aunque el texto en el cuadro separado en la parte superior derecha de la página no se podía buscar. Algunos otros personajes en todo el PDF también eran incorrectos.

Documento complejo a DOC
Esta vez, la conversión solo tomó 10 segundos, y el texto volvió a convertirse con una precisión del 95%. Hubo algunos problemas de espaciado extraños, y el software tuvo problemas para convertir la fuente en la parte superior derecha del documento, y se perdió algunos caracteres aquí y allá.

Veredicto
Si desea convertir documentos con formato simple a PDF, esta es una herramienta fantástica. En términos de conversión a DOC, los resultados no fueron nada del otro mundo.

i2OCR

i2OCR hace algunas afirmaciones impresionantes. La herramienta reconoce más de 60 idiomas, puede manejar diseños de múltiples columnas (eliminando el formato), no tiene límites de tamaño de archivo, puede convertir archivos cargados y URL. Y tampoco es necesario que se registre para usar esta herramienta.

El servicio funciona simplemente extrayendo el texto de su imagen y luego generando texto sin formato. Puede corregir rápidamente cualquier error en la vista uno al lado del otro, antes de copiar el texto en otros programas o descargarlo como DOC, PDF o HTML.

Nota: cuando traté de cargar mis documentos PDF, i2OCR los rechazó, así que tuve que convertirlos a JPEG (tomando una captura de pantalla de ellos y luego cargando los archivos).

Documento básico para texto sin formato Captura de pantalla 2016-02-11 a las 12.30.28
Debido a la forma en que funciona esta herramienta, se pierde todo el formato, aunque la conversión de imagen a texto fue casi perfecta. Hubo algunos errores pequeños, como el espaciado entre párrafos, y algunas comas fueron reemplazadas por puntos, pero estos son pequeños inconvenientes.

Documento complejo a texto sin formato Captura de pantalla 2016-02-11 a las 12.39.48
La mayoría del texto se convirtió sin demasiados errores, aparte del título y la receta en la parte superior derecha, que no se podían leer para esta herramienta. La forma en que las columnas se convirtieron en texto plano distaba mucho de ser ideal. Si desea que esta conversión sea viable, se necesitará mucho tiempo para reorganizar las líneas en oraciones coherentes.

Veredicto
Para documentos básicos, i2OCR funciona de maravilla. La capacidad de editar el texto antes de descargar también es un toque muy agradable. Sin embargo, para documentos más complejos, la conversión sigue siendo bastante precisa, pero la forma en que se emite el texto no hará que su vida sea mucho más fácil.

OCR en línea

El OCR en línea actualmente admite 46 idiomas diferentes y puede convertir PDF, JPG, BMP, TIFF y GIF en formato de Word, Excel o texto sin formato. El sitio afirma que "los documentos convertidos se ven exactamente como el original: tablas, columnas y gráficos".

La versión que puede usar sin registrarse le permite convertir hasta 15 imágenes por hora (límite de 5 mb). Si se registra para una cuenta, puede comprar más páginas además de este límite, y también podrá convertir documentos de varias páginas y archivos ZIP.

Resultados de OCR en línea

Documento Básico para DOC
El documento básico convertido perfectamente sin el número romano I no fue recogido. Como el sitio prometió, el formato era exactamente como estaba en el libro. Felicitaciones a esta herramienta.

Documento complejo a DOC
Después de haberme decepcionado con las herramientas anteriores de OCR para convertir el documento complejo, el OCR en línea me impresionó enormemente. El diseño era casi perfecto, como puedes ver arriba. Una vez más, la receta no fue recogida demasiado bien, pero cualquier otro error menor fue insignificante.

Veredicto

Resultados absolutamente fantásticos de Online OCR. El único inconveniente que veo es que no hay forma de descargar los documentos convertidos como archivos PDF, ya que los formatos de salida mencionados incluyen solo DOCX, XLSX y TXT.

ABBYY FineReader Online (prueba de 10 páginas)

Como se mencionó anteriormente, ABBYY es uno de los líderes del mercado en software de OCR, que cuesta alrededor de $ 150 por su completo programa descargable. Sin embargo, ofrecen una versión de prueba gratuita de 10 páginas para su herramienta en línea (es necesario registrarse). Por una suscripción de $ 5, su herramienta en línea le permitirá convertir 200 páginas cada mes.

ABBYY FineReader en línea

Los archivos aceptados pueden tener hasta 100mb, en cualquiera de estos formatos: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP y PNG. ABBYY también reconoce casi 200 idiomas. Las salidas son especialmente impresionantes, con opciones entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 y EPUB.

Incluso puedes probar un par de funciones BETA durante tu prueba. El primero es la opción de traducir su documento a otro idioma. El otro es exportar su documento convertido a su cuenta de almacenamiento en la nube, ya sea Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.

Documento básico para DOCX
Los resultados generales fueron buenos, pero no sorprendentes considerando que este es un producto premium. Se intercambiaron varias comas y puntos, se sustituyeron varias comillas invertidas por un asterisco, faltaban un par de letras mayúsculas y una palabra (literal) se deletreaba incorrectamente.

Documento complejo a DOCX
Una vez convertidos, había muy pocas fallas en el texto dentro del documento (¡aparte de que el OCR estaba teniendo problemas con la fuente de esa receta otra vez!), Pero el formato dejaba mucho que desear.

Resultado ABBYY

Las tres columnas de alguna manera ocuparon dos páginas, con la columna central solo apareciendo en la segunda página. Si realmente quisieras hacer algo con este documento convertido, terminarías por arrancarte los pelos.

Documento básico a PDF
Al revisar el PDF convertido, no pude encontrar ningún error en absoluto. Tal vez hemos encontrado donde ABBYY sobresale. Fantásticos resultados.

Documento complejo a PDF
De nuevo, no pude encontrar ningún error en este archivo convertido. ABBYY obviamente sabe cómo convertir a PDF excepcionalmente bien.

Veredicto
Si está contento pagando unos pocos dólares, la conversión a PDF parece funcionar fenomenalmente bien con este servicio, y poder sincronizar los archivos convertidos a su almacenamiento en la nube es especialmente útil si está escaneando un gran volumen de documentos. Sin embargo, al igual que con las otras opciones, ABBYY aún no ha descubierto cómo convertir documentos sin problemas a DOC para una fácil edición.

El resultado final

Si, como la mayoría de las personas, solo busca escanear algunos artículos de revistas y algunas facturas del hogar, no necesitará editar estos documentos. Por lo tanto, la conversión directa a PDF será adecuada para usted, porque aún podrá buscar esos documentos. Para esto, Free Online OCR fue definitivamente la mejor herramienta gratuita que probamos. Dicho eso, si está dispuesto a pagar $ 5 por mes por casi la perfección, ABBYY's FineReader Online fue un poco más preciso.

Cuando se trata de convertir documentos a DOC, no logramos encontrar ninguna solución que fuera perfecta, pero los mejores resultados provienen de Online OCR. La conversión no fue perfecta, pero la integridad del formato se mantuvo en gran parte intacta, y los errores fueron insignificantes. Cuando comparamos estos resultados con la oferta "premium" de ABBYY, no puede evitar sentirse impresionado.

No incluimos las capacidades de OCR de Google Drive en esta publicación; un poco para la ubicuidad de Google, pero más por el hecho de que queríamos probar algunos otros servicios gratuitos de OCR en línea.

Para usted: ¿Qué otras herramientas de OCR en línea recomendaría a nuestros lectores? ¿Y qué has intentado que nunca volverías a usar?

In this article