¿Cómo convertir a texto una imagen escaneada?
Es posible que en alguna ocasión hayamos necesitado convertir documentos escaneados desde una imagen hacia un documento de texto, pero por desconocimiento o falta de herramientas, no lo hayamos conseguido. Normalmente esto puede conseguirse con software de escritorio (programas que se instalan en nuestros ordenadores), pero hoy en día y con la moda de trabajar en la nube, prácticamente cualquier aplicación de software tiene su versión web. En esta ocasión hablamos de NewOcr.com.
NewOcr es una web para generar ficheros de texto a partir de su versión en imagen. Es una manera muy sencilla y cómoda de transcribir nuestros documentos escaneados hacia un fichero de texto, para que posteriormente se pueda modificar en formato .txt (archivo de texto) o en .doc (Microsoft Word).
- La web ofrece reconocimiento y transcripción hasta en 75 idiomas diferentes.
- No tiene límites de ficheros.
- No es necesario registrarse para convertir los ficheros.
- Todos los documentos que se envían son eliminados del servidor una vez completada la tarea (no se almacenan en ningún sitio).
- Reconocimiento de ecuaciones matemáticas.
- Análisis de diseño de página (reconocimiento de texto multi-columna)
- Selección del área a escanear.
- Rotación de página: en sentido horario/antihorario, 90º y 180º.
- Descargar como fichero.
- Editar en Google Docs.
- Traducción usando Google Translate o Bing Translator.
- Publicar online en Pastie.com o Pastebin.com
- Copiar al porta-papeles.
- Soporta páginas fotografiadas y escaneadas a baja calidad.
- Soporta imágenes a baja resolución.
- Formatos de ficheros que acepta: jpeg, jfif, png, gif, bmp, pbm, pgm, ppm, pcx.
- Ficheros comprmidos: compresión unix, bzip2, bzip, gzip.
- Documentos multi páginas: tiff, pdf, djvu
- Documentos docx y odt con imágenes.
- Múltiples imágenes en fichero zip.
- Formatos de salida en texto plano (txt), MicroSoft Word (doc) y Adobe Acrobat (PDF)
- Tenemos que acceder con nuestro navegador favorito a www.NewOcr.com
-
Luego, en la pantalla principal podemos seleccionar el fichero de la imagen que queremos convertir a texto que se encuentra localizada en nuestro ordenador personal, o bien, podemos seleccionar el fichero de imagen desde una URL o dirección de internet. En nuestro ejemplo, vamos a localizar una imagen que tenemos en nuestro ordenador:
-
Una vez hemos indicado uno de los dos métodos para establecer el fichero de imagen inicial, pulsamos el botón "Preview"
y esperamos unos instantes... -
Ahora nos saldrá las opciones con las que queremos convertir el fichero de imagen a texto:
1 - Reconocimiento del idioma. En este caso, español.
2 - Rotación de imagen. Dejarla a 0º si no se quiere girar.
3 - Marcar la opción si la imagen tiene texto en columnas.
4 - Se cambiar la selección por defecto del texto que queremos convertir.
5 - Pulsar en OCR para proceder a la conversión de la imagen en fichero de texto. -
Luego mas abajo de la pantalla podrás observar que se ha convertido la imagen a texto.
-
En este punto podemos descargar el fichero de texto en formato de texto plano, documento de word, o en un fichero PDF. En nuestro ejemplo seleccionamos el fichero de Microsoft Word.
-
Luego vemos que se descarga el fichero en nuestro navegador:
-
Y que al abrirlo, observamos que se ha convertido en el fichero de texto en formato Microsoft Word totalmente editable para aplicar el formato que queramos.
Y de esta manera puedes convertir cualquier tipo de imagen sin límites de intentos.