Aquí hay una lista del mejor software de OCR gratuito de código abierto para Windows. Al igual que cualquier software de OCR estándar, puede utilizar este software para extraer fácilmente texto de imágenes y archivos PDF. Una ventaja adicional de este software es que también puede descargar y modificar los códigos fuente de este software.
Este software de OCR o reconocimiento óptico de caracteres utiliza varios algoritmos de OCR diferentes (SpaceOCR, Tesseract, etc.) para reconocer y extraer texto de imágenes y archivos PDF. Algunos de estos programas también le dan la libertad de seleccionar un algoritmo de OCR de su elección. Algunos de estos programas también pueden realizar un OCR por lotes que le permite extraer texto de múltiples archivos PDF e imágenes a la vez. La mayoría de estos programas también son capaces de reconocer y extraer texto de diferentes idiomas de una imagen o archivo PDF. Algunos de los idiomas admitidos por este software son inglés, francés, español, vietnamita, chino, etc.
Después de extraer el texto, este software muestra inmediatamente el texto en sus interfaces que puede copiar o guardar en formato de archivo TXT. Las opciones para editar el texto extraído están disponibles en algunos programas. Además de esto, algunos software OCR de código abierto ofrecen herramientas de edición y manipulación de imágenes como brillo, contraste, escala de grises, rotar, voltear, etc. Además, también puede encontrar algunas herramientas adicionales en este software OCR como Escáner de documentos, impresión, traducción, texto a voz, etc. Revise la lista para obtener más información sobre este software.
Mi software OCR de código abierto favorito para Windows:
a9t9 Free Ocr for Windows Desktop es mi software favorito porque puede reconocer y extraer textos de diferentes idiomas de imágenes y documentos PDF. También le permite extraer texto de múltiples imágenes y archivos PDF a la vez. Además, es uno de los programas más simples de usar y, sin embargo, proporciona tLos resultados más precisos.
a9t9 Free Ocr para escritorio de Windows
a9t9 Free Ocr for Windows Desktop es un software OCR gratuito de código abierto para Windows. A través de este software, puede extraer fácilmente texto de documentos PDF e imágenes (PNG, JPEG, BMP, etc.). Lo bueno de este software es que puede reconocer texto en tres idiomas diferentes, a saber, inglés, español y holandés. Además, puede extraer texto de varias imágenes y archivos PDF a la vez.
Cómo extraer texto de un PDF o una imagen con este software OCR de código abierto:
- Inicie este software y presione el botón Abrir imágenes para agregar imágenes o presione el botón Abrir PDF para cargar archivos PDF.
- Después de eso, presione el botón Procesar todas las páginas en caso de múltiples imágenes yd archivos PDF.
- Ahora, seleccione uno de los tres idiomas disponibles en el menú Idioma Ocr y presione el botón Iniciar Ocr para iniciar el proceso de extracción de texto.
Después de extraer el texto, este software muestra los datos extraídos en el panel del lado derecho. Puede guardar el texto extraído en formato TXT o DOCX usando los botones Guardar como texto o Guardar como Word, respectivamente .
Pensamientos finales:
Es uno de los software de OCR de código abierto más simple y preciso a través del cual puede extraer fácilmente texto de múltiples imágenes y archivos PDF simultáneamente.
Página de inicio DownloPágina del anuncio
gImageReader
gImageReader es otro software OCR gratuito de código abierto para Windows, Fedora, Debian, Ubuntu, OpenSUSE y ArchLinux. Con este software, puede extraer fácilmente texto de documentos PDF e imágenes de diferentes formatos como BMP, JPEG, TIF, PNG, ICO, PPM, y más. Este software puede identificar fácilmente texto en inglés y números con facilidad. También puede reconocer textos de diferentes idiomas (hindi, afrikaans, dansk, francais, etc.), pero primero debe habilitar todos los idiomas que desea que reconozca este software yendo a su Administrar idiomas. Después de reconocer el text, este software lo muestra en el panel de salida desde donde puede guardar el texto extraído en un archivo TXT o copiar directamente el texto en el portapapeles.
Cómo extraer texto de un PDF o una imagen con este software OCR de código abierto:
- Inicie este software y presione el botón Fuentes para cargar un PDF o una imagen en este software. La imagen/PDF cargado aparecerá en su interfaz.
- Ahora, use su mouse para seleccionar el área del documento PDF o la imagen que desea escanear y presione el botón Reconocer selección para iniciar el proceso de OCR.
- Después de completar el proceso de OCR, puede ver el texto de salida en el panel Salida. Para guardar el texto reconocido en un archivo TXT, presione el botón Guardar.
Características adicionales:
- Controles de imagen: usándolo, puede ajustar manualmente el brillo, contraste, y resolución de la imagen de entrada. Además, también proporciona una opción para invertir los colores de la imagen de entrada.
- Detectar automáticamente el diseño: esta función puede detectar automáticamente el diseño del texto de entrada para que no tengas que seleccionar manualmente el área donde está presente el texto.
Pensamientos finales:
Es un software de OCR de código abierto decente a través del cual puede extraer fácilmente texto de imágenes y documentos PDF.
Página de inicio Página de descarga
VietOCR
VietOCR es otro software OCR gratuito de código abierto para Windows, BSD, MAC y Linux. Este software le permite extraer información de texto de imágenes y archivos PDF. En él, también obtiene una característica incorporada de OCR masivo a través de la cual puede extraer texto de múltiples imágenes y archivos PDF a la vez. El texto de los idiomas inglés y vietnamita se puede extraer fácilmente con este software OCR de código abierto. Si no obtiene resultados precisos, también puede seleccionar manualmente otro motor OCR de los tres disponibles, a saber, motor heredado, motor LSTM y heredado y LSTM motores.
Cómo extraer texto de un PDF o una imagen usando VietOCR:
- Inicie este software y presione el botón Abrirpara cargar un archivo PDF o imagen. Utilice la opción Bulk OCR si desea extraer texto de varios archivos PDF e imágenes a la vez.
- Después de eso, seleccione el idioma inglés o vietnamita según el texto presente en el archivo de entrada usando el menú Idioma OCR.
- Por último, presione el botón Realizar OCR para extraer texto de los archivos de entrada. Puede ver el texto extraído sobre el área de texto.
- Puede guardar el texto extraído en formato TXT mediante la opción Guardar.
Características adicionales:
- Herramientas de área de texto: en el área de texto de este software, puede encontrar muchas herramientas de edición de texto como buscar y reemplazar, revisión ortográfica , eliminar los interruptores de línea, etc.
- Herramientas de imagen: puede usar herramientas de imagen (recortar, recortar automáticamente, filtros, etc.) para realizar cambios en las imágenes de entrada antes de comenzar.ng el proceso OCR.
- Escanear documento: puede usar esta función para escanear copias impresas de documentos. Sin embargo, debe tener una escáner de documentos para usar esta función.
Pensamientos finales:
Es un software de OCR de código abierto realmente bueno a través del cual puede extraer fácilmente texto de documentos e imágenes imprimibles.
Página de inicio Página de descarga
Texto GT
GT Text es el próximo software OCR gratuito de código abierto para Windows. Este software es capaz de extraer datos de texto de imágenes de varios formatos como JPEG, BMP, JFIF, GIF, TIFF, PNG, etc. Además de esto, también te permite capturar cualquier parte de la pantalla y extraer texto de él. Después de extraer el texto, puede copiar los datos de texto extraídos al portapapeles. Lo bueno de este software es que puede reconocer texto en varios idiomas además del inglés. Si este software no puede reconocer ningún idioma en particular, puede usar su opción Agregar idiomas para descargar e instalar un paquete de idioma para este software.
Cómo extraer texto de una imagen usando GT Text:
- Inicie este software y use la opción Abrir para cargar una imagen o use la opción Capturar imagen de pantalla para capturar una parte de la pantalla.
- Después de eso, haga clic en la opción Imagen OCR para iniciar el proceso OCRes.
- Una vez que se completa el proceso de OCR, puede ver una ventana emergente que contiene el texto reconocido. Al presionar el botón Continuar desde esta ventana emergente, puede copiar el texto extraído a su portapapeles.
Características adicionales:
- Guardar imagen: al usarlo, puede guardar la imagen de captura de pantalla capturada en formatos de imagen PNG, BMP, JPEG, etc.
- Imprimir: le permite imprimir o guardar directamente la imagen capturada como un documento PDF.
Pensamientos finales:
Es un software OCR de código abierto simple y directo que hace que la tarea de extracción de texto de una imagen sea realmente fácil.
Página de inicio Página de descarga
Capturar2Texto
Capture2Text es otro software OCR gratuito de código abierto para Windows. Este software de código abierto le permite capturar una parte de la pantalla y luego le permite extraer texto utilizando algoritmos de OCR. Para activar este software, solo necesita usar las teclas de acceso rápido Win + Q.
Este software puede reconocer textos en siete idiomas diferentes, a saber, inglés, francés, alemán, japonés, coreano, ruso y español. Después de reconocer el texto, abre una ventana emergente que muestra el texto reconocido.
Cómo extraer texto usando este software OCR de código abierto:
- Presiona Ganar+Q tecla de acceso rápido para activar este software y luego seleccione un área de su pantalla que contenga algún texto.
- Después de seleccionar un área, presione el clic izquierdo para iniciar el proceso de OCR.
- Una vez que se completa el proceso de OCR, puede ver una ventana emergente que contiene el texto reconocido que puede copiar fácilmente.
Características adicionales:
- Voz: es una función de texto a voz que puede leer el texto extraído por este software.
- Traducir: Le permite traducir un fragmento de texto de un idioma a otro idioma. Para traducir el texto, utiliza el servicio Google Translate.
- Teclas de acceso rápido: al usarlo, puede cambiar las teclas de acceso rápido de este software.
Pensamientos finales:
Es otro software de OCR de código abierto fácil de usar que cualquiera puede usar sin muchas molestias.
Página de inicio Página de descarga
Recortes-Ocr
Snipping-Ocr es otro software OCR gratuito de código abierto para Windows. Es otro software OCR fácil de usar a través del cual puede seleccionar una parte de su pantalla y extraer toda la información de texto presente en ella. Para extraer texto, este software utiliza los algoritmos SpaceOCR y Tesseract. Según sus requisitos, puede elegir cualquiera de los dos algoritmos de OCR disponibles. Este software es capaz de reconocer y extraer texto de los idiomas español e inglés.
Cómoextraer texto usando Snipping-Ocr:
- Inicie este software y presione las teclas Ctrl+Shift+C para activar la función de captura de pantalla de este software.
- Después de eso, seleccione una región de su pantalla con la ayuda de su mouse y luego suelte el botón izquierdo del mouse para iniciar el proceso de OCR.
- Cuando finaliza el proceso de OCR, puede ver el texto reconocido en una ventana emergente que puede copiar.
Pensamientos finales:
Es otro software OCR simple de código abierto a través del cual puede extraer rápidamente texto de una imagen o contenido web presente en su pantalla.
Página de inicio Página de descarga
GOCR
GOCR es el próximo software OCR gratuito de código abierto para Windows y Linux. Es un software basado en línea de comandos que no viene con una interfaz gráfica de usuario. Necesita usar comandos específicos para extraer texto usando este software.
Es capaz de extraer texto de imágenes de varios formatos como PNG, PNM, PPX, PBM, etc. Sin embargo, durante mi prueba de este software, solo podía extraer texto de
Cómo extraer texto de una imagen usando comandos:
- Primero, copie y pegue la imagen PNM en la carpeta principal de este software.
- Después de eso, inicie este software usando el símbolo del sistema y escriba este comando
gocr049.exe -i sample1.pnm -o output.txt. - Por último, presione el botón Intro para extraer el texto y guardarlo en un archivo TXT.
Desde el comando anterior, reemplace muestra1 con el nombre de su imagen y reemplace salida con el nombre que desea dar al archivo de salida.
Limitaciones:
- La falta de la interfaz gráfica de usuario es su principal limitación.
- Su incapacidad para extraer texto de cualquier formato de imagen que no sea el formato de imagen PNM es otra gran limitación.
Pensamientos finales:
Es otro software capaz de reconocimiento óptico de caracteres de código abierto que puede extraer texto de las imágenes.