Question 1

¿Qué es OCR?

Accepted Answer

OCR (Optical Character Recognition, reconocimiento óptico de caracteres) es una tecnología que lee texto desde imágenes. Analiza las formas de los caracteres en una imagen escaneada y los convierte en texto legible por máquina que puede buscarse, seleccionarse y copiarse.

Question 2

¿El OCR cambiará la apariencia de mi PDF?

Accepted Answer

No. El OCR añade una capa de texto invisible detrás de las imágenes originales. La apariencia visual de su PDF permanece completamente sin cambios. La capa de texto solo se usa para búsqueda, selección y copia.

Question 3

¿Qué tan preciso es el OCR?

Accepted Answer

En documentos limpios y bien escaneados a 300 DPI, el OCR moderno logra una precisión del 95 al 99 %. La precisión disminuye con mala calidad de escaneo, fuentes inusuales, escritura manuscrita o texto muy pequeño. UnblockPDF soporta más de 100 idiomas.

Question 4

¿Puedo ejecutar OCR en un PDF que ya tiene algunas páginas buscables?

Accepted Answer

Sí. Nuestra herramienta OCR detecta qué páginas ya tienen una capa de texto y solo procesa las páginas de solo imagen, dejando intacto el texto buscable existente.

Question 5

¿El OCR funciona con texto manuscrito?

Accepted Answer

El OCR funciona mejor con texto impreso. El reconocimiento de escritura manuscrita (ICR) es menos preciso y funciona principalmente con escritura de bloque clara y ordenada. La escritura cursiva es particularmente difícil para el reconocimiento automatizado.

Question 6

Por que no puedo buscar texto en un PDF que parece tener texto normal?

Accepted Answer

Puede deberse a varias causas. El PDF puede ser una imagen de alta calidad que parece texto real pero es solo una fotografia de la pagina. Las fuentes del PDF pueden no tener la tabla de mapeo Unicode correcta, lo que impide al lector identificar los caracteres para la busqueda. El texto puede estar renderizado como trazados vectoriales en lugar de caracteres de texto. En todos estos casos, aplicar OCR anadira una capa de texto buscable al documento.

Question 7

El OCR funciona con documentos en cualquier idioma?

Accepted Answer

Los motores OCR modernos soportan la mayoria de los idiomas con escritura latina, cirilica, griega, arabe, hebrea y los principales idiomas asiaticos como chino, japones y coreano. La precision varia segun el idioma: los idiomas con alfabetos latinos mas comunes obtienen los mejores resultados. Los idiomas con caracteres complejos o escrituras conectadas como el arabe pueden tener menor precision. UnblockPDF soporta multiples idiomas y permite seleccionar el idioma del documento para optimizar los resultados.

PDF no buscable — Cómo añadir una capa de texto

Causas comunes

Cómo solucionarlo

Subir a la herramienta OCR de UnblockPDF

Seleccionar el idioma del documento

Procesar y verificar

Verificar la búsqueda

Copiar y extraer texto

Consejos de prevención

Convertir un PDF no buscable en un documento con texto reconocido

Optimizar el OCR para obtener los mejores resultados de busqueda

Páginas relacionadas

Preguntas frecuentes sobre PDF no buscable — Cómo añadir una capa de texto

Herramientas relacionadas