Como extrair texto de imagens e PDF

Publicado em

Serviço para converter arquivos PDF e imagens JPEG, PNG, GIF, BMP e TIFF para texto

A maioria do conteúdo disponível na internet está sob a forma texto, o que facilita bastante a pesquisa, leitura e obtenção de conteúdo para complementar trabalhos escolares e pesquisas de faculdade, por exemplo.

Mas muito conteúdo é encontrado também em outros formatos, principalmente em PDF. E outros, principalmente documentos e textos digitalizados, em formato de imagem, podendo ser encontrados em arquivos de imagem JPEG, PNG, GIF, BMP e TIFF.

Quando os textos nesses formatos forem ser usados apenas para leitura, não há necessidade de  ação adicional, basta ler na tela do computador ou imprimir. No entanto, quando se necessita usar parte do texto, como em citações diretas, por exemplo, é necessário reescrever, mas se o texto for grande demais pode custar bastante tempo.

Para tornar esse processo mais rápido, uma solução é usar o NewOCR. Esse serviço online utiliza a tecnologia OCR (reconhecimento ótico de caracteres) para converter PDF e imagens em texto.

Como usar o NewOCR

A utilização do site é muito simples, basta clicar no botão “Escolher arquivo”, selecionar o PDF ou imagem que terá o texto extraído e depois clicar em “Preview” para visualizar e selecionar a área de onde o texto será extraído. Depois basta clicar em no botão “OCR”. O serviço também suporta a conversão em lote de imagens zipadas. Ou seja, você pode colocar várias imagens num arquivo ZIP e enviar que todas elas serão convertidas.

Poucos segundos depois logo abaixo da visualização será disponibilizado o texto, que pode ser copiado e colado.

Compartilhe:
  • Nome: NewOCR
  • Licença: Freeware - Gratuito
  • Desenvolvedor: NewOCR.com
  • Tipo: Serviço online de edição de imagem
NewOCR

* Você será direcionado para o site do desenvolvedor ou distribuidor.