Top 5 ferramentas gratuitas de software OCR para converter imagens em texto

Propaganda

Propaganda
Propaganda

Francamente, gostaria de saber desta maneira simples de usar o software de OCR disponível gratuitamente nos meus tempos de escola. Claro, nós não tínhamos celulares com câmera ou Digicams baratos, mas não economizaria horas copiando anotações!

Ah, a tecnologia moderna é maravilhosa; tire uma imagem digitalizada (ou tire um piscar de olhos usando uma câmera móvel / Digicam) e pronto - o software OCR extrai todas as informações da imagem em formato de texto facilmente editável.

O reconhecimento óptico de caracteres (OCR) é um sistema de conversão de arquivos de imagem impressos / manuscritos digitalizados em seu formato de texto legível por máquina. O software OCR funciona analisando um documento e comparando-o com fontes armazenadas em seu banco de dados e / ou anotando características típicas de caracteres. Algum software de OCR também o coloca em um corretor ortográfico para “adivinhar” palavras não reconhecidas. 100% de precisão é difícil de alcançar, mas a aproximação aproximada é o que a maioria dos softwares busca.

Talvez você já tenha se deparado com nosso anterior Como extrair texto de imagens (OCR) Como extrair texto de imagens (OCR) Como extrair texto de imagens (OCR) A melhor maneira de extrair texto de uma imagem é usar reconhecimento óptico de caracteres (OCR) Nós mostramos a você sete ferramentas gratuitas de OCR para o trabalho. Leia mais post e JOCR usado, uma ferramenta de software OCR livre. Ou você pode ter definido sua preferência por algumas ferramentas de OCR on-line. Então, novamente, se você pensou em maneiras de explorar o software OCR para atalhos de produtividade, deixe-nos dar mais algumas ferramentas para você jogar.

Estaremos analisando 5 softwares gratuitos de OCR e, para começar, vamos ver os dois que já foram instalados em nossos sistemas.

OCR usando o Microsoft OneNote 2007

Para as ocasionais coisas básicas de OCR, o recurso de reconhecimento óptico de caracteres do MS OneNote é uma economia de tempo. Você pode ter perdido ”¦É chamado Copy Text from Picture .

software ocr

  • Arraste uma digitalização ou uma imagem salva para o OneNote. Você também pode usar o OneNote para recortar parte da tela ou uma imagem no OneNote.
  • Clique com o botão direito na figura inserida e selecione Copiar Texto da Imagem . O texto copiado reconhecido opticamente vai para a área de transferência e agora você pode colá-lo em qualquer programa como o Word ou o Bloco de Notas.

O OneNote é a simplicidade personificada. Mas não é muito bom para caracteres manuscritos ou até mesmo fuzzy. Mas para um trabalho rápido, eu sou todo para o clipe e cole do OneNote.

OCR usando o Microsoft Office Document Imaging

Outra ferramenta pouco usada dentro da família Microsoft. Está bem aqui sob o menu - Microsoft Office - Ferramentas do Microsoft Office - Microsoft Office Document Imaging .

software ocr

Fazer o OCR usando a ferramenta de geração de imagens de documentos é um pouco limitante, pois aceita apenas os formatos TIFF (ou MDI ). Mas isso não incomoda muito, já que qualquer aplicativo gráfico pode ser usado para converter uma imagem em TIFF. Na captura de tela abaixo, usei o MS Paint para converter um JPEG em um TIFF.

software ocr

  • Abra o arquivo no Microsoft Office Document Imaging - Arquivo - Abrir .
  • Clique no ícone de olho pequeno - Reconhecer texto usando o OCR .
  • Clique no ícone do MS Word - Enviar texto para o Word .
  • Um arquivo do MS Word é aberto com o texto convertível editável.
  • Como alternativa, você também pode usar o MS Paint para selecionar uma área específica e copiá-la para a área de transferência. Abrir o MS Office Document Imaging - selecione Página - Colar a página para copiar a seleção do OCR.

Novamente, o MODI manipulou o texto impresso habilmente, mas meu texto manuscrito foi recebido com um “¶OCR executado, mas não conseguiu reconhecer o prompt de texto”. Claro, experimente com a sua própria caligrafia.

Agora vamos deixar a família Microsoft para trás e ver três ferramentas gratuitas que se chamam Software OCR ”¦

SimpleOCR

A dificuldade que eu estava tendo com reconhecimento de manuscrito usando ferramentas MS, poderia ter encontrado uma solução no SimpleOCR. Mas o software oferece reconhecimento de manuscrito apenas como um teste gratuito de 14 dias. O reconhecimento de impressão da máquina não possui restrições.

ocr livre

  • O software pode ser configurado para ler diretamente de um scanner ou adicionando uma página (formatos jpg, tiff, bmp).
  • O SimpleOCR oferece algum controle sobre a conversão por meio de seleção de texto, seleção de imagem e recursos de ignorar texto.
  • Conversão para texto leva o processo para um estágio de validação ; um usuário pode corrigir discrepâncias no texto convertido usando um corretor ortográfico embutido.
  • O arquivo convertido pode ser salvo em um formato doc ou txt.

O SimpleOCR funcionou bem com o texto normal, mas seu manuseio de layouts de várias colunas foi uma comedown. Na minha opinião, a precisão de conversão das ferramentas da Microsoft foi consideravelmente melhor do que o SimpleOCR.

O SimpleOCR (v3.1) é um download de 9 MB e é compatível com o Windows.

TopOCR

Apenas o que eu estava falando no começo! O TopOCR, em uma inovação do software típico de OCR, é projetado mais para câmeras digitais (pelo menos 3 MP) e telefones celulares junto com scanners. Como o SimpleOCR, ele possui uma interface de duas janelas: a janela de imagem de origem e a janela de texto .

melhor software ocr

A imagem obtida de uma câmera ou scanner na janela esquerda é convertida para o formato de texto no editor de texto à direita. O editor de texto funciona como o WordPad e pode usar o mecanismo Text to Speech da Microsoft.

  • O software suporta os formatos JPEG, TIFF, GIF e BMP.
  • Configurações de imagem como brilho, cor, contraste, ausência de nitidez, nitidez, etc. podem ser usadas para melhorar a legibilidade da imagem.
  • As configurações do filtro da câmera também podem ser configuradas para melhorar a imagem.
  • O arquivo convertido pode ser salvo em uma variedade de formatos - PDF, RTF, HTML e TXT .
  • O TopOCR funciona bem com texto orientado diretamente, mas a falha usual do OCR com texto em colunas permanece.
  • O software, porém, analisa bem uma página mista (texto mais gráficos) e processa apenas o texto.
  • O software funciona com 11 idiomas.

Para obter melhores resultados com sua câmera, leia Como obter os melhores resultados com a página TopOCR.

TopOCR (v3.1) é um download de 8MB e é compatível com o Windows (não testado no Vista).

FreeOCR

Este software livre de OCR usa o mecanismo OCR da Tesseract . O código OCR da Tesseract foi desenvolvido no HP Labs entre 1985 e 1995 e atualmente está no Google. É considerado um dos mecanismos OCR de código aberto mais precisos disponíveis.

O FreeOCR é uma interface simples do Windows para esse código subjacente.

software ocr

  • Ele suporta a maioria dos arquivos de imagem e arquivos TIFF de várias páginas.
  • Ele pode lidar com formatos PDF e também é compatível com dispositivos TWAIN, como scanners.
  • O FreeOCR também possui a familiar interface de janela dupla com configurações fáceis de entender.
  • Antes de iniciar o processo de conversão de um clique, você pode ajustar o contraste da imagem para melhor legibilidade.

O FreeOCR (v.2.03) requer o framework Microsoft Net 2.0. O software compatível com o Windows XP / Vista 4.38MB também pode ser baixado neste site alternativo.

As ferramentas gratuitas de OCR vêm com suas próprias limitações. E a digitalização de uma página tem a ver com resoluções, contrastes e clareza de fontes. Do ponto de vista de um usuário comum, a precisão de 100% do OCR continua sendo um sonho Como funciona o Image-to-Text (também conhecido como reconhecimento óptico de caracteres) Como o Image-to-Text Works (também conhecido como Reconhecimento Óptico de Caracteres) Nunca foi tão fácil extrair texto é hoje graças à tecnologia de reconhecimento óptico de caracteres (OCR). Mas o que é o OCR? E como funciona o OCR? Consulte Mais informação .

Embora as ferramentas gratuitas fossem adequadas com texto impresso, elas falharam com o texto manuscrito cursivo normal. Minha preferência pessoal pelo uso incorreto de OCR se inclina para os dois produtos da Microsoft que mencionei no começo.

Você mesmo diz assuntos. Qual é a sua ferramenta de escolha? O software gratuito de OCR reconhece o que você faz nele? E mais importante, você reconhece o que eles jogam de volta em você? Nos informe!

Observe que, se você está procurando resultados profissionais, é necessário experimentar o software OCR gratuito Software OCR gratuito versus software pago: Microsoft OneNote e Nuance OmniPage Software de comparação livre versus OCR pago: Microsoft OneNote e Nuance OmniPage O software de scanner OCR comparado permite converter texto em imagens ou PDFs em documentos de texto editáveis. Uma ferramenta gratuita de OCR como o OneNote é boa o suficiente? Vamos descobrir! Leia mais, como o Nuance OmniPage.

Crédito de imagem: kalleboo

In this article