CAPTURA DE DADOS

OCR/ICR

As tecnologias de OCR e ICR estão no mercado há vários anos, com o objectivo de transformar textos contidos em imagens em dados reconhecíveis pelos computadores, susceptíveis por exemplo de ser trabalhados por um processador de texto ou  carregados numa Base de Dados.

Utilizadas em setores tão diferentes como o dos arquivos e centros de documentação procurando disponibilizar o conteúdo de documentos para pesquisa, e as Empresas procurando substituir a entrada manual de dados.

 

Ambas as tecnologias servem para de forma automática extrair informação textual da imagem de um documento. Por vezes associa-se OCR (Optical Character Recognition) à leitura de caracteres impressos e ICR (Inteligent Character Recognition) à leitura de manuscrito; o que não sendo mentira não é totalmente correto porque a tecnologia de ICR também é usada com impressos em situações que o funcionamento do OCR se revela insuficiente.

Consideremos então que o que caracteriza o OCR é ser “burro”, baseado em regras rígidas, fazendo o reconhecimento de caracteres na base de comparação com matrizes de pontos ou análise de características (tem uma volta fechada? Tem uma cavidade à direita?….) enquanto que o ICR é “esperto”, aprende com a prática e classifica os caracteres com base no reconhecimento de padrões, o que o torna apto a entender as variações do manuscrito.