|
Стандартная техника для индексирования документов - это сканировать их и преобразовывать в машинно-читаемую форму (ASCII), используя OCR и затем индексируя их, используя средство восстановления текстов. Однако OCR не очень хорошо работает при почерке. Здесь есть альтернативная схема, обеспечивающая индексирование таких текстов. В статье рассмативается техника распознавания текстов. |