He recopilado "errores" o, mejor dicho, características que no me sirven a la hora de corregir textos producidos por OCR. Por ejemplo, tiene muy en cuenta el número de letras que contiene una palabra para hacer las sugerencias de corrección.

Sin embargo, no ordena las sugerencias por frecuencia de uso de cada palabra en el discurso normal de un hablante.

Y en realidad no es que se le dé mal separar palabras... pero no le pidas que te separe más de dos.

Y finalmente, tiene un respeto desmesurado a los guiones.


En fin, más que criticar a los correctores automáticos de los editores de texto así porque sí, lo que pretendo es, de alguna manera, dar ideas para construir un corrector automático de textos producidos por OCR. Obviamente habría que hacer muchos más ajustes, pero es un hilo del que se puede tirar.