Lingua longa

Ir al contenido | Ir al menú | Ir a Buscar

lunes 27 Julio 2015

Correctores automáticos y textos producidos por OCR: una relación que no funciona

Llevo unos meses dedicándome a corregir textos producidos por un OCR. Para ahorrar tiempo y esfuerzo intento hacerlo lo más automáticamente posible, y tengo alguna que otra regla que funciona bien. Pero hay problemas que, por muy recurrentes que sean, no puedo solucionar así como así.

Por poner un ejemplo, muchas veces el OCR interpreta la secuencia cl como d (¡o al revés!). Trabajo con LibreOffice y ocasionalmente Word y sin duda la función de Ortografía me es muy útil; pero ojalá hubiera una forma de "decirle" que las secuencias d y cl son muy próximas, y que voy a necesitar cambiar una por otra a menudo.

Y es que he descubierto que el corrector automático de estos editores de texto está pensado para textos producidos por humanos. Es decir, creo que corrige errores de tecleo dando prioridad a "teclas que andan muy cerca", antes que a "caracteres o secuencias de caracteres que se parecen mucho gráficamente".

Continuar leyendo...

miércoles 11 Marzo 2015

Si el libro cambia de soporte, ¿debe cambiar el libro?

Uno de los trabajos que me piden es corregir libros editados hace ya unos años para reditarlos ahora como libros electrónicos. Por tanto, aparte de las consideraciones normales a la hora de corregir cualquier texto, debo añadir la de fijarme con mucho cuidado en ciertas expresiones que tienen sentido en un libro tradicional pero no en uno electrónico. Mi tarea es, en algunos casos, corregirlas y, en otros, únicamente señalarlas al editor para que decida la mejor manera de enmendar el problema.

¿De qué expresiones estamos hablando?

Empezando con lo más obvio, por un lado están las remisiones a otras partes del libro, concretamente a páginas, como «véase la página 59» o «como comentaré en siguientes páginas...». El libro electrónico ya no se divide en páginas sino en secciones, con lo que me refiero tanto los capítulos como a la portada, la página de créditos, etc. Por tanto, en este caso el problema tiene normalmente fácil solución: sustituir la referencia a la página por una referencia a la sección entera. También se puede jugar con la ventaja de que los lectores electrónicos suelen incorporar un buscador de texto. Por supuesto, conviene que las ilustraciones, tablas, figuras y demás vayan numeradas para poder hacer una referencia más exacta a ellas. En todo caso, lo mejor es agregar un hiperenlace al tramo concreto al que se quiera hacer referencia, que para eso estamos editando un ebook.

Continuar leyendo...

jueves 20 Noviembre 2014

Lenguando a la riojana: lengua entre amigos

Este fin de semana se han celebrado en Logroño las jornadas de Lenguando a la Riojana, una serie de talleres y charlas impartidas por y para amantes de la lengua en general y profesionales de ella en particular: periodistas, traductores, correctores, intérpretes, profesores, comunicadores, escritores, etc. También tienen cabida los menores de un año con al menos un progenitor que cumpla estas características.

El ambiente en la calle LaurelLos lenguantes que ya estábamos en Logroño el viernes salimos a cenar de bar en bar en la famosa calle Laurel, con guía asignada y todo, ya que éramos ciento y la madre. De manera que el primer contacto se dio en un ambiente distendido, entre riquísimas tapas y vino de la Rioja. Todo un acierto para irnos conociendo cómodamente. Por mi parte, pude asistir al encuentro gracias a Reverso Context, que convocó un concurso de microrrelatos que gané. También tengo que agradecer a Molino de ideas ya no solo la organización del congreso, sino también que me acogieran en su viaje a Logroño, un gesto de amabilidad y confianza que no pienso olvidar.

Continuar leyendo...