Lingua longa

Ir al contenido | Ir al menú | Ir a Buscar

lunes 27 Julio 2015

Correctores automáticos y textos producidos por OCR: una relación que no funciona

Llevo unos meses dedicándome a corregir textos producidos por un OCR. Para ahorrar tiempo y esfuerzo intento hacerlo lo más automáticamente posible, y tengo alguna que otra regla que funciona bien. Pero hay problemas que, por muy recurrentes que sean, no puedo solucionar así como así.

Por poner un ejemplo, muchas veces el OCR interpreta la secuencia cl como d (¡o al revés!). Trabajo con LibreOffice y ocasionalmente Word y sin duda la función de Ortografía me es muy útil; pero ojalá hubiera una forma de "decirle" que las secuencias d y cl son muy próximas, y que voy a necesitar cambiar una por otra a menudo.

Y es que he descubierto que el corrector automático de estos editores de texto está pensado para textos producidos por humanos. Es decir, creo que corrige errores de tecleo dando prioridad a "teclas que andan muy cerca", antes que a "caracteres o secuencias de caracteres que se parecen mucho gráficamente".

Continuar leyendo...

miércoles 11 Marzo 2015

Si el libro cambia de soporte, ¿debe cambiar el libro?

Uno de los trabajos que me piden es corregir libros editados hace ya unos años para reditarlos ahora como libros electrónicos. Por tanto, aparte de las consideraciones normales a la hora de corregir cualquier texto, debo añadir la de fijarme con mucho cuidado en ciertas expresiones que tienen sentido en un libro tradicional pero no en uno electrónico. Mi tarea es, en algunos casos, corregirlas y, en otros, únicamente señalarlas al editor para que decida la mejor manera de enmendar el problema.

¿De qué expresiones estamos hablando?

Empezando con lo más obvio, por un lado están las remisiones a otras partes del libro, concretamente a páginas, como «véase la página 59» o «como comentaré en siguientes páginas...». El libro electrónico ya no se divide en páginas sino en secciones, con lo que me refiero tanto los capítulos como a la portada, la página de créditos, etc. Por tanto, en este caso el problema tiene normalmente fácil solución: sustituir la referencia a la página por una referencia a la sección entera. También se puede jugar con la ventaja de que los lectores electrónicos suelen incorporar un buscador de texto. Por supuesto, conviene que las ilustraciones, tablas, figuras y demás vayan numeradas para poder hacer una referencia más exacta a ellas. En todo caso, lo mejor es agregar un hiperenlace al tramo concreto al que se quiera hacer referencia, que para eso estamos editando un ebook.

Continuar leyendo...

jueves 20 Noviembre 2014

Lenguando a la riojana: lengua entre amigos

Este fin de semana se han celebrado en Logroño las jornadas de Lenguando a la Riojana, una serie de talleres y charlas impartidas por y para amantes de la lengua en general y profesionales de ella en particular: periodistas, traductores, correctores, intérpretes, profesores, comunicadores, escritores, etc. También tienen cabida los menores de un año con al menos un progenitor que cumpla estas características.

El ambiente en la calle LaurelLos lenguantes que ya estábamos en Logroño el viernes salimos a cenar de bar en bar en la famosa calle Laurel, con guía asignada y todo, ya que éramos ciento y la madre. De manera que el primer contacto se dio en un ambiente distendido, entre riquísimas tapas y vino de la Rioja. Todo un acierto para irnos conociendo cómodamente. Por mi parte, pude asistir al encuentro gracias a Reverso Context, que convocó un concurso de microrrelatos que gané. También tengo que agradecer a Molino de ideas ya no solo la organización del congreso, sino también que me acogieran en su viaje a Logroño, un gesto de amabilidad y confianza que no pienso olvidar.

Continuar leyendo...

lunes 3 Noviembre 2014

Este señor

En latín, el pronombre y adjetivo iste, -a, -ud era demostrativo, igual que este, -a, -o en español. Los demostrativos se utilizan para situar a una persona o cosa en el espacio y en el tiempo, según esta se encuentre más cerca o más lejos del hablante. Iste tenía también un componente deíctico, es decir, el hablante lo usaba a la vez que señalaba al referente. O eso nos decían los profesores en la universidad, que siempre se guardaban de que en nuestras traducciones reflejásemos de alguna manera ese dedo acusador.

Acusador, sí, porque en los discursos forenses no podemos olvidar que se estaba intentando descalificar al contrario (o ensalzar al defendido). Así, en otros tipos de textos, iste adquirió un claro carácter peyorativo, que el este español no ha heredado. Pero para hacerse una idea del efecto basta imaginar ejemplos con otros demostrativos, como ese (que se puede reforzar con tal): No me fío yo de esaEse (tal) Pedro vino esta mañanaNo me hables del Pablo ese, que me cabreo.

Continuar leyendo...

lunes 6 Octubre 2014

I Wiki Editatón Madrid

El pasado sábado 27 de septiembre participé en la I Wiki Editatón celebrada en Madrid, un evento organizado por Wikimedia España y patrocinado por la Biblioteca Nacional de España (BNE), el Instituto Cervantes y la Real Academia Española (RAE).

Supe de él a través de Twitter, probablemente por un tuit del Instituto Cervantes, e inmediatamente me llamó la atención que tres instituciones tan tradicionales se hubieran aliado con la Wikipedia en un acto así. Por curiosidad y porque siempre me ha gustado editar Wikipedia cuando he podido, me apunté sin dudarlo. Aunque lo primero que uno se pregunta es: ¿qué es una editatón? Pues yo no conocía el concepto pero es muy sencillo: una maratón de editar Wikipedia, que se propone para mejorar las páginas dedicadas a un determinado tema en un determinado idioma; en este caso, para completar las páginas sobre la lengua y la literatura españolas, pasando por las de las correspondientes instituciones colaboradoras. Los únicos requisitos para participar eran haberse hecho una cuenta de usuario previamente al encuentro y llevar un portátil el día acordado.

Continuar leyendo...

martes 30 Septiembre 2014

XIV Jornada de la AETER: «Normalización y otros nuevos escenarios para la terminología»

El pasado viernes 26 de septiembre asistí a la XIV Jornada de la Asociación Española de Terminología (AETER), que contaba con un interesante programa de conferencias y que se celebró en la Facultad de Filología de la Universidad Complutense de Madrid (UCM). En un principio iba a celebrarse en la Sala de Juntas pero finalmente se optó por el Paraninfo de la facultad por el gran número de inscripciones.

He intentado resumir todo lo que pude oír y me han salido más de tres mil palabras de artículo, así que imaginaos lo mucho que aprendí.

Continuar leyendo...

miércoles 24 Septiembre 2014

¡Hola, mundo!

¿Qué decir en una primera entrada de blog? Aunque para eso habrá una pestaña específica, lo más lógico es explicar de qué va a ir, qué pretende, por qué surge, qué significa y ese tipo de cuestiones. Además, con un poco de suerte podré reutilizar lo que escriba ahora para esa pestaña y solo algún lector despistado llegará a leer esta entrada.

¿De qué va Lingua longa y qué pretendo con él?

Me propongo hablar de lingüística en todos sus aspectos: sintaxis, morfología, fonética, terminología, pragmática, etimología, idiomas, traducción, sistemas de escritura, etc. Me llaman la atención los fenómenos lingüísticos de cualquier tipo y a veces obtengo reflexiones que merece la pena compartir. Soy consciente de que existen ya muchos blogs dedicados a la traducción, a la lengua española, a aprender idiomas... Pero me he dado cuenta de que lo que puedo aportar yo es una profundización en fenómenos muy concretos. Hay miles y algunos son muy interesantes, así que me hace mucha ilusión la idea de plasmar en la red todo lo que comento en mi vida «analógica».

También tendrán cabida otras cuestiones, por supuesto, como consejos, noticias, recursos o eventos.

¿Por qué se llama Lingua longa?

Es una paráfrasis del dicho latino Ars longa, uita breuis ('la técnica es larga de aprender y la vida es corta', que quiere decir que en la vida no da tiempo a saber hacer de todo). Así, lo que yo quiero reflejar es que siempre hay algo que aprender sobre la lingua ('lengua'), porque llevamos ya miles de años utilizándola y por la gran cantidad de disciplinas que la estudian y que hacen nuevos hallazgos cada día.