Funciones: Archivos
Estas funciones permiten cargar una traducción, mostrarla y modificar su contenido para facilitar su revisión, por ejemplo, eliminando los caracteres correspondientes a las teclas aceleradoras.
Carga en petraREV el archivo indicado a fin de poder revisarlo. Cada vez que se carga un archivo borran todos los segmentos existentes, por lo que si se desea cargar varios archivos utilizando esta función, será necesario crear un archivo que incluya todos los segmentos necesarios o utilizar la función
Cargar lista de archivos.
Parámetros
Ruta de archivo
|
Ruta del archivo que contiene los segmentos que deben cargarse. Se admiten todos los archivos compatibles con petraREV (consulta Formatos compatibles).
|
Codificación
|
Codificación de los archivos que se van a cargar.
|
Crea un informe en el que se muestran todos los segmentos que se han cargado actualmente en petraREV. En el caso de que los segmentos que se hayan cargado procedan de varios archivos, se indicará marcando una línea con asteriscos (*****) en una columna y la ruta del archivo en cuestión en la otra columna, antes de los segmentos correspondientes a dicho archivo.
Esta función también permite marcar con un color diferente los términos presentes que figuren en un archivo de glosario, lo que permite comprobar visualmente que se ha respetado la terminología especificada para un determinado proyecto.
Parámetros
Ruta del glosario
|
Ruta del archivo que contiene el glosario. Por el momento, sólo se admiten archivos con la codificación predeterminada del sistema y con dos columnas, una con el texto de origen y otra con el texto de destino, separadas por un tabulador. Si se deja en blanco, no se marcará ningún término.
|
Ruta de exportación
|
Si se indica una ruta en el este campo, se guardará en dicha ruta un documento .fodt con la traducción.
|
Longitud mínima de los términos
|
Sólo se marcarán los términos en los que la longitud del término en el idioma de origen sea igual o mayor que la longitud indicada con este parámetro. Si se deja en 0, se marcarán todos los términos.
|
Coincidir mayúsculas y minúsculas
|
Si se marca esta casilla de verificación, solo se marcarán los términos cuando coincida exactamente el uso de mayúsculas y minúsculas.
|
Marcar repeticiones
|
Si se marca esta casilla de verificación, los segmentos que sean exactamente iguales a segmentos anteriores (repeticiones) se mostrarán atenuados.
|
Mostrar texto de origen
|
Si no se marca esta casilla de verificación, solo se mostrará el texto de destino y no se incluirá el texto de origen.
|
Dividir segmentos por texto |
Divide en varios aquellos segmentos en los que aparecen uno o varios caracteres. Resulta útil, por ejemplo, cuando la segmentación del archivo que hemos cargado incluye en un único segmento varias frases, ya que permite que otras comprobaciones (por ejemplo, la comprobación de coherencia en la traducción) sean más eficaces. Imaginemos que tenemos el segmento del ejemplo 1:
 |
Press Open. Press OK.
|
 |
Pulsa Abrir. Pulsa Aceptar.
|
Ejemplo 1. Segmento con dos frases.
|
Si resegmentamos la traducción, utilizando como caracteres de división el punto (.) tanto en el texto de origen como en el de destino, se crearán los dos segmentos que se muestran en los ejemplos 2a y 2b.
 |
Press Open.
|
 |
Pulsa Abrir.
|
Ejemplo 2a. Primer segmento como resultado de la resegmentación
|
 |
Press OK.
|
 |
Pulsa Aceptar.
|
Ejemplo 2b. Primer segmento como resultado de la resegmentación
|
Otra división habitual es la coma, para comprobar que las enumeraciones de elementos se han traducido de manera coherente.
Parámetros
Caracteres de división en el texto de origen
|
Cadena que se utilizará para dividir el texto de origen.
|
Caracteres de división en el texto de destino
|
Cadena que se utilizará para dividir el texto de destino.
|
Utilizar corrección inteligente
|
Si se activa esta casilla de verificación, cuando se detecte una discordancia entre el número de segmentos que hay que añadir dividiendo el texto de origen y el que hay que añadir dividiendo el texto de destino, se hará la agrupación necesaria a fin de que ambos números coincidan. Esta agrupación se hace teniendo en cuenta únicamente la longitud de los segmentos resultantes de la división.
|
Compara la traducción que se ha cargado con la traducción contenida en un archivo. Solo se muestran los segmentos en los que se ha realizado algún cambio. No se muestran los archivos que se hayan eliminado a la traducción o se hayan añadido a ella.
Si se elige que se muestre un resumen, también aparecerá una tabla con los resultados de la clasificación automática de los cambios. Esta clasificación incluye los siguientes tipos de cambios:
- Language
- Misspelling
- Wrong use of case
- Wrong use of punctuation
- Wrong gender agreement
- Wrong number agreement
- Sense
Para evaluar la precisión del algoritmo que clasifica los cambios, es posible utilizar una plantilla, que consiste en un archivo de solo texto que indica el texto original, el texto corregido y la clasificación que debería darse. Por ejemplo, veamos la siguiente línea:
Texto 1 → Texto 2 → Categoría A
De acuerdo con esta línea, si un segmento con el texto «Texto 1» se ha cambiado a «Texto 2» y el algoritmo lo clasifica como «Categoría A», se considerará que la clasificación es correcta. De lo contrario se considerará que es incorrecta.
Parámetros
Ruta de archivos con traducción anterior
|
Ruta del archivo que contiene la traducción con la que se comparará la que se ha abierto en petraREV.
|
Ruta de informe
|
Si se indica una ruta en este campo, se exportará un informe con todos los cambios realizados.
|
Ruta de plantilla
|
Si se indica una ruta en este campo, se utilizará como plantilla para evaluar si los cambios se han clasificado correctamente o no.
|
Resumen
|
Este cuadro combinado permite elegir que no aparezca ningún resumen o se muestre un resumen por números, lemas o palabras.
|
Ocultar cambios similares
|
Si se marca esta casilla de verificación, se ocultarán todos los cambios que se consideren similares, aunque aparezcan en segmentos que no sean totalmente idénticos.
|
Ocultar cambios solo de mayúsculas y minúsculas
|
Si se marca esta casilla de verificación, no se mostrará ningún cambio si solo consiste en un cambio en el uso de mayúsculas y minúsculas.
|
Preparar para imprimir
|
Si se marca esta casilla de verificación, se muestran los cambios en un formato específicamente diseñado para revisar los cambios en papel, es decir, se muestran todos los segmentos y se presentan en forma de tabla.
|
Carga en petraREV una lista de archivos detallados en un archivo de solo texto (.txt), en el que se ha especificado en cada línea la ruta de un archivo. Esta operación es útil, por ejemplo, cuando se desea cargar un elevado número de archivos de diversas procedencias con los que se desea trabajar en varias ocasiones.
Parámetros
Ruta del archivo donde se detallan los archivos
|
Indica la ruta del archivo donde se indican los archivos que es necesario cargar.
|
Sustituye los caracteres indicados por el carácter (o secuencia de caracteres) que se indique. Normalmente, se utiliza para eliminar determinados elementos de una traducción con objeto de facilitar otras comprobaciones. Por ejemplo, es posible eliminar todos los números (opción por defecto) o los signos de puntuación de un texto, para realizar comprobaciones de coherencia que no tengan en cuenta estos elementos.
Parámetros
Caracteres reemplazados
|
Caracteres que serán reemplazados por el texto indicado. Si se especifica más de un carácter, se reemplazarán todas las apariciones de cada uno de los caracteres. Por ejemplo, si se especifica «01», se reemplazarán todas las apariciones de «0» y de «1», no solo en las que aparezca «01».
|
Texto por el que se reemplazarán los caracteres
|
Texto que se insertará cada vez que se encuentre uno de los caracteres especificados en la siguiente opción. También se puede dejar en blanco.
|
Idioma
|
Este cuadro combinado permite elegir si se reemplazarán los caracteres en el texto de origen, en el texto de destino o en ambos.
|
Posición
|
Este cuadro combinado permite elegir si se reemplazarán los caracteres independientemente de la posición en la que aparezcan o solo cuando estén al principio del texto, solo cuando estén al final del texto o solo cuando estén al principio o al final del texto.
|
Solo cuando coincidan en origen y destino
|
Si se activa esta casilla de verificación, solo se reemplazarán los caracteres cuando los mismos caracteres aparezcan en el texto de origen y de destino en la misma posición. Por ejemplo, si se indica que se reemplace cualquier dígito, pero el texto de origen tiene una cifra al final del texto y el texto de origen la tiene al principio, no se reemplazará. Por sus características, cuando se activa esta casilla, los reemplazos se aplicarán siempre en el texto de origen y de destino.
|
Concatenar segmentos incorrectamente separados |
Algunas aplicaciones de traducción asistida no segmentan adecuadamente el texto, dividiendo una misma frase en varios segmentos. Para evitar los problemas que esta división inadecuada pueda ocasionar a otras comprobaciones, esta operación une todos aquellos segmentos en los que la primera letra de la traducción sea minúscula al segmento anterior. Por ejemplo, imagemos que esta operación encuentra los segmentos consecutivos que se muestran en los ejemplos 3a y 3b.
 |
Ubuntu includes
|
 |
Ubuntu incluye
|
Ejemplo 3a. Segmento incorrectamente dividido
|
 |
many useful applications.
|
 |
muchas aplicaciones útiles.
|
Ejemplo 3b. Segmento incorrectamente dividido
|
Al detectar que el texto de destino del ejemplo 4b comienza por mayúscula, uniría los segmentos de los ejemplos 3a y 3b en un único segmento, el que se muestra en el ejemplo 4.
 |
Ubuntu includes many useful applications.
|
 |
Ubuntu incluye muchas aplicaciones útiles.
|
Ejemplo 4. Segmento con dos frases.
|
Esta operación no se puede configurar.
Esta operación resegmenta el texto, uniendo un segmento con el siguiente (o anterior) cuando se encuentra determinado texto. Por ejemplo, imaginemos que queremos comprobar rápidamente que después de «Nota:» se ha utilizado siempre mayúsculas, pero una búsqueda sencilla no nos sirve, ya que el texto se ha segmentado por dos puntos, como vemos en los dos segmentos siguientes:
 |
Note:
|
 |
Nota:
|
Ejemplo 5a. Primer segmento de la unión
|
 |
The next release of Ubuntu will be the Precise Pangolin.
|
 |
La próxima versión de Ubuntu será el Pangolín Preciso.
|
Ejemplo 5b. Segmento segmento de la unión
|
Con esta operación podemos crear el siguiente segmento:
 |
Note: The next release of Ubuntu will be the Precise Pangolin.
|
 |
Nota: La próxima versión de Ubuntu será el Pangolín Preciso.
|
Ejemplo 6. Resultado de la concatenación de segmentos
|
Con esta segmentación ya es fácil localizar fácilmente los casos en los que no se cumple el criterio que queremos aplicar.
Parámetros
Texto en original
|
Cadena que ha de contener el texto original para que se una al segmento siguiente. Se puede dejar en blanco.
|
Texto en traducción
|
Cadena que ha de contener el texto original para que se una al segmento siguiente. Se puede dejar en blanco.
|
Concatenar con
|
Puede tomar los valores Anterior y Siguiente dependiendo de si, cuando se cumplen las condiciones, deseamos concatenar un segmento con el anterior o con el siguiente.
|
Elimina de la traducción cargada en ese momento todos los segmentos presentes en el archivo de texto indicado. Resulta útil, por ejemplo, cuando no queramos incluir en la revisión una parte de la traducción, bien porque estemos razonablemente seguros de que no contiene errores o bien porque las especificaciones del proyecto indiquen que dichos segmentos no han de modificarse.
Parámetros
Ruta de archivo
|
Ruta del archivo que contiene los segmentos que deben restarse. Es posible indicar más de un archivo y se admiten todos los tipos de archivos compatibles con petraREV.
|
Comparar solo texto de origen
|
Si se marca esta casilla, solo se tendrá en cuenta el texto de origen para borrar los segmentos. Es decir, si el texto de origen de un segmento de la traducción cargada coincide con el de uno de los segmentos de los archivos indicados, se borrará el segmento, independientemente de que el texto de destino coincida o no.
|
Invertir comprobación
|
Si se marca esta casilla de verificación, se eliminarán todos los segmentos que no estén en la traducción restada. Es decir, solo quedarán los segmentos que forman la intersección entre la traducción cargada y la traducción restada.
|
Ordena todos los segmentos por el criterio indicado, que puede consistir en ordenarlos por longitud o agrupar los segmentos que tengan el mismo texto de origen. Esta función es particularmente útil cuando deseamos utilizar la traducción para realizar búsquedas.
Parámetros
Idioma
|
Puede tomar los valores Origen y Destino en función del texto por el queramos ordenar los segmentos.
|
Orden
|
Este cuadro combinado ofrece las siguientes opciones:
- Por longitud ascendente: ordena los segmentos comenzando por los más cortos, en orden creciente de longitud.
- Por longitud descendente: funciona de la manera opuesta: sitúa al comienzo los segmentos más largos, en orden decreciente de longitud.
- Por similitud: intenta que cada segmento sea lo más parecido posible al segmento anterior, intentando minimizar el número de palabras en que se diferencian los segmentos. Esta opción es particularmente útil cuando el texto para traducir no sigue ningún orden (como ocurre, por ejemplo, en el caso de volcados de software).
- Agrupar por texto de origen: hace que los segmentos cuyo texto de origen coincide estén en orden consecutivo, lo que es particularmente útil cuando se desea aprovechar la función de buscar y comparar, que muestra las diferencias entre dos resultados de búsquedas cuando coincide el texto de origen de ambos resultados.
|
Mostrar frecuencias por longitudes
|
Si se marca esta casilla, se mostrarán una tabla y un gráfico para representar las frecuencias de las longitudes de los segmentos de la traducción.
|
Intervalo
|
Este parámetro solo se aplica si se ha marcado la casilla anterior y sirve para especificar el tamaño de los intervalos en los que se dividirán las longitudes. Por ejemplo, un intervalo de 10, dividirá las longitudes en los intervalos 0-10, 10-20, 20-30, etc., un intervalo de 50, dividirá las longitudes en los intervalos 0-50, 50-100, 150-200, etc.
|
Separar palabras concatenadas |
Muchos textos utilizan términos en los que en vez de separar las palabras con un espacio se marca el comienzo de una palabra escribiendo su inicial en mayúscula seguido de una minúscula, como podemos ver en el ejemplo 7a, donde las palabras
FileManager y
GestorArchivos se han escrito de esta manera.
 |
Opens the FileManager.
|
 |
Abre el GestorArchivos.
|
Ejemplo 7a. Segmentos con palabras concatenadas
|
Estas palabras concatenadas pueden plantear algunos problemas, por ejemplo, al aplicar el corrector ortográfico, donde se considerará la palabra completa como incorrectamente escrita en vez de comprobar cada palabra por separado. Como solución, esta operación coloca los espacios que faltan entre las palabras, lo que agiliza y mejora el proceso realizado con el corrector. Tras aplicarla, por ejemplo, los segmentos anteriores quedarían como muestra el ejemplo 7b:
 |
Opens the File Manager.
|
 |
Abre el Gestor Archivos.
|
Ejemplo 7b. Segmentos con palabras concatenadas separadas
|
Esta operación no se puede configurar.
Combina todos los archivos especificados en un único archivo.
Parámetros
Ruta de los archivos de entrada
|
Ruta de todos los archivos que se combinarán en un único archivo.
|
Ruta del archivo de salida
|
Ruta del archivo que incluirán el contenido de todos los archivos de entrada.
|
Codificación
|
Codificación que emplean los archivos de entrada y que utilizará el archivo de salida.
|
Omitir repeticiones
|
Si se marca esta casilla, se omitirán las líneas repetidas.
|
Alinear y cargar archivos |
A partir de un texto en el idioma de origen y un texto en el idioma de destino, crea y carga un archivo alineado. También indica con un porcentaje el número de segmentos para los que el algoritmo ha encontrado un texto de origen y de destino. Por ejemplo, un porcentaje del 90 % indica que para 1 de cada 10 segmentos, se dispone de texto de origen o de destino, pero no ambos.
Parámetros
Archivo con el texto de origen
|
Archivo que contiene el texto de origen.
|
Archivo con el texto de destino
|
Archivo que contiene el texto de destino.
|
Intraducibles
|
La alineación se lleva a cabo utilizando los números y los intraducibles (términos que se escriben igual en el idioma de origen y de destino, como por ejemplo Ubuntu) que aparecen en los textos. Aunque existe la posibilidad de detectar automáticamente los intraducibles, también se pueden especificar manualmente en esta cuadro.
|
Mínimo para extraer números
|
Si se indica en este cuadro un valor diferente de cero, no se considerarán como intraducibles los números inferiores a este valor. Por ejemplo, si se indica el valor 10, todos los números inferiores a este valor no se tendrán en cuenta para alinear los segmentos, lo que agilizar la alineación, en especial cuando los archivos alineados contienen largas listas de números que solo coinciden aproximadamente.
|
Obtener automáticamente intraducibles
|
Este cuadro combinado ofrece cuatro opciones para obtener automáticamente los intraducibles. Se puede elegir entre no obtener automáticamente los intraducibles, obtener todos los intraducibles, obtenerlos automáticamente pero eliminado aquellos de los que hay una importante desproporción entre el texto de origen y el texto de destino y, por último, obtenerlos automáticamente pero utilizar únicamente aquellos que aparecen tantas veces en el texto de origen como en el texto de destino.
|
Codificación
|
Codificación que emplean los archivos alineados.
|
Resegmentar
|
Si se marca esta casilla, los textos se normalizarán, lo que supone las siguientes operaciones: quitar los espacios finales, resegmentar los segmentos por punto y espacio, y unir los segmentos que empiezan por minúscula.
|
Mostrar alineación
|
Si se marca esta casilla, se mostrará la alineación, resaltando en negrita los segmentos que el algoritmo considera que coincidan.
|
Guardar alineación
|
Si se marca esta casilla, se guardará la alineación con el nombre del archivo de origen añadiéndole el sufijo «.align.txt».
|
Reemplazar elementos coincidentes |
Si encuentra un elemento de la categoría indicada que aparece simultáneamente en el texto de destino y en el texto de origen, los sustituye por el texto indicado. En el ejemplo siguiente, se han reemplazado los elementos de categoría
i por el texto
SW. Esta operación es útil en traducciones donde en ocasiones parte del texto de origen ha de aparecer también en el texto de destino (por ejemplo, opciones de software), lo que causa problemas a las otras operaciones.
 |
He has choosen Ubuntu.
|
 |
Él ha elegido Ubuntu.
|
Ejemplo 7a. Segmento antes de reemplazar los elementos coincidentes por SW
|
 |
He has choosen SW.
|
 |
Él ha elegido SW.
|
Ejemplo 7b. Segmento después de reemplazar los elementos coincidentes por SW
|
Parámetros
Categorías reemplazadas
|
Categorías morfosintáticas que se reemplazarán.
|
Texto por el que se reemplaza
|
Texto por el que se reemplazará (tanto en el texto de origen como en el de destino)
|
Exporta la traducción cargada en ese momento al archivo indicado.
Parámetros
Ruta de archivo
|
Ruta a la que se exportará la traducción.
|
Número de segmentos
|
Si es cero, se exportará toda la traducción. Si es otro valor, se exportará el número de segmentos indicado.
|
Formato
|
La traducción puede exportarse como texto delimitado por tabuladores o para TagEditor.
|
Codificación
|
Si se elige el texto delimitado por tabuladores como formato, indica la codificación que se empleará para guardar el archivo.
|
Incluir nombre archivo
|
Si se marca esta casilla de verificación, se incluirá al principio de cada línea el nombre del archivo.
|
Incluir texto de origen
|
Si se marca esta casilla de verificación, se incluirá el texto de origen al exportar la traducción.
|
Incluir texto de destino
|
Si se marca esta casilla de verificación, se incluirá el texto de destino al exportar la traducción.
|
Muestra varias tablas para resumir la distribución de repeticiones en un conjunto de archivos. La primera tabla que aparece muestra para cada archivo los datos de las siguientes columnas:
- Archivo: nombre del archivo
- Nuevo: número (y porcentaje) de segmentos del archivo que son completamente distintos (azul oscuro).
- Intra: número (y porcentaje) de segmentos del archivo que son repeticiones de otros segmentos del archivo (azul claro).
- Inter: número (y porcentaje) de segmentos del archivo que son repeticiones de segmentos de los archivos anteriores (claro).
- Total: número (y porcentaje) de segmentos que contiene el archivo.
- Resumen: representación gráfica de los porcentajes anteriores mediante una barra coloreada.
Si se ha solicitado que se muestren los detalles, a continuación aparecerá una tabla para cada archivo donde se indica la relación de las repeticiones de un archivo con todos los demás archivos con los que comparte segmentos. Para cada archivo, se indica el número de segmentos repetidos que coinciden y el número de segmentos repetidos en los que se ha empleado una traducción diferente.
Al realizar este análisis es esencial recordar que, aunque los totales globales son siempre los mismos, los datos correspondientes a cada archivo pueden variar en función del orden en que se analicen. Es decir, analizar los archivos 1, 2 y 3, no presenta para cada archivo los mismos datos que analizar los archivo 2, 3 y 1.
Parámetros
Recuento
|
Permite indicar si los porcentajes se calculan por segmentos o por palabras.
|
Mostrar detalles
|
Si se marca esta casilla de verificación, se mostrará para cada archivo una tabla detallando la relación de sus segmentos repetidos con todos los demás otros archivos.
|
Carga los términos de un archivo y los sustituye, tanto en el texto de origen como de destino de una traducción. Por ejemplo, si una línea del archivo indica
Lubuntu→Kubuntu, todas las ocurrencias de
Lubuntu se reemplazarán por
Kubuntu.
Parámetros
Ruta del archivo
|
Ruta del archivo que contiene la lista de términos que se reemplazarán.
|
Invertir reemplazo
|
Si esta casilla está desactivada, para cada línea término1→término2 el término1 se reemplazará por el término2. Si está activada, ocurrirá lo contrario, el término2 se reemplazará por el término1.
|
Elimina todos los segmentos que cumplen el criterio indicado. Esta operación se equivalente a la función para eliminar segmentos que se incluye en la
sección Reemplazar de la pantalla Buscar y reemplazar.
Parámetros
Texto
|
Texto que se utilizará para definir el criterio (en caso de que sea necesario).
|
Eliminar por...
|
Criterio que se aplicará para eliminar los segmentos. Las opciones disponibles son:
- Contiene el texto [origen]
- Contiene el texto [destino]
- No contiene el texto [origen]
- No contiene el texto [destino]
- Segmentos repetidos
- Segmentos sin traducir
- Segmentos traducidos
- Segmentos con traducción vacía
- Segmentos con traducción no vacía
- Es igual al texto [origen]
- Es igual al texto [destino]
|
Carga un texto monolingüe, que se considera a efectos del resto de las operaciones como texto de destino. Esta operación resulta útil cuando queremos aplicar cualquier función sobre un texto del que no existe o no está disponible el texto de origen. Por ejemplo, podemos realizar búsquedas clasificadas, analizar los errores de concordancia, comprobar las colocaciones, etc.
Parámetros
Ruta del archivo
|
Ruta del archivo que contiene el texto monolingüe.
|
Codificación
|
Codificación que se ha utilizado para guardar el texto.
|
Permite dividir una traducción en varios fragmentos, a fin de distribuir el trabajo o limitarlo a una parte de la traducción. Los criterios que se pueden aplicar son:
Proporcional por segmentos: divide la traducción en varios fragmentos, los cuales tienen aproximadamente el mismo número de segmentos. Por ejemplo, si dividimos una traducción de 20 segmentos en 4 partes, obtendremos 4 fragmentos con 5 segmentos cada uno.
Proporcional por palabras: divide la traducción en varios fragmentos, los cuales tienen aproximadamente el mismo número de palabras. Para ello, se calcula el total de palabras y se divide entre el número de fragmentos que deseamos. Por ejemplo, si dividimos una traducción con 2000 palabras en 4 partes, obtendremos 4 fragmentos con 500 palabras cada uno.
Por segmentos: divide la traducción en varios fragmentos, cada uno de los cuales contiene el número de segmentos indicado. Por ejemplo, si dividimos una traducción de 20 segmentos en fragmentos de 8 segmentos, obtendremos 2 fragmentos con 8 segmentos y uno más con 4 segmentos.
Por segmentos: divide la traducción en varios fragmentos, cada uno de los cuales contiene aproximadamente el número de palabras indicado. Por ejemplo, si dividimos una traducción con 2000 palabras en fragmentos de 500 palabras, obtendremos 4 fragmentos con 500 palabras cada uno.
Parámetros
Ruta de archivo
|
Ruta a la que se exportarán los fragmentos en los que se divida la traducción. Si se deja en blanco, no se exportarán los fragmentos.
|
Cantidad para dividir
|
Este parámetro tendrá un significado diferente, tal como se ha explicado en la descripción, según el criterio de división elegido.
|
Criterio de división
|
Tal como se ha comentado, se puede dividir la traducción de manera proporcional por segmentos, proporcional por palabras, por segmentos o por palabras.
|
Codificación
|
Indica la codificación que se empleará para guardar los fragmentos.
|
Eliminar etiquetas antes de minúscula |
Esta operación etiquetas las etiquetas después de la que aparece una palabra en minúsculas en el texto de destino. Por ejemplo, en el siguiente segmento aparecen dos etiquetas, una antes de una palabra en minúsculas y otra delante de un signo de puntuación:
 |
Ubuntu has been <i>installed</i>.
|
 |
Ubuntu se ha <i>instalado</i>.
|
Ejemplo 8a. Segmento antes de eliminar las etiquetas
|
Al aplicar esta operación, se eliminará la primera etiqueta, tanto en el texto de origen como en el texto de destino, con lo que el segmento quedará de la siguiente manera.
 |
Ubuntu has been installed</i>.
|
 |
Ubuntu se ha instalado</i>.
|
Ejemplo 8b. Segmento después de eliminar las etiquetas
|
Esta operación es útil para mejorar la precisión de las comprobaciones gramaticales (por ejemplo, la concordancia de género/número), así las operaciones de transformación de archivos (por ejemplo, la resegmentación) cuando el texto incluye etiquetas de diversos tipos y eliminar todas las etiquetas puede plantear problemas.
Contraer nombres y verbos con intraducibles |
En la documentación técnica con frecuencia aparecen nombres asociados a términos intraducibles, como por ejemplo pueden ser opciones de software que no deben traducirse. Por ejemplo, en el siguiente segmento aparece el nombre «botón» seguido del término intraducible «OK»:
 |
Press the OK button.
|
 |
Pulse el botón OK.
|
Ejemplo 9a. Nombre con término intraducible
|
Estos términos intraducibles pueden complicar la revisión del texto. Esta operación permite eliminarlos cambiando el texto de manera que aparezca únicamente el nombre al que acompañaban, como se ilustra en el siguiente ejemplo.
 |
Press the button.
|
 |
Pulse el botón.
|
Ejemplo 9b. Nombre con término intraducible eliminado
|
Algo muy similar ocurre con determinados verbos que en ocasiones aparecen seguidos de una opción de software sin que medie ningún nombre, como en el caso del ejemplo 10a.
 |
Click OK.
|
 |
Pulse OK.
|
Ejemplo 10a. Verbo con término intraducible
|
La única diferencia de este ejemplo respecto al anterior es que en este caso, la construcción tanto en el idioma de origen como en el de destino es
verbo + opción, mientras que en el caso de los nombres, la construcción es
opción + nombre en el texto de origen y
nombre + opción en el texto de destino. Igualmente, en este caso es posible dejar únicamente el verbo. No obstante, dado que el verbo necesita un complemento, se sustituye por que se configure.
 |
Click the option.
|
 |
Pulse la opción.
|
Ejemplo 10b. Nombre con término intraducible reemplazado por uno genérico
|
Parámetros
Ruta para exportar nombres detectados
|
Si no se deja en blanco, se exportará la lista de términos encontrados a un archivo de texto que posteriormente puede utilizarse, por ejemplo, para comprobar que la traducción de estos términos es coherente.
|
Nombres con intraducibles
|
Pares de nombres intraducibles que se buscarán. Se deben indicar las parejas nombre en el idioma de origen,nombre en el idioma de destino pudiendo separarse varias parejas con puntos y coma. Por ejemplo: button,botón;window,ventana.
|
Verbos con intraducibles
|
Pares de nombres intraducibles que se buscarán. Se deben indicar las parejas verbo en el idioma de origen,verbo en el idioma de destino pudiendo separarse varias parejas con puntos y coma. Por ejemplo: select,seleccione;click,haga clic en.
|
Texto para reemplazar intraducibles de verbos
|
Dado que las estructuras con verbos pueden parecer incompletas si se elimina el complemento, esta permite especificar una pareja texto en el idioma de origen,texto en el idioma de destino que se utilizará para complementar el verbo. Por ejemplo: this option,esta opción.
|
Aplicar modificaciones
|
Si se marca esta casilla de verificación, se aplicarán las modificaciones necesarias. De lo contrario, solo se mostrará la lista con los términos que se encuentren.
|
Eliminar etiquetas por texto |
Elimina las etiquetas que contiene un determinado texto. Resulta útil cuando se desea conservar algunas etiquetas, como por ejemplo las que indican un salto de línea o un espacio indivisible, pero se desea eliminar otras, como por ejemplo las que indican la posición de las entradas de índice. Por ejemplo, si se eliminan las entradas que incluyen el texto
indexEntry del siguiente segmento:
 |
Click<hardSpace>OK<indexEntry>.
|
 |
Pulse<hardSpace>Aceptar<indexEntry>.
|
Ejemplo 11a. Segmento con varios tipos de etiquetas
|
Este segmento se transformará en el siguiente.
 |
Click<hardSpace>OK.
|
 |
Pulse<hardSpace>Aceptar.
|
Ejemplo 11a. Segmento con varios tipos de etiquetas tras eliminar las que contienen el texto indexEntry.
|
Parámetros
Inicio de etiqueta
|
Caracter que indica el comienzo de una etiqueta.
|
Final de etiqueta
|
Caracter que indica el final de una etiqueta.
|
Texto
|
Texto que, si aparece en el interior de una etiqueta, hará que se elimine la etiqueta.
|
Cambiar mayúsculas y minúsculas |
Cambia el uso de mayúsculas y minúsculas en todo el texto (tanto texto de origen como de destino) al formato especificado. Esta operación puede ser útil para trabajar con textos escritos enteramente en mayúsculas, en las que la transformación al formato de oración los hará más legible. También es interesante como paso previo a crear una memoria de traducción adaptada a un texto para traducir que utiliza de manera diferentes las minúsculas y mayúsculas.
Parámetros
Cambiar a
|
Los formatos disponible son:
- minúsculas: solo minúsculas
- MAYÚSCULAS: solo mayúsculas
- Oración: mayúscula la primera letra del segmento y el resto en minúsculas.
- Primera En Mayúscula: mayúscula la primera letra de cada token resultante de dividir el texto por espacios y el resto en minúsculas.
|
Cargar Csv y convertir en Xliff |
Crea archivos bilingües a partir de una hoja de cálculo en formato .csv en la que unas columnas indican el texto de origen y otras indican el texto de destino.
Parámetros
Ruta de los archivos para convertir
|
Ruta de los archivos que se desea convertir.
|
Identificadores de texto de origen
|
Texto que debe aparecer en una celda la primera fila de la hoja de cálculo para que se considere que dicha columna contiene el texto de origen. Se pueden especificar varios identificadores si se separan con punto y coma.
|
Identificadores de texto de destino
|
Texto que debe aparecer en una celda la primera fila de la hoja de cálculo para que se considere que dicha columna contiene el texto de destino. Se pueden especificar varios identificadores si se separan con punto y coma.
|
Codificación
|
Codificación de la hoja de cálculo.
|
Crear archivos xlf
|
Si se activa esta casilla se crearán los archivos .xlf. De lo contrario, solo se analizarán y se mostrarán los datos detectados.
|
Incluir segmentos traducidos
|
Si no se marca esta casilla de verificación, solo se incluirán los segmentos de aquellas filas en las que la columna con el texto de destino esté vacía.
|
Generar archivos de destino de Xliff |
Genera los archivos de destino de archivos .xliff su formato original. Esta operación está específicamente diseñada para los archivos creados con la operación
Cargar Csv y convertir en Xliff.
Parámetros
Ruta de los archivos para convertir
|
Ruta de los archivos para los que se generarán los archivos de destino.
|
Codificación
|
Indica la codificación que utilizan los archivos .xliff.
|
Comparar archivos línea a línea |
Compara línea por línea dos archivos, indicando las líneas en las que se detectan diferencias. Esta operación es útil cuando es necesario introducir un pequeño número de modificaciones en archivos con un formato muy estricto y surgen dudas acerca de si se han introducido accidentalmente cambios no deseados.
Parámetros
Ruta del primer archivo
|
Ruta del primer archivo que se comparará.
|
Ruta del segundo archivo
|
Ruta del segundo archivo que se comparará.
|
Codificación
|
Indica la codificación que utilizan los archivos comparados.
|
Mostrar líneas diferentes
|
Si se marca esta casilla, se mostrarán las líneas en las que se detecten diferencias. Es útil desactivar esta casilla cuando hay un elevado número de advertencias y lo único que se desea es tener una visión general del número de líneas diferentes que hay en cada archivo.
|
Comparar varias versiones |
Compara diferentes versiones de un mismo texto que, por ejemplo, pueden corresponder a diferentes traductores y motores de traducción. El texto debe guardarse en formato de texto simple, delimitando las diferentes columnas mediante tabuladores. A continuación, se muestra un ejemplo adaptado a una comparación de las traducciones redactadas por varios posteditores:
Traducción automática | Traductor 1, edad=40, plantilla | Traductor 2, edad=30, autónomo | Traductor 3, edad=20, plantilla | Traductor 5, edad=50, autónomo |
Línea 1 de traducción automática | Línea 1 de postedición de traductor 1 | Línea 1 de postedición de traductor 2 | Línea 1 de postedición de traductor 3 | Línea 1 de postedición de traductor 4 |
Línea 2 de traducción automática | Línea 2 de postedición de traductor 1 | Línea 2 de postedición de traductor 2 | Línea 2 de postedición de traductor 3 | Línea 2 de postedición de traductor 4 |
Línea 3 de traducción automática | Línea 3 de postedición de traductor 1 | Línea 3 de postedición de traductor 2 | Línea 3 de postedición de traductor 3 | Línea 3 de postedición de traductor 4 |
Parámetros
Ruta de archivo
|
Ruta del archivo que contiene las diferentes versiones.
|
Utilizar columna como referencia
|
Si se deja este campo en blanco, se mostrarán tantas matrices de comparación como líneas de texto incluya el archivo. Si se especifica un número, las demás versiones se compararán respecto a la versión presente en dicha columna.
|
Filtrar columnas
|
Si no se deja en blanco, solo se compararán aquellas columnas que cumplan el criterio aquí indicada. Como ejemplo, si para la tabla de versiones anterior se indica plantilla solo se compararán las versiones de los traductores en los que se haya indicado la palabra clave plantilla. Para mostrar la comparación solo con las versiones de los traductores que no están en plantilla, bastará con indicar -plantilla.
|
Ordenar por criterio
|
Si no se deja un blanco, se orderán las columnas según determine el criterio indicado.
|
Usar primera fila como encabezado
|
Si se marca esta casilla de verificación, se considerará que la primera fila es el encabezado y, por tanto, no se incluirá en las comparaciones.
|
Mostrar primera columna como texto de origen
|
Si se marca esta casilla de verificación, se considerará que la primera columna es el texto de origen y, por tanto, no se incluirá en las comparaciones. Esta opción resulta útil cuando las diferentes versiones parten de un mismo texto de origen que no es necesario incluir en la comparación.
|
Resumir información sobre cambios
|
Si se marca esta casilla de verificación, se indicará en cada celda el número de palabras que se han añadido y eliminado respecto a la versión comparada.
|
Esta operación acorta las etiquetas, dejando únicamente los caracteres que hay en la etiqueta antes del espacio. Resulta útil parte de la etiqueta es útil y no se desea eliminar mediante un método más simple (como sería eliminar todas las etiquetas o reemplazarlas por una única etiqueta), pero también hay una parte innecesaria que entorpece otras operaciones o la revisión. Por ejemplo, esta operación transformaría las etiquetas del siguiente segmento:
 |
<b>Keyboard</b> and <cf style="1">mouse</cf>
|
 |
<b>Teclado</b> y <cf style="1">ratón</cf>
|
Ejemplo 12a. Segmento con etiquetas completas
|
Las etiquetas quedarían de la siguiente manera:
 |
<b>Keyboard</b> and <cf>mouse</cf>
|
 |
<b>Teclado</b> y <cf>ratón</cf>
|
Ejemplo 12b. Segmento con etiquetas contraídas
|
Parámetros
Inicio de etiquetas
|
Cadena de caracteres que señala el comienzo de una etiqueta.
|
Fin de etiquetas
|
Cadena de caracteres que señala el final de una etiqueta.
|
Reemplazar por valor de atributo
|
Si no se deja este campo en blanco, se sustituirán aquellas etiquetas que tengan un valor para el nombre de atributo aquí indicado por dicho valor. Por ejemplo, si se indica el nombre de atributo style, en el caso de la etiqueta <span style="bold"> se reemplazará este etiqueta por bold.
|
Convertir .tsv a .xls para anotación de sentimientos |
Convierte archivos .tsv con registros de conversaciones a un formato .xls diseñado para facilitar la labor de un anotador de sentimientos.
Parámetros
Carpeta con los archivos
|
Ruta de la carpeta que contiene los archivos que se van a convertir.
|
Identificadores de agente (separados con punto y coma)
|
Cadenas de texto que suelen corresponder a un agente. Por ejemplo, ¿en qué puedo ayudarle? o gracias por llamar a son frases que suele decir el agente. De esta manera, parte de las líneas aparecerán ya etiquetadas.
|
Identificadores de cliente (separados con punto y coma)
|
Cadenas de texto que suelen corresponder a un cliente. Por ejemplo, llamaba para o quiero cancelar son frases que suele decir el cliente. De esta manera, parte de las líneas aparecerán ya etiquetadas.
|
Codificación
|
Indica la codificación que utilizan los archivos que se van a convertir.
|
Crear archivos
|
Este cuadro combinado ofrece tres opciones:
- Ninguno: no se creará ningún archivo
- Solo una versión: se creará un único archivo .xls para cada .tsv
- Tres versiones: se crearán tres archivos .xls para cada .tsv, para que trabajen en ellos diferentes anotadores
|
Convierte los archivos .xls de una carpeta en archivos .tsv. Esta operación es particularmente útil cuando se ha utilizado la operación
Convertir .tsv a .xls para anotación de sentimientos para generar los archivos para los anotadores y, una vez que han finalizado su trabajo, es preciso convertir los archivos al formato original.
Parámetros
Carpeta con los archivos
|
Ruta de la carpeta que contiene los archivos que se van a convertir.
|
Codificación
|
Indica la codificación que utilizan los archivos que se van a convertir.
|
Cuando se dispone de tres versiones de cada archivo, combina estos archivos de manera aleatoria en tres carpetas, asignando de manera aleatoria qué archivos se copian en cada una de estas carpetas, pero garantizando que en cada carpeta contiene una lista completa de archivos y no hay ninguno duplicado. Esta operación es útil cuando se desea enmascarar los participantes en la creación de un lote de archivos, por ejemplo, para normalizar las propiedades asociadas a ellos.
Parámetros
Carpeta con los archivos de entrada 1
|
Carpeta que contiene el primer lote de archivos.
|
Carpeta con los archivos de entrada 2
|
Carpeta que contiene el segundo lote de archivos.
|
Carpeta con los archivos de entrada 3
|
Carpeta que contiene el tercer lote de archivos.
|
Carpeta con los archivos de salida
|
Carpeta en la que creará tres carpetas con las tres combinaciones de archivos.
|
Evalúa la alineación contenida en un archivo respecto a un archivo de referencia cuya alineación se considera correcta. Para ello, utiliza las siguientes métricas:
- segmentos correctos: segmentos en los que el texto de origen y destino coincide con la referencia
- segmentos perdidos: segmentos que aparecen en la referencia, pero no en el archivo a evaluar
- puntuación: se calcula sumando para cada segmento de la referencia la distancia que hay entre la posición del texto de origen y el texto de destino más cercano en el archivo a evaluar. Por ejemplo, si el archivo está correctamente alineado, la puntuación es cero, si hay una línea de diferencia entre ellas, es 1, si hay dos líneas, es 2, etc. Por tanto, esta puntuación es mejor cuanto menor sea.
Parámetros
Ruta del archivo a evaluar
|
Ruta del archivo cuya alineación se quiere evaluar.
|
Ruta del archivo de referencia
|
Ruta del archivo cuya alineación se considera correcta.
|
Separar palabras sin espacios |
Busca las palabras que no figuran en el diccionario y comprueba si es posible separarlas insertando un espacio entre ellas. Por ejemplo, el siguiente segmento contiene una palabra que no figura en el diccionario.
 |
The dialog box is open.
|
 |
El cuadrode diálogo está abierto.
|
Ejemplo 13. Error ortográfico debido a la ausencia de un espacio entre palabras
|
A partir de este segmento, esta operación generaría el siguiente segmento corregido:
 |
The dialog box is open.
|
 |
El cuadro de diálogo está abierto.
|
Ejemplo 14. Error ortográfico corregido mediante la inserción de un espacio
|
Es importante recordar que para buscar las posibles soluciones a un error ortográfico, esta operación examina el texto presente en la traducción cargada. Por tanto, la corrección anterior solo se aplicará si hay algún segmento donde aparecen las palabras
cuadro de correctamente separadas.
Uso sugerido:
Para corregir textos extraídos de archivos PDF, en los que es habitual que la extracción cometa errores en la separación de palabras con espacios.
Parámetros
Idioma
|
Este cuadro combinado permite especificar si se desea separar las palabras del texto de origen o del texto de destino.
|
Adapta los segmentos de una traducción al formato de otra traducción, que normalmente es una memoria de traducción. Esta operación es particularmente útil cuando conocemos una buena parte de la traducción (por ejemplo, mediante la alineación de una traducción anterior), pero hay pequeñas diferencias que hacen que una herramienta de traducción asistida no considere como exacta la coincidencia entre un segmento que hay traducción y el existente en la memoria de traducción. Los modos posibles de adaptar una traducción son los siguientes:
- Combinar y dividir: aplica diversas operaciones relativas a la segmentación de los archivos y la presencia de puntuación para crear la traducción adaptada
- Intercalar palabras y etiquetas: simplemente intercala una palabra después de cada etiqueta. Este modo es útil cuando el texto de origen contiene un elevado número de etiquetas de escasa utilidad (por ejemplo, cambios sutiles de color o espacio entre caracteres). Con esta operación, se puede extraer el texto a un formato más legible para realizar la traducción y la revisión, para luego devolverlo automáticamente a un formato similar al del texto de origen.
Cuando se elige el modo Combinar y dividir, las operaciones que se realizan son las siguientes:
- añadir o quitar caracteres iniciales y finales
- combinación de varios segmentos en uno
Parámetros
Ruta de archivo de entrada
|
Ruta del archivo que contiene la traducción que intentará adaptarse a la traducción cargada (y no a la inversa).
|
Ruta de archivo de salida
|
Ruta donde se guardará la traducción adaptada.
|
Modo
|
Modo que se utilizará para crear la traducción adaptada.
|
Traduce el texto de origen de la traducción cargada dividiendo cada segmento con el separador indicado y utilizando un glosario de términos. Además, si algún término del texto de origen aparece con un número, dicho número se incluye también en la traducción. Por ejemplo, si tenemos un glosario donde con los pares
(reset,restablecer) y
(device, dispositivo) se generará automáticamente la traducción del siguiente ejemplo: