petraREV: una herramienta para la revisión profesional de traducciones

Conceptos básicos

Pantallas

Funciones

Funciones

Programación

Tutoriales

Tutorial 1

Nosotros

Privacidad

¿Conoces petraTAG?

Funciones: Gramática

Estas funciones permiten realizar comprobaciones y operaciones de tipo gramatical, como por ejemplo asegurarse de que no haya errores de ortografía a de concordancia.

Etiquetar texto

Muchas de las funciones de petraREV requieren que el texto de destino se etiquete previamente, es decir, que se asigne a cada palabra un lema y una etiqueta con su categoría morfosintáctica. Esta operación se realiza de manera automática cuando es necesaria. No obstante, en ocasiones puede ser necesario repetirla, por ejemplo, si hemos actualizado el diccionario o hemos cambiado el texto mediante la función de buscar y reeemplazar. En función del tamaño del texto, esta operación puede tardar varios minutos.

Parámetros

Idioma

Especifica el idioma de los segmentos que se etiquetarán.

Archivo de exportación	Si se quiere guardar la lista resultante como un archivo (texto plano, con cada token y su correspondiente frecuencia en cada línea separados por un tabulador), basta con indicar la ruta en este cuadro. Si se deja en blanco, no se guardará ninguna lista.
Categoría gramatical	Categoría gramatical que queremos buscar. Se puede introducir un único carácter o varios, pero siempre deberán ser los primeros de la etiqueta. Si se quieren buscar varias categorías gramaticales, se pueden separar mediante punto y coma. Por ejemplo, n;v busca todos los tokens que son un nombre o un verbo.
Idioma	Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación	Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.
Mostrar gráfico	Si se marca esta casilla, se mostrará un gráfico de barras con las frecuencias de los tokens encontrados ordenados de mayor frecuencia a menos.
Ignorar mayúsculas	Si se marca esta casilla, se agruparán las palabras que solo difieran en el uso de mayúsculas y minúsculas. Por ejemplo, sistema, Sistema y SISTEMA se agruparán bajo un solo token, dándose prioridad a las formas en minúsculas. En el ejemplo anterior, se utilizaría sistema.
Mostrar lemas	Si se marca esta casilla, se agruparán las palabras que compartan el mismo lema. Por ejemplo, cantaría, canté y cantará se agruparán bajo un solo token, que corresponde a la forma canónica, en este caso cantar.

	The selected option is not valid.
	El opción seleccionada no es válida.
Ejemplo 1. Error de concordancia.

	Open the data base.
	Abra la base datos.
Ejemplo 2a. Incoherencia en el uso de conectores.

	Close the data base.
	Cierre la base de datos.
Ejemplo 2b. Incoherencia en el uso de conectores.

Categorías gramaticales de los elementos conectados	Categoría gramaticales, según las etiquetas que se describen en la sección sobre programación, entre las que se examinarán los conectores utilizados. Por ejemplo, el valor «na» buscará los conectores entre nombres y adjetivos. No suele ser necesario alterar el valor por defecto.
Número máximo de tokens conectados	Indica el número máximo de tokens (determinantes y preposiciones) que puede haber entre dos elementos conectados. Por ejemplo, para el valor 1, se considerarán los grupos nombre pantalla y nombre de pantalla, pero no nombre de la pantalla, porque entre nombre y pantalla hay 2 tokens.
Modo resumido	Si se activa esta casilla de verificación, solo se mostrarán las incoherencias relacionados con un grupo en el que no haya ningún conector intermedio y otro grupo con uno o varios conectores. Por ejemplo, se mostrarán advertencias para los grupos nombre pantalla y nombre de pantalla, pero no para nombre de pantalla y nombre de la pantalla.

0(E1=Fia)1(P=cuando)→Probablemente se debería añadir el acento al pronombre interrogativo:
Ejemplo 3. Regla gramatical para detectar errores en la puntuación del pronombre interrogativo cuando.

	Close the data base.
	Cierre la la base de datos.
Ejemplo 4. Repetición errónea de la palabra «la»

N.º de palabras repetidas	Indica cuántas palabras deben repetirse para que se considere un error. Un ejemplo del valor 1 sería «la la», uno del valor 2 sería «de la de la», uno del valor 3 sería «para que no para que no», etc. Se pueden escribir varios valores escribiéndolos uno tras otros sin ningún tipo de separación. Por ejemplo, el valor «123» indica que se busquen las repeticiones de 1, 2 o 3 palabras.
No mostrar repeticiones que también aparezcan en el original	La mayoría de las advertencias que no corresponden a errores de esta comprobación están relacionadas con repeticiones de elementos que también aparecen en el texto de origen. Por tanto, si se activa esta casilla, no se considerará que una repetición es un error si también aparece en el texto de origen.

Comprobar criterios de traducibilidad	Si se activa esta casilla, no se mostrarán los segmentos que estén compuestos únicamente por números y signos de puntuación (concretamente los caracteres 0123456789.,;:), a pesar de que coincidan texto de origen y texto de destino.
Invertir resultados	Si se marca esta casilla, se mostrarán aquellos segmentos en los que el texto de origen no coincida con el texto de destino.

Acrónimo buscado	Secuencia de letras que forma el acrónimo.
Idioma	Indica el idioma en el que se buscará el acrónimo.

	Select the object and choose the action to perform.
	Seleccione el objeto y seleccione la acción que desea llevar a cabo.
Ejemplo 5. Repetición excesiva de la palabra «seleccionar»

Condición gramatical	Condición gramatical que debe cumplirse.
Longitud de secuencia	Número de tokens que se mostrarán a partir del token que cumple la condición. Por defecto, siempre se parte del token 0, por lo que debe ajustarse la condición de manera que el primer token que se extraiga sea siempre el token 0.
Ruta de archivo	Ruta del archivo al que se exportará la lista de secuencias de tokens. Si se deja en blanco, no se exportará ningún resultado.
Idioma	Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación	Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.

Categorías analizadas	Solo se mostrarán las repeticiones de estas categorías, lo que evita las advertencias relacionadas con categorías de uso muy habitual (como las preposiciones). Por ejemplo, nv solo muestra las repeticiones de nombres y verbos.
Excepciones	Aún restringiendo las repeticiones a categorías muy concretas, hay lemas que aparecen con mucha frecuencia, como por ejemplo los verbos auxiliares. Para evitar estas advertencias, basta con especificar aquí los lemas cuyas repeticiones no deseamos ver.
Distancia mínima en palabras	Si es 0, bastará con que aparezcan dos palabras con un mismo lema en un segmento para que se muestre una advertencia. Si el valor es mayor, indicará el número máximo de tokens que pueden aparecer entre dos palabras con un mismo lema para que se considere una repetición excesiva. Por ejemplo, si se elige el valor 3 y las palabras seleccione y seleccionar aparecen en un segmento separadas por tres tokens o más, no se considerará como una repetición excesiva.

	Open the data base.
	Abra la base de datos.
Ejemplo 6a. Error en el uso de mayúsculas.

	Close the data base.
	Cierre la base de Datos.
Ejemplo 6b. Error en el uso de mayúsculas.

Incluir signos de puntuación	Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por un signo de puntuación.
Incluir etiquetas	Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por una etiqueta.

Ruta de los archivos de entrada	Ruta de los archivos a partir de los que se generará el modelo.
Frecuencia mínima	Indica el número mínimo de veces que debe aparecer un token para que se incluya en el modelo.
Utilizar lemas	Si se marca esta casilla de verificación, los n-gramas se crearán utilizando lemas en lugar de tokens.
Mostrar modelo	Si se marca esta casilla, se mostrarán todos los bigramas que componen el modelo.

Ruta para exportar lista de autocorrección	Si no se deja en blanco este campo, se guardará la lista obtenida en la ubicación indicada.
Longitud mínima de palabras para autocorregir	Longitud mínima que tiene que tener una palabra para que se corrija.
Palabras que se corregirán	Especifica si se corregirán las palabras en Mayúsculas y minúsculas, Solo minúsculas o Solo mayúsculas.
Unir palabras	Si se activa esta casilla de verificación, se evaluará si la unión de palabras no válidas genera una palabra válida.

	Open the user management tool.
	Abra la herramienta de administración de usuarios.
Ejemplo 7a. Incoherencia en el uso del plural.

	«Yes,» he said, already grasping the doorknob. Now he did not seem eager to go.
	—Sí… —dijo ya, con la mano en el picaporte la puerta. Ya no parecía tener tanta prisa por marcharse.
Ejemplo 8a. El adverbio ya aparece dos veces a una distancia de pocas palabras.

	The process begins with the assignment process.
	El proceso comienza con el proceso de asignación.
Ejemplo 9a. El nombre proceso aparece dos veces a una distancia de pocas palabras, pero no se marcará como error ya que también ocurre lo mismo con el nombre process en el texto de origen.

Manual del usuario de petraREV

Funciones: Gramática

Etiquetar texto

Buscar tokens

Comprobar concordancia

Comprobar conectores

Comprobar gramática

Comprobar repeticiones

Buscar segmentos con texto de origen igual a texto de destino

Buscar segmentos con traducción vacía

Generar diccionario

Mostrar estadísticas de etiquetado

Buscar acrónimo

Buscar secuencia de tokens

Mostrar repeticiones excesivas de palabras

Comprobar mayúsculas intermedias

Comprobar mayúsculas después de palabra

Buscar patrones gramaticales

Crear modelo del lenguaje

Crear lista de autocorrección

Comprobar plurales

Analizar repetición excesiva por categoría gramatical

Categoría gramatical	Categoría gramatical cuya frecuencia de uso se analizará.
Distancia mínima entre apariciones	Distancia mínima que debe haber entre dos apariciones de una misma palabra de la categoría analizada para que no se considere un uso excesivo.
Modo	Este cuadro combinado ofrece dos opciones: Por palabra: con este modo, se informará de las repeticiones de palabras próximas, aunque estén en segmentos diferentes. Este modo es adecuado cuando el texto se va a leer de manera secuencial, como ocurre por ejemplo con una novela. Por palabra: con este modo, se informará de las repeticiones de palabras próximas, solo si están en un mismo segmento. Este modo es adecuado cuando el texto no se va a leer de manera secuencial, como ocurre por ejemplo con el texto de un software.