Funciones: Gramática
Estas funciones permiten realizar comprobaciones y operaciones de tipo gramatical, como por ejemplo asegurarse de que no haya errores de ortografía a de concordancia.
Muchas de las funciones de petraREV requieren que el texto de destino se etiquete previamente, es decir, que se asigne a cada palabra un lema y una etiqueta con su categoría morfosintáctica. Esta operación se realiza de manera automática cuando es necesaria. No obstante, en ocasiones puede ser necesario repetirla, por ejemplo, si hemos actualizado el diccionario o hemos cambiado el texto mediante la función de buscar y reeemplazar. En función del tamaño del texto, esta operación puede tardar varios minutos.
Parámetros
Idioma
|
Especifica el idioma de los segmentos que se etiquetarán.
|
Busca todos los elementos de una determinada categoría gramatical, según las etiquetas que se describen en la
sección sobre programación. Por ejemplo, si se buscan las etiquetas de tipo «n», se mostrarán todos los nombres, «a» buscará los adjetivos, «v» los verbos, etc. También es posible acceder a esta función mediante la pestaña Buscar gramática de la
pantalla Buscar y reemplazar.
Parámetros
Archivo de exportación
|
Si se quiere guardar la lista resultante como un archivo (texto plano, con cada token y su correspondiente frecuencia en cada línea separados por un tabulador), basta con indicar la ruta en este cuadro. Si se deja en blanco, no se guardará ninguna lista.
|
Categoría gramatical
|
Categoría gramatical que queremos buscar. Se puede introducir un único carácter o varios, pero siempre deberán ser los primeros de la etiqueta. Si se quieren buscar varias categorías gramaticales, se pueden separar mediante punto y coma. Por ejemplo, n;v busca todos los tokens que son un nombre o un verbo.
|
Idioma
|
Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
|
Presentación
|
Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.
|
Mostrar gráfico
|
Si se marca esta casilla, se mostrará un gráfico de barras con las frecuencias de los tokens encontrados ordenados de mayor frecuencia a menos.
|
Ignorar mayúsculas
|
Si se marca esta casilla, se agruparán las palabras que solo difieran en el uso de mayúsculas y minúsculas. Por ejemplo, sistema, Sistema y SISTEMA se agruparán bajo un solo token, dándose prioridad a las formas en minúsculas. En el ejemplo anterior, se utilizaría sistema.
|
Mostrar lemas
|
Si se marca esta casilla, se agruparán las palabras que compartan el mismo lema. Por ejemplo, cantaría, canté y cantará se agruparán bajo un solo token, que corresponde a la forma canónica, en este caso cantar.
|
Comprueba si hay alguna disconcordancia de género o número entre determinantes y adjetivos/sustantivos. Por ejemplo, el siguiente segmento muestra un error de concordancia.
 |
The selected option is not valid.
|
 |
El opción seleccionada no es válida.
|
Ejemplo 1. Error de concordancia.
|
Hay que tener en cuenta que no se comprueba ningún otro tipo de concordancia más allá del indicado. Por ejemplo, no se comprobarán las concordancias sustantivo-adjetivo o sustantivo-adjetivo.
Parámetros
Comprobar verbos
|
Comprueba la concordancia nombre-verbo.
|
Normalmente, las preposiciones y los determinantes que se emplean para conectar dos elementos siempre suelen ser los mismos. Esta comprobación determina todos estos conectores y muestra los casos en los que detecta alguna diferencia, lo que suele corresponder a una falta de coherencia. Por ejemplo, veamos los segmentos 2a y 2b:
 |
Open the data base.
|
 |
Abra la base datos.
|
Ejemplo 2a. Incoherencia en el uso de conectores.
|
 |
Close the data base.
|
 |
Cierre la base de datos.
|
Ejemplo 2b. Incoherencia en el uso de conectores.
|
Mientras que en el ejemplo 2a no existe ninguna preposición entre
base y
datos, en el ejemplo 2b se ha utilizado la preposición
de, que es una opción más correcta.
Parámetros
Categorías gramaticales de los elementos conectados
|
Categoría gramaticales, según las etiquetas que se describen en la sección sobre programación, entre las que se examinarán los conectores utilizados. Por ejemplo, el valor «na» buscará los conectores entre nombres y adjetivos. No suele ser necesario alterar el valor por defecto.
|
Número máximo de tokens conectados
|
Indica el número máximo de tokens (determinantes y preposiciones) que puede haber entre dos elementos conectados. Por ejemplo, para el valor 1, se considerarán los grupos nombre pantalla y nombre de pantalla, pero no nombre de la pantalla, porque entre nombre y pantalla hay 2 tokens.
|
Modo resumido
|
Si se activa esta casilla de verificación, solo se mostrarán las incoherencias relacionados con un grupo en el que no haya ningún conector intermedio y otro grupo con uno o varios conectores. Por ejemplo, se mostrarán advertencias para los grupos nombre pantalla y nombre de pantalla, pero no para nombre de pantalla y nombre de la pantalla.
|
Las reglas gramaticales describen combinaciones de elementos gramaticales que no deseamos que aparezcan en una traducción. En ocasiones sirven para detectar errores, como por ejemplo determinados errores de concordancia entre verbo y sustantivo, pero también son útiles para imponer ciertas convenciones de estilo. Por ejemplo, mediante estas reglas podemos evitar que se utilice la segunda persona en una traducción, si deseamos darle un tono más formal.
Cada regla de estilo se compone de dos elementos, separados por un tabulador. El primero consiste en una serie de condiciones, expresadas en la
notación gramatical de petraREV que indican la combinación que queremos que se nos muestra. El segundo es un mensaje que informa al usuario del posible problema que presenta dicha combinación. Por ejemplo, veamos la regla del ejemplo 3.
0(E1=Fia)1(P=cuando)→Probablemente se debería añadir el acento al pronombre interrogativo:
|
Ejemplo 3. Regla gramatical para detectar errores en la puntuación del pronombre interrogativo cuando.
|
Esta regla indica que queremos ver aquellos casos en los que un símbolo de apertura de interrogación aparece seguido por la palabra
cuando (sin tilde). Aunque hay casos en los que dicho uso es aceptable, por lo general suele corresponder a un error, por lo que merece la pena examinar estos casos.
Parámetros
Ruta del archivo con las reglas gramaticales
|
Ruta del archivo que contiene las reglas gramaticales.
|
Muestra los casos en los que una o varias palabras aparecen repetidas, lo que suele corresponder a un error. En el ejemplo 4, podemos ver un segmento en el que la palabra
la aparece incorrectamente dos veces.
 |
Close the data base.
|
 |
Cierre la la base de datos.
|
Ejemplo 4. Repetición errónea de la palabra «la»
|
Parámetros
N.º de palabras repetidas
|
Indica cuántas palabras deben repetirse para que se considere un error. Un ejemplo del valor 1 sería «la la», uno del valor 2 sería «de la de la», uno del valor 3 sería «para que no para que no», etc. Se pueden escribir varios valores escribiéndolos uno tras otros sin ningún tipo de separación. Por ejemplo, el valor «123» indica que se busquen las repeticiones de 1, 2 o 3 palabras.
|
No mostrar repeticiones que también aparezcan en el original
|
La mayoría de las advertencias que no corresponden a errores de esta comprobación están relacionadas con repeticiones de elementos que también aparecen en el texto de origen. Por tanto, si se activa esta casilla, no se considerará que una repetición es un error si también aparece en el texto de origen.
|
Buscar segmentos con texto de origen igual a texto de destino |
Muestra aquellos segmentos en los que el texto de destino coincide con el texto de origen.
Parámetros
Comprobar criterios de traducibilidad
|
Si se activa esta casilla, no se mostrarán los segmentos que estén compuestos únicamente por números y signos de puntuación (concretamente los caracteres 0123456789.,;:), a pesar de que coincidan texto de origen y texto de destino.
|
Invertir resultados
|
Si se marca esta casilla, se mostrarán aquellos segmentos en los que el texto de origen no coincida con el texto de destino.
|
Buscar segmentos con traducción vacía |
Muestra aquellos segmentos en los que el texto de origen contiene algún carácter y, sin embargo, el texto de destino no contiene ninguno.
Esta operación no se puede configurar.
Genera el diccionario flexionado que utiliza petraREV para etiquetar los textos mediante las tablas de terminaciones y lemas. Se trata de una operación bastante avanzada que puede tardar cierto tiempo (normalmente, unos quince minutos) y que sólo es necesario realizar cuando se han introducido cambios en los diccionarios que es necesario aplicar al diccionario generado. También puede llevarse a cabo utilizando el botón Generar de la
pantalla Diccionario.
Parámetros
Idioma
|
Indica el idioma para el que se generará el diccionario.
|
Mostrar estadísticas de etiquetado |
Presenta una lista con la frecuencia de distribución de cada categoría morfológica.
Parámetros
Idioma
|
Indica el idioma para el que se mostrarán las estadísticas.
|
Cuando en un texto aparecen un acrónimo cuyo significado desconocemos, esta función nos ayuda mostrando todas las combinaciones de palabra del texto cuyas iniciales coinciden con las que estamos buscando.
Parámetros
Acrónimo buscado
|
Secuencia de letras que forma el acrónimo.
|
Idioma
|
Indica el idioma en el que se buscará el acrónimo.
|
Buscar secuencia de tokens |
Busca todos los tokens que cumplen una determinada condición gramatical, según las etiquetas que se describen en la
sección sobre programación y se genera una lista con un número fijo de tokens a partir de dicho token. Por ejemplo, si se buscan los tokens que sean un nombre seguido de un verbo y se especifica que se extraigan dos tokens, se mostrarán todos los casos en los que un nombre aparezca seguido de un verbo. También es posible guardar la lista de secuencias de tokens obtenida en un archivo.
Parámetros
Condición gramatical
|
Condición gramatical que debe cumplirse.
|
Longitud de secuencia
|
Número de tokens que se mostrarán a partir del token que cumple la condición. Por defecto, siempre se parte del token 0, por lo que debe ajustarse la condición de manera que el primer token que se extraiga sea siempre el token 0.
|
Ruta de archivo
|
Ruta del archivo al que se exportará la lista de secuencias de tokens. Si se deja en blanco, no se exportará ningún resultado.
|
Idioma
|
Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
|
Presentación
|
Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.
|
Mostrar repeticiones excesivas de palabras |
Muestra advertencias cuando aparecen varias palabras con un mismo lema excesivamente cerca. En estos casos, con frecuencia resulta preferible recurrir a un sinónimo para que el texto resulte menos repetitivo. Por ejemplo, en el siguiente segmento, se puede sustituir
seleccione por
elija para mejorar el estilo del texto.
 |
Select the object and choose the action to perform.
|
 |
Seleccione el objeto y seleccione la acción que desea llevar a cabo.
|
Ejemplo 5. Repetición excesiva de la palabra «seleccionar»
|
Tal como se puede observar, para determinar si la repetición es excesiva se emplea el lema, de forma que varias formas flexionadas de un mismo lema se considerarán como una repetición.
Parámetros
Categorías analizadas
|
Solo se mostrarán las repeticiones de estas categorías, lo que evita las advertencias relacionadas con categorías de uso muy habitual (como las preposiciones). Por ejemplo, nv solo muestra las repeticiones de nombres y verbos.
|
Excepciones
|
Aún restringiendo las repeticiones a categorías muy concretas, hay lemas que aparecen con mucha frecuencia, como por ejemplo los verbos auxiliares. Para evitar estas advertencias, basta con especificar aquí los lemas cuyas repeticiones no deseamos ver.
|
Distancia mínima en palabras
|
Si es 0, bastará con que aparezcan dos palabras con un mismo lema en un segmento para que se muestre una advertencia. Si el valor es mayor, indicará el número máximo de tokens que pueden aparecer entre dos palabras con un mismo lema para que se considere una repetición excesiva. Por ejemplo, si se elige el valor 3 y las palabras seleccione y seleccionar aparecen en un segmento separadas por tres tokens o más, no se considerará como una repetición excesiva.
|
Comprobar mayúsculas intermedias |
Muestra una advertencia cuando se detecta una palabra en la que hay una mayúscula más allá de la primera letra, sin que la palabra esté completamente escrita en mayúsculas. Por ejemplo,
sistema,
Sistema y
SISTEMA son opciones válidas, pero
sIstema,
SIstema y
sISTEMA no lo son. Si la palara que hace un uso poco habitual de las mayúsculas aparece exactamente igual en el texto de origen, no se muestra la advertencia.
Comprobar mayúsculas después de palabra |
Muestra advertencias en aquellos casos en los que para las mismas dos palabras seguidas, en un caso la segunda palabra va en mayúscula y en otro va en minúscula. Por ejemplo, en el segmento del ejemplo 6a podemos ver que la palabra
de va seguida de
datos en minúscula mientras que en el segmento del ejemplo 6b la palabra
de va seguida de
Datos con la primera letra en mayúscula.
 |
Open the data base.
|
 |
Abra la base de datos.
|
Ejemplo 6a. Error en el uso de mayúsculas.
|
 |
Close the data base.
|
 |
Cierre la base de Datos.
|
Ejemplo 6b. Error en el uso de mayúsculas.
|
Parámetros
Incluir signos de puntuación
|
Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por un signo de puntuación.
|
Incluir etiquetas
|
Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por una etiqueta.
|
Buscar patrones gramaticales |
A partir de una serie de patrones gramaticales, busca las instancias de dichos patrones en el texto de destino.
Parámetros
Patrones gramaticales
|
Indica los patrones gramaticales que se buscarán en el texto. Por ejemplo, el patrón na buscará los casos en los que un nombre (n) aparezca seguido de un adjetivo (a) como, por ejemplo, sistema operativo. Para indicar varios patrones, pueden separarse con punto y coma. Por ejemplo, na;nsn buscará los patrones nombre-adjetivo y los patrones nombre-preposición-nombre.
|
Crear modelo del lenguaje |
Crea a partir de un archivo de referencia un modelo de bigramas del lenguaje que exporta al archivo indicado con el siguiente formato:
elementoBigrama1→elementoBigrama2→frecuenciaBigrama→frecuenciaElementoBigrama1
Por ejemplo, imaginemos la siguiente línea:
de→papel→2→14
Esta línea ofrece información sobre el bigrama (de,papel) y nos indica que este bigrama aparece 2 veces, mientras que el primer elemento
de aparece 14 veces. Por lo tanto, la probabilidad de que aparezca
papel después de
de es de 2/14. Esta operación puede ser bastante lenta si el modelo quiere crearse a partir de textos muy extensos.
Parámetros
Ruta de los archivos de entrada
|
Ruta de los archivos a partir de los que se generará el modelo.
|
Frecuencia mínima
|
Indica el número mínimo de veces que debe aparecer un token para que se incluya en el modelo.
|
Utilizar lemas
|
Si se marca esta casilla de verificación, los n-gramas se crearán utilizando lemas en lugar de tokens.
|
Mostrar modelo
|
Si se marca esta casilla, se mostrarán todos los bigramas que componen el modelo.
|
Crear lista de autocorrección |
Analiza el texto de destino de la traducción cargada y muestra una lista con todos los cambios que son necesarios para reducir el número de palabras no válidas según el diccionario.
Parámetros
Ruta para exportar lista de autocorrección
|
Si no se deja en blanco este campo, se guardará la lista obtenida en la ubicación indicada.
|
Longitud mínima de palabras para autocorregir
|
Longitud mínima que tiene que tener una palabra para que se corrija.
|
Palabras que se corregirán
|
Especifica si se corregirán las palabras en Mayúsculas y minúsculas, Solo minúsculas o Solo mayúsculas.
|
Unir palabras
|
Si se activa esta casilla de verificación, se evaluará si la unión de palabras no válidas genera una palabra válida.
|
Comprueba que cuando dos elementos aparecen conectados mediante una preposición, el uso del plural en el segundo elemento siempre es el mismo si el primer elemento coincide. Por ejemplo, a continuación vemos dos segmentos en los que no se cumple esta condición, ya que en el primer segmento, se utiliza el plural y en el segundo no.
 |
Open the user management tool.
|
 |
Abra la herramienta de administración de usuarios.
|
Ejemplo 7a. Incoherencia en el uso del plural.
|
 |
Open the user management tool.
|
 |
Abra la herramienta de administración del usuario.
|
Ejemplo 7a. Incoherencia en el uso del plural.
|
Parámetros
Categorías de comienzo y final de términos
|
Categoría gramatical que han de tener los elementos conectados con una preposición. Por defecto, solo se tienen en cuenta los nombres (n), pero puede ser interesante comprobar también los adjetivos, en cuyo caso habría que especificar el valor na.
|
Analizar repetición excesiva por categoría gramatical |
Muestra los palabras de una determinada categoría gramatical que se encuentran a una distancia inferior a un mínimo. Por ejemplo, en el siguiente segmento, el adverbio
ya dos veces con solo ocho palabras intermedias, lo que puede ser significativo de un estilo pobre.
 |
«Yes,» he said, already grasping the doorknob. Now he did not seem eager to go.
|
 |
—Sí… —dijo ya, con la mano en el picaporte la puerta. Ya no parecía tener tanta prisa por marcharse.
|
Ejemplo 8a. El adverbio ya aparece dos veces a una distancia de pocas palabras.
|
Cuando se utiliza el modo
Por segmento se permite que haya palabras próximas siempre que en el texto de origen también aparezcan palabras equivalentes separadas por una distancia inferior a la indicada. Por ejemplo, en el siguiente segmento la palabra
proceso aparece dos veces muy seguidas, pero no se mostrará en una advertencia ya que ocurre lo mismo en el texto de origen.
 |
The process begins with the assignment process.
|
 |
El proceso comienza con el proceso de asignación.
|
Ejemplo 9a. El nombre proceso aparece dos veces a una distancia de pocas palabras, pero no se marcará como error ya que también ocurre lo mismo con el nombre process en el texto de origen.
|
Parámetros
Categoría gramatical
|
Categoría gramatical cuya frecuencia de uso se analizará.
|
Distancia mínima entre apariciones
|
Distancia mínima que debe haber entre dos apariciones de una misma palabra de la categoría analizada para que no se considere un uso excesivo.
|
Modo
|
Este cuadro combinado ofrece dos opciones:
- Por palabra: con este modo, se informará de las repeticiones de palabras próximas, aunque estén en segmentos diferentes. Este modo es adecuado cuando el texto se va a leer de manera secuencial, como ocurre por ejemplo con una novela.
- Por palabra: con este modo, se informará de las repeticiones de palabras próximas, solo si están en un mismo segmento. Este modo es adecuado cuando el texto no se va a leer de manera secuencial, como ocurre por ejemplo con el texto de un software.
|