Termoteca - Banco de Datos Terminolóxico da Universidade de Vigo
Como facer buscas
As buscas simples na Termoteca pódense facer doadamente escribindo na cela de busca a palabra ou secuencia de palabras que se queira consultar, e calcando despois no botón de "Vai". Pódese limitar a busca a unha área temática determinada, seleccionando o ámbito específico de consulta antes de calcar no botón de busca.
As buscas na Termoteca de expresións máis complexas pódense facer mediante as chamadas "expresións regulares" (POSIX 1003.2). As expresións regulares son secuencias de caracteres e símbolos que describen como é a cadea de texto buscada. Por exemplo:
- social - palabras que conteñan a secuencia de caracteres "social" en calquera posición. Exemplos: "social", "socialismo", "antisocial", "ecosocial", "ecosocialismo"...
- ^a - termos que empecen por "a"
- a$ - termos que acaben en "a"
- [[:<:]]bio - palabras que empecen por "bio" ("[[:<:]]" simboliza fronteira de palabra). Exemplos: "biodiversidade", "biomasa", "bioloxía", "biosfera"...
- produc{1,2}ión[[:>:]] - palabras que acaben en "produción" ou "producción" (o "{1,2}" simboliza un número de caracteres "c" mínimo de 1 e máximo de 2, isto é "c" ou "cc"). Exemplos: "produción", "producción", "reprodución", "reproducción"...
- [[:<:]]augas?[[:>:]] - a palabra "auga" ou a palabra "augas" (o "?" indica unha ou cero aparicións do caracter precedente).
- [[:<:]]enxeñ[ae]ría[[:>:]] - a palabra "enxeñaría" ou a palabra "enxeñería" (os corchetes simbolizan calquera dos caracteres que encerran)
- [[:<:]]a[[:alpha:]]a[[:>:]] - palabra de tres letras que empece e acabe por "a" ( "[[:alpha:]]" simboliza calquera caracter alfabético)
- [[:<:]]a[[:alpha:]]{2}a[[:>:]] - palabra de catro letras que empece e acabe por "a"
- [[:<:]]a[[:alpha:]]*a[[:>:]] - palabra de duas ou máis letras que empece e acabe por "a"
- [[:<:]]a[[:alpha:]]+a[[:>:]] - palabra de tres ou máis letras que empece e acabe por "a"
Os símbolos máis importantes que se poden utilizar para construír unha expresión regular de tipo POSIX 1003.2 son os seguintes:
Símbolos para caracteres
- . - calquera carácter, incluído o espacio en branco
- [[:alpha:]] - calquera letra
- [[:alnum:]] - letras e números
- [[:digit:]] - calquera díxito
- [[:space:]] - calquera tipo de espacio en branco (espacio, tabulación, salto de liña, salto de páxina...)
- [[:<:]], [[:>:]] - límites de palabra
- [abc] - un dos caracteres da serie, isto é, "a" ou "b" ou "c"
- [^abc] - calquera carácter que non sexa nin "a", nin "b", nin "c"
- [0-9] - calquera número de 0 a 9, isto é, "0", ou "1", ou "2"...
- [a-z] - calquera letra do "a" ao "z", isto é, "a", ou "b", ou "c", ou "d"...
- (abc|xyz) - unha das dúas secuencias de caracteres: "abc" ou "xyz"
Símbolos de repetición
- x+ (unha ou máis aparicións do carácter "x", isto é "x", "xx", "xxx"....)
- x? (ningunha ou unha aparición do carácter "x", isto é "" ou "x")
- x* (ningunha, unha ou máis aparicións do carácter "x", isto é "", "x", "xx", "xxx"....)
- x{n} (o carácter "x" repetido "n" veces seguidas)
- x{m, n} (o carácter "x" repetido entre "m" e "n" veces seguidas)
Símbolos de literalidade
- \+ (o carácter "+")
- \* (o carácter "*")
- \. (o carácter ".")
- \? (o carácter "?")
Seminario de Lingüística Informática - Grupo TALG, Universidade de Vigo, 2006-2011
Deseño e programación web: Xavier Gómez Guinovart