jueves, 16 de mayo de 2024

Recursos. Iedra

Qué es

Iedra es un buscador y explorador de palabras. Se puede entender como lo opuesto a un diccionario ordinario. En estos, se parte de una palabra para hallar su definición. En Iedra, se parte de una definición y se hallan las palabras que la satisfacen.

Entre los criterios de búsqueda que se pueden usar para buscar palabras están las búsquedas textuales en la propia palabra o en sus definiciones, la longitud de la palabra, el número de sílabas y su acentuación.

Escogiendo bien los términos de búsqueda, Iedra puede servir también como tesauro asociativo, buscador etimológico, buscador de sinónimos, buscador de categorías gramaticales y otras funciones lexicológicas.

Para buscar en las definiciones, Iedra se vale de las definiciones del Diccionario de la lengua española de la Real Academia Española y del Diccionario de uso del español de María Moliner. En el caso del DLE, al estar en línea, Iedra puede mostrar extractos de los términos que coinciden y enlazar a la definición completa en el sitio de la RAE, análogamente a como lo hacen Google y otros buscadores que enseñan extractos en sus resultados.

Esta herramienta puede resultar de gran utilidad para lingüistas, traductores, escritores, poetas, periodistas y, en general, para gente con inquietud por el español.




Cómo se usa

Todos los términos introducidos importan. Es decir, se usan todos los términos para buscar y solo se muestran resultados que contienen a todos ellos.

Los términos pueden ser palabras sueltas o frases. Las frases deben ir encerradas entre comillas ("").

No se tienen en cuenta las mayúsculas. Es decir, chorizo, Chorizo y ChOrIzO ofrecen los mismos resultados. No obstante, el orden de estos sí puede variar cuando se usa la relevancia como criterio de ordenación.

Búsqueda avanzada

En la parte izquierda de los resultados de búsqueda existen una serie de opciones para modificar el comportamiento de la búsqueda. En Tipo de búsqueda permite activar o desactivar la lematización (más sobre esto abajo). En Buscar en, se puede elegir si buscar en definiciones y lemas (comportamiento por defecto), o solo en los lemas (útil para generar listados de palabras que cumplen un patrón o morfología concretos). En Ordenar, se puede elegir ordenar los resultados de búsqueda por relevancia, por orden alfabético, por su frecuencia de aparición en el corpus de Google Ngram y por la longitud del lema.

La relevancia es una puntuación, calculada automáticamente para cada resultado, que intenta medir lo que se ajusta el resultado a los criterios de búsqueda. Se ve afectada por el número de veces que aparecen los términos, la posición en que aparecen, etc.

La frecuencia en Google Ngram mide la cantidad de veces que aparece una palabra en este corpus, que es un conjunto de textos en español, de diversa procedencia. Es decir, mide lo común que es una palabra en el idioma español.

En Año de inclusión, se pueden acotar las palabras resultantes de una búsqueda según el año en que fueron recogidas por primera vez por la RAE. Para ello hay que usar los controles deslizantes para definir un rango de años. Hay que tener en cuenta que muchas palabras no llevan asociada información sobre el año de inclusión, y todas ellas serán excluidas al definir un rango de años, aunque este sea el mayor rango definible (1726-1992). Para anular este filtro, puedes pulsar el botón que aparece a la derecha de los controles deslizantes.

En Longitud del lema, se pueden acotar las palabras según su longitud. El funcionamiento es análogo a los controles deslizantes del Año de inclusión.

En Número de sílabas, se pueden acotar las palabras según (¡oh, sorpresa!) su número de sílabas. El funcionamiento es análogo a los controles deslizantes del Año de inclusión.

Si se quiere excluir un término de los resultados, se le puede poner un signo menos (-) delante. Esto también funciona con las frases entrecomilladas.

En su comportamiento por defecto, el diccionario no solo encuentra las palabras que coinciden exactamente con los términos de búsqueda, sino también las que comparten lexema con ellos (lematización o stemming). Para anular este comportamiento y buscar solo coincidencias exactas, se puede seleccionar el tipo de búsqueda exacta en los resultados de la búsqueda.

Cualquier término de búsqueda, excepto las frases entre comillas, puede contener uno o más comodines en cualquier posición del término. Los comodines indican que el término es, en realidad, un patrón que puede coincidir con muchos términos. Hay dos tipos de comodín: el asterisco (*), que se traduce en cero o más caracteres arbitrarios, y la interrogación (?), que se traduce en exactamente un carácter arbitrario. Este comportamiento es independiente de si está activada o no la búsqueda exacta, aunque normalmente querrás tenerla activada para usar comodines, porque ofrece resultados más predecibles. Por ejemplo, la búsqueda *quete busca todas las palabras que terminan en «quete», la búsqueda cas?o, todas las palabras semejantes que admiten variación en el cuarto carácter («casco» y «casto»), y *cas?o, todas las palabras que terminan según el patrón anterior («agnocasto», «casco», «casto», «entrecasco», «guancasco», «incasto», «monocasco», «pascasio»y «sarcasmo»).

También se pueden hacer búsquedas difusas o por aproximación. Una búsqueda difusa encuentra palabras que son «razonablemente» parecidas al término de búsqueda. Los comodines son una manera estricta de especificar similaridad, ya que se exige que los resultados concuerden exactamente con los caracteres del término. En las búsquedas difusas, también se permite que haya caracteres movidos, eliminados o insertados. Para hacer una búsqueda difusa, basta con colocar una virgulilla (~) detrás de cualquier término de búsqueda (excluyendo las frases). Adicionalmente, se puede especificar un índice de similaridad justo detrás de la virgulilla, que debe ser un número decimal con un punto como separador decimal y dentro del rango que va de 0.0 a 0.999 (si no se especifica, el valor por defecto es 0.5). Al igual que con los comodines, lo más normal es querer activar la búsqueda exacta. Por ejemplo, la búsqueda perro~, exacta y solo en lemas, ofrece más de 100 resultados parecidos a «perro» («berro», «perno», «ferro», «perero», «parro», «cerro»…). La búsqueda perro~0.75 es más estricta y solo ofrece menos de 20 resultados, mientras que perro~0.3 ofrece más de 1000 resultados.

Ejemplos de uso

Puedes buscar palabras sueltas.   diccionario, contrario, tienda, Juan, molusco, embutido

Puedes buscar frases usando comillas.   "muy grande", "cuatro ruedas", "esfera celeste", "poco tiempo"

Así puedes buscar por origen etimológico.   "del quechua", "del Sánscr.", "del caló", "loc. lat."

Así puedes buscar por categoría gramatical.   "onomat.", "interj.", "loc. adv. coloq."

Puedes excluir términos con un signo menos.   carruaje -"cuatro ruedas"


No hay comentarios:

Publicar un comentario

LO MÁS VISTO EN EL BLOG