Archivo de la categoría: lr0809

Proiektua (A taldea)

JUNTAGAILU HAUTAKARIAK: edo/edota/ala/nahi(z)/zein

Hauxe da Arratek, Albak, Janirek, Odeik eta bostok proiekturako aukeratutako gaia Juntagailu bakoitzaren adibideak emateko honako material hauek erabili ditugu:

LANA EGITEKO ERABILITAKO MATERIALAK:

Corpus-a osatzeko erabilitako bibliografia

* UZEI

http://www.uzei.com

* Ereduzko prosa gaur corpusa

http://www.ehu.es/euskara-  orria/euskara/ereduzkoa/
* Xx.mendeko euskararen corpus  estilistikoa

http://www.euskaracorpusa.net/XXmendea/



Bibliografia

Sarean

* Euskaltzaindia

http://www.euskaltzaindia.net

* Harluxet hiztegi entziklopedikoa

http://www1.euskadi.net/harluxet/
www.hiru.com
www.erabili.com

Liburuak

* MICHELENA, L. (1987 – 2005): Orotariko Euskal Hiztegia. Bilbao. Euskaltzaindia
* Euskal gramatika osoa (1995-2000), Ilari Zubiri eta Entzi Zubiri, Didaktiker
* Euskara eta Literatura, Ibaizabal (1997), Ana Mari Agirre

Deja un comentario

Archivado bajo lr0809

«Online» hiztegiak

 

Egun, paperezko hiztegiak baino gehiago erabiltzen dira «online» hiztegiak. Erabiltzeko errazak eta azkarrak baitira.

electronic-dictionary-toolbar

Hiztegi kopuru handia dago interneten:

Multilinguea : www.wordreference.com

Euskera: http://www.hiztegia.net/

Ingelesa: http://dictionary.reference.com/

                   http://www.merriam-webster.com/

Frantsesa: http://www.le-dictionnaire.com/

Arabiera-ingelesa/ingelesa-arabiera: http://www.arabiclookup.com/

Hindi-inelesa/ingelesa-hindi: http://www.shabdkosh.com/

Errusiera-ingelesa/ingelesa-errusiera: http://www.rustran.com/

Deja un comentario

Archivado bajo lr0809

Hiztegi elektronikoa/电子词典/電子辞書

Lexikografia konputazionalaren emaitzarik emankorrena da. Hiztegi elektronikoa esku-konputagailu txikia da. Teklatu eta LCD pantailaduna.

Japoniera-japoniera, japoniera-ingelera eta ingelera-japoniera hiztegiak daramatza integraturik, 1979an jaio baitzen Japonian hiztegi mota hau «Sakeleko itzul-makina» izenpean.

sharp-rd-cx150

Deja un comentario

Archivado bajo lr0809

Lexikografia konputazionala

lexicographyHiru fasetan bereizten da corpus baten burutzea:

1. Testuen hautaketa: autore eta obra errepertorioa.

2. Testuen egiaztatze eta sartzea. Kodeak erabilita, hitz-mota zehaztu egiten da: +…+ (izen berezia); $…$ (extanjerismoak, erdarakadak); <…>(izen arruntak); etab.

3. Lematizazioa: hitz bakoitzari lema bat ezartzen zaio. Morfologiko eta gramatikalki sailkatzen dira eta kategoria zehaztu egiten da.

Deja un comentario

Archivado bajo lr0809

Web semantikoa

Metedata semantiko eta odontologikoak World Wide Webean sartzean datza, horrela, interneten hobekuntza eta gero eta gizaki gutxiagoren eskuhartzea ahalbidetuz. Tim Berners-Lee dugu ideia honen aitzindaria.

Web Semantikoaren osagaien artean hauek ditugu:

  • XML
  • XML Schema
  • RDF
  • RDF Schema
  • OWL

 

Web-ean:

Deja un comentario

Archivado bajo lr0809

«Thesaurus» / «Tesauro»

La palabra tesauro, derivado del neo latín que significa tesoro, se refiere a listado de palabras o términos empleados para representar conceptos. El termino proviene del latín thesaurus, el cual tiene su origen del griego clásico θησαυρός (thesauros), almacén, tesorería. Como neologismo del latín es acuñado a principios de la década de 1820.

Adquiere al menos dos significados relacionados, el primero en el campo de la literatura, el segundo en el campo de la Bibliotecología o Ciencias de la Información.

  • En el campo de la literatura, es una lista de palabras con significados similares sinónimos, habitualmente acompañada por otra lista de antónimos. Un ejemplo sería un tesauro dedicado a un campo especializado, que contiene la jerga que se emplea en dicho campo del conocimiento. En el mundo de habla inglesa, es clásico el Tesauro de Roget, cuya función es, según su autor, además de ayudar al escritor a encontrar la palabra que exprese mejor su pensamiento, también estimular su intelecto y sugerirle palabras o ideas relacionadas.
  • En el campo de la bibliotecología o de las Ciencias de la Información, un tesauro es una lista que contiene los «términos» empleados para representar los conceptos, temas o contenidos de los documentos, con miras a efectuar una normalización terminológica que permita mejorar el canal de acceso y comunicación entre los usuarios y las Unidades de Información (Entiéndase unidad de información como: biblioteca, archivo o centros de Documentación). Aunque en la práctica tradicional se habla de Uniterminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a terminos o descriptores compuestos, es decir, descriptores que se componen de dos o más palabras.

 

www.wikipedia.org

m_thesaurus450

Georges van Slype en Los lenguajes de indización, define un tesauro como «una lista estructurada de conceptos destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas».

 

 

 

 

 

 

Deja un comentario

Archivado bajo lr0809

Zer da «Corpus» bat?

Es un conjunto, normalmente muy amplio, de ejemplos reales de uso de una lengua. Estos ejemplos pueden ser textos (típicamente), o muestras orales (normalmente transcritas).

www.wikipedia.org

 

Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, etc.

http://fr.wikipedia.org

 

1 comentario

Archivado bajo lr0809