Zum Hauptinhalt springen

Challenges in web corpus construction for low-resource languages in a post-BootCaT world

Barbaresi, Adrien ; Interactions, Corpus, Apprentissages, Représentations (ICAR) ; et al.
In: Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of the 6th Language & Technology Conference, Less Resourced Languages special track 6th Language & Technology Conference, Less Resourced Languages special track 6th Language & Technology Conference, Less Resourced Languages special track, Dec 2013, Poznan, Poland. pp.69-73; (2013-12-07)
Online unknown

Titel:
Challenges in web corpus construction for low-resource languages in a post-BootCaT world
Autor/in / Beteiligte Person: Barbaresi, Adrien ; Interactions, Corpus, Apprentissages, Représentations (ICAR) ; École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS) ; This work has been partially funded by an internal grant of the FU Berlin, COW (COrpora from the Web) project at the German Grammar Department. ; Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR). ; École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
Link:
Quelle: Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of the 6th Language & Technology Conference, Less Resourced Languages special track 6th Language & Technology Conference, Less Resourced Languages special track 6th Language & Technology Conference, Less Resourced Languages special track, Dec 2013, Poznan, Poland. pp.69-73; (2013-12-07)
Veröffentlichung: HAL CCSD, 2013
Medientyp: unknown
Schlagwort:
  • [INFO.INFO-WB] Computer Science [cs]/Web
  • Indonesian language
  • [INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]
  • InformationSystems_INFORMATIONSTORAGEANDRETRIEVAL
  • [INFO.INFO-WB]Computer Science [cs]/Web
  • LRL
  • [SHS.LANGUE]Humanities and Social Sciences/Linguistics
  • web crawling
  • under-resourced languages
  • [SHS.LANGUE] Humanities and Social Sciences/Linguistics
  • [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
  • web corpus construction
Sonstiges:
  • Nachgewiesen in: OpenAIRE
  • Sprachen: English
  • File Description: application/pdf
  • Language: English
  • Rights: OPEN

Klicken Sie ein Format an und speichern Sie dann die Daten oder geben Sie eine Empfänger-Adresse ein und lassen Sie sich per Email zusenden.

oder
oder

Wählen Sie das für Sie passende Zitationsformat und kopieren Sie es dann in die Zwischenablage, lassen es sich per Mail zusenden oder speichern es als PDF-Datei.

oder
oder

Bitte prüfen Sie, ob die Zitation formal korrekt ist, bevor Sie sie in einer Arbeit verwenden. Benutzen Sie gegebenenfalls den "Exportieren"-Dialog, wenn Sie ein Literaturverwaltungsprogramm verwenden und die Zitat-Angaben selbst formatieren wollen.

xs 0 - 576
sm 576 - 768
md 768 - 992
lg 992 - 1200
xl 1200 - 1366
xxl 1366 -