What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics?
In: Computational Linguistics and Intelligent Text Processing : 13th International Conference, CICLing 2012, New Delhi, India, March 11-17, 2012
Online
Konferenz
Zugriff:
Edited by Alexander Gelbukh. - 1st ed. 2012. Édition papier : ISBN 9783642286032. Édition numérique: ISBN 978-3-642-28604-9. DOI : 10.1007/978-3-642-28604-9. This two-volume set, consisting of LNCS 7181 and LNCS 7182, constitutes the thoroughly refereed proceedings of the 13th International Conference on Computer Linguistics and Intelligent Processing, held in New Delhi, India, in March 2012. ; International audience ; In this paper, we study the use of data mining techniques for stylistic analysis, from a linguistic point of view, by considering emerging sequential patterns. First, we show that mining sequential patterns of words with gap constraints gives new relevant linguistic patterns with respect to patterns built on n-grams. Then, we investigate how sequential patterns of itemsets can provide more generic linguistic patterns. We validate our approach from a linguistic point of view by conducting experiments on three corpora of various types of French texts (Poetry, Letters, and Fictions). By considering more particularly poetic texts, we show that characteristic linguistic patterns can be identified using data mining techniques. We also discuss how to improve our proposed approach so that it can be used more efficiently for linguistic analyses.
Titel: |
What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics?
|
---|---|
Autor/in / Beteiligte Person: | Quiniou, Solen ; Cellier, Peggy ; Charnois, Thierry ; Legallois, Dominique ; Centre de recherche inter-langues sur la signification en contexte (CRISCO) ; Université de Caen Normandie (UNICAEN) ; Normandie Université (NU)-Normandie Université (NU) ; Logical Information Systems (LIS) ; GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7) ; Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS) ; Equipe CODAG - Laboratoire GREYC - UMR6072 ; Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC) ; Normandie Université (NU)-Normandie Université (NU)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN) ; Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-Université de Caen Normandie (UNICAEN) ; Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS) |
Link: | |
Zeitschrift: | Computational Linguistics and Intelligent Text Processing : 13th International Conference, CICLing 2012, New Delhi, India, March 11-17, 2012 |
Veröffentlichung: | HAL CCSD ; Springer Berlin Heidelberg, 2012 |
Medientyp: | Konferenz |
DOI: | 10.1007/978-3-642-28604-9_14 |
Schlagwort: |
|
Sonstiges: |
|