Informatique linguistique

Les textes, les documents ou le discours sont traités sous l'angle documentaire (pour y trouver des informations)
"de l'extérieur", quand on traite des collections de textes (fils de presse, bibliothèques numériques)
"de l'intérieur", quand on traite des textes un par un sous l'angle logique, informatif, (macro-)syntaxique, stylistique…

En informatique linguistique, l'approche est soit ascendante (par exemple des mots vers la phrase), soit descendante (par exemple de la phrase vers les mots). Notre approche en linguistique textuelle est descendante (du document vers ses parties), relative et guidée par un modèle de référence (variable en fonction de l'application visée).

Il est question

De la recherche d'information via l'informatique linguistique et la fouille de données textuelles ici

Des logiciels d'étude, des sorties de logiciels d'étude

Des algorithmes (en chantier) ou du génie linguistique et du génie logiciel

Chemins de traverse

Pour un parcours guidé du site à travers mes publications, suivez la chouette perchée.

Pour un parcours guidé de mes publications orienté par un angle de vue (langue, type de texte etc) suivez la chouette en vol.

Pour un parcours guidé du matériau de la recherche à travers le corpus et des exemples, suivez la tortue.

De la recherche d'information via l'informatique linguistique

Multinguisme et traitements de l'écrit à l'échelle du texte

Lucas, Nadine & Emmanuel Giguet (2005) "UniTHEM, un exemple de traitement linguistique à couverture multilingue" Cide 8 Conférence internationale sur le document électronique, Beyrouth 25-28 mai 2005. Zreik, K. (ed.) Paris, Europia, pp. 115-132.

Lucas, Nadine & Emmanuel Giguet (2004) "Détection automatique de la citation et du discours rapporté dans les textes informatifs" In Le discours rapporté dans tous ses états : Question de frontières? In J. M. López-Muñoz, S. Marnette, L. Rosier, (eds.). Paris, l’Harmattan, 2004 pp. 410-418.

Ferrari, S., Giguet, E., Lucas, N. & Vergne, J. (2000) "Projet LINGUIX, recherche d'informations et traitements linguistiques: le cas des métaphores", In: Le document électronique dynamique: Actes du 3ème colloque international sur le document électronique (CIDE 2000 Lyon, 4-6 juillet) ed. Gaio et Trupin, Caen, 2000. pp. 279-293.

Multinguisme et exploration d'Internet, Unicode

Stienne N. & Lucas N. (2003) "Exploitation d’information disponible sur Internet et génération d'un portail multilingue sur la thématique cinéma", Conférence internationale sur le document électronique Cide 6, 24-26 novembre 2003, Caen.

Giguet, Emmanuel & Lucas, Nadine (2002) "Intégration d'Unicode - conception d'un agent de recherche d'information sur Internet". Document numérique, n° thématique "Unicode, écriture du monde?" sous la dir de A. Jacques et H. Hudrisier. Vol. 6 n° 3-4. pp. 225-236. (E Giguet, N Lucas - irisa.fr )

Mise en forme matérielle

Giguet, Emmanuel, Nadine Lucas & Grégoire Cousin (2000) "Document structure identification as a means for relevant indexation", Proceedings CicLing-2000 (Conference on Intelligent Text processing and Computational Linguistics) ed. by A. Gelbukh, Mexico, Instituto politécnico nacional, 2000. pp. 415-428.

Nouvelles formes de la communication écrite

Lucas, Nadine, Mohamed Sidir & Emmanuel Giguet (2006) "Analyse de forums dans la formation à distance." Cide 9 Conférence internationale sur le document électronique, Fribourg 18-20 septembre 2006. Paris : Europia. pp. 169-180.

De la recherche d'information via la fouille de données textuelles

Zerida, Nadia, Nadine Lucas & Bruno Crémilleux (2006) "Combining Linguistic and Structural Descriptors for Mining Biomedical Literature." ACM Symposium on Document Engineering 10-13 Octobre Amsterdam. ACM, 2006.

Zerida N., Lucas N., & Crémilleux B. (2006) Combinaison de descripteurs linguistiques et de structure pour la fouille d’articles biomédicaux, International Symposium on Discourse and Document, Caen, 15-17 Juin 2006. Schedae 9-1 Presses universitaires de Caen, pp. 69-78.

Lucas, N. & Crémilleux, B. (2004) "Fouille de textes hiérarchisée, appliquée à la détection de fautes", Document numérique vol. 8 (3) (n° thématique Organisation du document et Fouille de textes). pp. 107-133.

Turmel, L., Lucas N. & Crémilleux B. (2003) "Extraction d’associations pour la caractérisation de segments de textes en anglais avec et sans faute", Conférence internationale sur le document électronique Cide 6, 24-26 novembre Caen 2003.

Lucas, N., Crémilleux B. & Turmel L. (2003) Signalling well-written academic articles in an English corpus by text-mining techniques. UCREL technical papers Vol. 16 special issue Proceedings Corpus Linguistics 2003, Lancaster University. pp. 465-474.

suivre parcours lectures aller au parcours matériau

aller à la page linguistique retour à la page recherche retour à la page d'orientation retour à la page d'accueil