Twitter comme « corpus » en sciences du langage : questions méthodologiques et pistes de recherche

Résumé : L’avènement des corpus et des travaux sur corpus en sciences du langage ont amené la discipline à décrire des ressources sans cesse diversifiées, qu’il s’agisse de corpus de référence ou ad hoc. Les formes de communication médiées par ordinateur (computer-mediated communication) n’échappent pas cette tendance et ce d’autant plus qu’il s’agit de données numériques natives. Parmi les différents types recensés à ce jour, cette communication s’intéressera spécifiquement à Twitter et à ses potentialités pour la recherche linguistique. A partir d’un corpus compilé à la Maison des Sciences de l’Homme de Dijon – mais aussi des autres initiatives documentées sur la plateforme Ortolang – il s’agira de s’intéresser tout à la fois aux défis que représente cette ressource pour le chercheur linguistique et aux potentialités qu’elle recèle. En termes de défis, on s’arrêtera sur les aspects techniques (comment collecter ces données sans sombrer dans l’amateurisme ?) et surtout méthodologiques (comment les annoter et les interroger ?). La question du statut juridique des données compilées, bien qu’importante, ne sera pas thématisée de façon explicite dans la mesure où des protocoles bien précis existent désormais. Au niveau des potentialités, trois problématiques linguistiques seront abordées pour leur « rendement » à partir d’un corpus Twitter : (i)la question du rapport écrit/oral réinvesti en termes de proximité/distance ; (ii)la description des échanges Twitter en termes interactionnels ; (iii)les questions de linéarité et de textualité des twitts.
Type de document :
Cours
Doctorat. Séminaire du professeur Samir Bajric, Dijon, France. 2017
Liste complète des métadonnées

https://halshs.archives-ouvertes.fr/cel-01614435
Contributeur : Laurent Gautier <>
Soumis le : mardi 10 octobre 2017 - 21:26:14
Dernière modification le : jeudi 12 octobre 2017 - 01:14:17

Fichier

Presentation_séminaire_Bajri...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : cel-01614435, version 1

Collections

TIL

Citation

Laurent Gautier. Twitter comme « corpus » en sciences du langage : questions méthodologiques et pistes de recherche . Doctorat. Séminaire du professeur Samir Bajric, Dijon, France. 2017. 〈cel-01614435〉

Partager

Métriques

Consultations de la notice

66

Téléchargements de fichiers

47