Analyse textes courts
Posted: Thu Feb 06, 2020 11:11 am
Bonjour,
Pour les besoins de ma recherche, j'ai récemment bricolé un script qui découpe une retranscription de discussion en fichiers indépendants pour chaque prise de parole et les formate pour analyse en fonction du locuteur.ice.
Du coup, je me retrouve avec un très grand nombre de fichiers de petite taille, et ces fichiers ne sont pas forcément très "écrits" : il s'agit de prises de parole d'enfants, la syntaxe et la ponctuation sont un peu aléatoires (et je sais que Prospéro est sensible aux points).
J'ai du mal à évaluer l'impact que peut avoir un tel matériau sur la qualité de l'analyse par Prospéro. Est-ce que cela va poser des problèmes ?
Cordialement,
Nicolas Duval-Valachs
Pour les besoins de ma recherche, j'ai récemment bricolé un script qui découpe une retranscription de discussion en fichiers indépendants pour chaque prise de parole et les formate pour analyse en fonction du locuteur.ice.
Du coup, je me retrouve avec un très grand nombre de fichiers de petite taille, et ces fichiers ne sont pas forcément très "écrits" : il s'agit de prises de parole d'enfants, la syntaxe et la ponctuation sont un peu aléatoires (et je sais que Prospéro est sensible aux points).
J'ai du mal à évaluer l'impact que peut avoir un tel matériau sur la qualité de l'analyse par Prospéro. Est-ce que cela va poser des problèmes ?
Cordialement,
Nicolas Duval-Valachs