Extraire de l’information des textes
Rappel : La transformation Extraire de l’information des textes est possible pour les variables de type texte.
Choisissez le type de variable que vous désirez créer : lexicale, lemmatisée, analyse via un dictionnaire thématique.
Variable lexicale
Vous pouvez générer différents types de variables qui auront pour modalités possibles les mots choisis (à séparer par des « ; »). Dans notre exemple, nous choisissons de considérer les trois mots que nous savons les plus souvent cités (santé, vie et bien-être) à la question « Picture_comments » qui demande aux répondants de citer les mots qui leur viennent à l’esprit à la vue du mur d’images.
Les mesures lexicales vont créer des variables permettant d’analyser le contenu de votre variable texte. La longueur correspond au nombre de mots de la réponse (si une réponse est « la vie est belle », la longueur sera de 4, si l’on prend en compte les mots outils), la richesse est le nombre de mots différents dans une réponse, la banalité est une moyenne de fréquence des mots d’une réponse (plus les mots sont fréquents plus la banalité sera forte), enfin l’intensité donne le « taux de présence » des mots choisis (dans notre cas santé, vie et bien être) dans une réponse. Par exemple si une réponse est « La vie », l’intensité du mot « vie » sera de 50%, car la réponse contient deux mots dont « Vie » (si l’on prend en compte les mots outils).
Variable lemmatisée
Cet assistant permet de créer :
- des variables textes dont les contenus seront les textes des variables sélectionnées sous leur forme lemmatisée (infinitif, masculin, singulier) : exemple, « je bois » devient « je boire ».
- plusieurs variables textes pour chaque catégorie grammaticale de la variable sélectionnée (verbes, noms, adjectifs) : exemple, « je bois de l’eau », une variable Verbe va être créé contenant la valeur « boire » et une variable Nom contenant la valeur « eau ».
Analyse thématique
A partir d’un dictionnaire de mots rangés par thèmes, à charger en cliquant sur Choisir une thématique, cet assistant va créer une variable ordonnée des thèmes les plus cités ainsi que des variables fermées correspondant à chacun des thèmes.
Avant de terminer, sélectionnez l’emplacement d’insertion des nouvelles variables.