Calculer une variable
Cet assistant permet de mettre en place un calcul (nouvelle variable calculée) sur une/des variable(s) préexistante(s) dans l’enquête. Pour calculer une variable, procédez ainsi :
- Depuis l’onglet Données, cliquez sur Calculer

L’assistant vous propose de sélectionner une des six fonctions de calcul :
- Age : permet de calculer la différence entre une variable de type date (année de naissance) et la date courante (date du jour).
- Durée : permet de calculer la différence entre deux variables de type date.
- Somme : pour calculer la somme des valeurs effectives de plusieurs variables numériques, ou échelles (pour les variables échelles, il faut préalablement affecter un barème).
- Moyenne : pour calculer la moyenne des valeurs effectives de plusieurs variables numériques, ou échelles (traiter les échelles en nombre).
- Ecart-type : permet de calculer l’écart-type des valeurs effectives de plusieurs variables numériques, ou échelles (pour les variables échelles, il faut préalablement affecter un barème).
- Variable centrée réduite : pour calculer une variable indépendante de l’unité, avec la même moyenne et la même dispersion.
Il est important de noter que la variable créée ne garde pas en mémoire le calcul. De ce fait, en cas d’ajout d’observations après création de la variable, celle-ci ne sera pas mise à jour, et les calculs ne seront pas effectués sur les nouvelles réponses.
Dans cet exemple, nous souhaitons calculer le budget moyen de boissons consommées, tous types de boissons confondus.
Transformer une variable
La transformation des variables propose plusieurs possibilités : gérer les modalités d'une question fermée, créer des classes pour catégoriser les questions numériques, regrouper des codes ou des dates, extraire les informations contenues dans les questions texte, ou changer le type de la variable. Pour transformer une variable, procédez comme suit :
- Dans l’onglet Données, cliquez sur Transformer
Vous arrivez sur un assistant qui, en fonction du type de la variable sélectionnée, vous permet de choisir le type de transformation que vous désirez effectuer.
La transformation Changer le type est la seule fonction sélectionnable pour tous les types de variables. Elle permet de modifier le type d’une variable, par exemple changer une question fermée unique en question fermée multiple. Pour les autres types de transformation :
- Gérer les modalités : pour les variables de type fermé et échelle. Permet de modifier, ordonner, regrouper ou supprimer des modalités.
- Mettre les nombres en classes : pour les variables numériques. Permet de créer des classes d’intervalles. Par exemple, à partir d’une variable numérique « Age » vous allez créer les classes « Jeunes » pour les moins de 18 ans, « Jeunes actifs » pour les 18-25 ans etc…
- Regrouper les codes : pour les variables codes. Permet par exemple pour une variable de type code postal, de regrouper ces codes selon le nom de leur région respective.
- Extraire de l’information des textes : pour les variables textes. Permet d’identifier les thèmes principaux d’une variable texte (à l’aide d’un dictionnaire), de créer des variables lemmatisées (chaque mot est remplacé par sa racine) et de mesurer la richesse, la banalité et la longueur des mots de cette variable.
Les différents types de transformations sont détaillés plus bas, dans la partie Modes opératoires.
Dans cet exemple ci-dessus, nous souhaitons transformer une variable fermée unique (une seule réponse possible) en fermée multiple (plusieurs réponses possibles), nous indiquons pour cela le nombre de réponses possibles de la variable transformée (6).
Combiner des variables
Cet assistant permet de créer une nouvelle variable à partir d’une combinaison de plusieurs variables choisies. Pour accéder à cet assistant, procédez ainsi :
- Depuis l’onglet Données, cliquez sur Combiner
Vous arrivez sur une boîte de dialogue dans laquelle vous pouvez sélectionner un type de combinaison de variables parmi les quatre premières propositions :
- Créer une variable « profils » : vous permet de créer une variable fermée dont les modalités correspondent à des conditions fixées par l’utilisateur (strate ou profil). Ainsi les strates déjà définies apparaissent. La nouvelle variable fermée est définie par les modalités sélectionnées parmi les strates, si nécessaire on créera un nouveau profil pour créer une autre modalité.
- Fusionner plusieurs variables fermées : plusieurs types de fusion vous sont ensuite proposés :
- Fusion simple : les modalités de la nouvelle variable fermée multiple sont toutes celles des variables sélectionnées.
- Fusion composée : les modalités de la nouvelle variable fermée multiple sont les modalités différentes des variables sélectionnées.
- Fusion croisée : les modalités de la nouvelle variable fermée unique croisent les modalités des variables sélectionnées.
- Fusion multiple : les modalités de la nouvelle variable fermée multiple sont les noms des variables sélectionnées. - Transposer plusieurs variables fermées : créer un ensemble de variables ayant pour nom les modalités des variables sélectionnées.
- Concaténer les textes des réponses : créer une variable texte qui rassemble les contenus des réponses des variables sélectionnées.
Toutes ces combinaisons sont détaillées plus bas dans la partie Modes opératoires
Dédoublonner
Cette opération permet de repérer les observations identiques sur une variable donnée, et donne la possibilité de conserver une observation unique en se basant sur l'ordre d'enregistrement.
Le repérage des doublons crée une variable appelée POSITION qui permet de catégoriser les observations. Elle a quatre valeurs possibles : Unique pour indiquer les observations qui ne sont pas en double, Mini, Maxi et éventuellement Inter pour désigner les observations qui ont des doublons. La suppression des observations s’effectue par élimination des premières ou dernières réponses selon le choix de l'utilisateur.
Pour dédoublonner, procédez ainsi :
- Dans l’onglet Données, cliquez sur Dédoublonner
Vous arrivez sur une boîte de dialogue vous proposant deux types d’actions, repérer les doublons ou supprimer les doublons.
Repérer les doublons
1 Sélectionnez la variable dont vous souhaitez repérer et/ou supprimer les éventuels doublons, (vous pouvez également sélectionner plusieurs variables : par exemple « email » et « nom » si l’on considère que plusieurs personnes peuvent avoir la même adresse email)
2 Choisissez le type d’action à effectuer, Repérer les doublons ou Supprimer les doublons,
3 Déterminer la position des doublons trouvés.
Si vous avez choisi de déterminer la position des doublons par rapport à l’ordre d’enregistrement des observations, une variable IDEM sera créée, dans laquelle apparaîtra le numéro de la première observation identique par rapport à la variable sélectionnée. Une deuxième variable POSITION vous indiquera « l’état » de chaque observation. Cette variable a quatre valeurs possibles :
- Unique : signifie que l’observation ne possède aucun doublon
- Mini : signifie que l’observation est la première observation d’une liste de doublons
- Inter : l’observation est un doublon intermédiaire de la liste de doublons
- Maxi : l’observation est la dernière observation d’une liste de doublons
A noter que vous pouvez lister les doublons soit par l’ordre d’enregistrement des observations (pour trois doublons, l’observation qui contiendra la modalité MINI sera donc celle ayant été enregistrée en premier) soit par la valeur d’une variable à sélectionner, par exemple la variable CLE, ainsi les doublons seront classés selon la valeur de cette variable.
Supprimer les doublons
Dans notre exemple, nous souhaitons démarrer une phase d’e-mailing. Cependant, il est possible que notre jeu de données contienne plusieurs fois la même adresse e-mail ce qui engendrerait plusieurs envois à la même personne. Afin d’éviter cela, nous allons supprimer tous les doublons sur la variable email afin de s’assurer que notre jeu de données contient une seule fois chaque email, et ainsi que chaque personne soit consultée une seule fois.
Dans le cas de deux doublons, il est possible soit de conserver la première réponse (Mini), soit la dernière (Maxi) lors de la suppression des doublons. Lorsque vous cliquez sur ok, cela générera un nouveau fichier .sphx afin de ne pas écraser vos données actuelles. Dans le cas ou il existe au moins trois doublons (le même email est par exemple présent trois fois dans la base de données), alors il est nécessaire de supprimer toutes les observations mentionnées comme « Inter » et de supprimer l’observation « Mini » ou « Maxi ».