Sphinx IQ

Repérer les doublons

reperer-doublons

  • 1 Sélectionnez la variable dont vous souhaitez repérer et/ou supprimer les éventuels doublons, (vous pouvez également sélectionner plusieurs variables : par exemple « email » et « nom » si l’on considère que plusieurs personnes peuvent avoir la même adresse email)
  • 2 Choisissez le type d’action à effectuer, Repérer les doublons ou Supprimer les doublons,
  • 3 Déterminer la position des doublons trouvés.

Si vous avez choisi de déterminer la position des doublons par rapport à l’ordre d’enregistrement des observations, une variable IDEM sera créée, dans laquelle apparaîtra le numéro de la première observation identique par rapport à la variable sélectionnée. Une deuxième variable POSITION vous indiquera « l’état » de chaque observation. Cette variable a quatre valeurs possibles :

  • Unique : signifie que l’observation ne possède aucun doublon
  • Mini : signifie que l’observation est la première observation d’une liste de doublons
  • Inter : l’observation est un doublon intermédiaire de la liste de doublons
  • Maxi : l’observation est la dernière observation d’une liste de doublons

A noter que vous pouvez lister les doublons soit par l’ordre d’enregistrement des observations (pour trois doublons, l’observation qui contiendra la modalité MINI sera donc celle ayant été enregistrée en premier) soit par la valeur d’une variable à sélectionner, par exemple la variable CLE, ainsi les doublons seront classés selon la valeur de cette variable.

 

Retour vers : Dédoublonner