Comment déterminer les valeurs aberrantes dans les statistiques
Publié le 17/09/2024
Extrait du document
«
Comment déterminer les valeurs aberrantes dans les statistiques ?
Les valeurs aberrantes sont des valeurs de données qui diffèrent considérablement de la
majorité d'un ensemble de données.
Ces valeurs ne correspondent pas à une tendance
générale présente dans les données.
Un examen attentif d'un ensemble de données pour
rechercher des valeurs aberrantes pose certaines difficultés.
Nous examinerons une mesure
spécifique qui nous donnera une norme objective de ce qui constitue une valeur aberrante.
Gamme interquartile
L’intervalle interquartile est ce que nous pouvons utiliser pour déterminer si une valeur
extrême est effectivement une valeur aberrante.
L'intervalle interquartile est basé sur une
partie du résumé à cinq chiffres d'un ensemble de données, à savoir le premier quartile et le
troisième quartile.
Le calcul de l'intervalle interquartile implique une seule opération
arithmétique.
Tout ce que nous avons à faire pour trouver l'intervalle interquartile est de
soustraire le premier quartile du troisième quartile.
La différence qui en résulte nous indique
à quel point la moitié médiane de nos données est répartie.
Déterminer les valeurs aberrantes
Multiplier l'intervalle interquartile (IQR) par 1,5 nous donnera un moyen de déterminer si une
certaine valeur est une valeur aberrante.
Si nous soustrayons 1,5 x IQR du premier quartile,
toutes les valeurs de données inférieures à ce nombre sont considérées comme des valeurs
aberrantes.
De même, si nous ajoutons 1,5 x IQR au troisième quartile, toutes les valeurs de
données supérieures à ce nombre sont considérées comme des valeurs aberrantes.
Fortes valeurs aberrantes
Certaines valeurs aberrantes montrent un écart extrême par rapport au reste d'un ensemble
de données.
Dans ces cas, nous pouvons suivre les étapes ci-dessus, en changeant uniquement
le nombre par lequel nous multiplions l'IQR et en définissant un certain type de valeur
aberrante.
Si nous soustrayons 3,0 x IQR du premier quartile, tout point inférieur à ce
nombre est appelé une valeur aberrante forte.
De la même manière, l'ajout de 3,0 x IQR au
troisième quartile nous permet de définir de fortes valeurs aberrantes en regardant des
points supérieurs à ce nombre.
Faibles valeurs aberrantes
Outre les valeurs aberrantes fortes, il existe une autre catégorie pour les valeurs
aberrantes.
Si une valeur de données est une valeur aberrante, mais pas une valeur aberrante
forte, nous disons que....
»
↓↓↓ APERÇU DU DOCUMENT ↓↓↓
Liens utiles
- KANT: «Le problème qui consiste à déterminer d'une façon sûre et générale quelle action peut favoriser le bonheur d'un être raisonnable est un problème tout à fait insoluble.»
- Spinoza: Le désir comme conatus, source de création et de valeurs
- « Savoir, c'est pouvoir », a dît François Bacon. « Pour pouvoir, il faut croire et vouloir », a dit un sage. Vous vous efforcerez de déterminer dans quelle mesure savoir, croire et vouloir sont nécessaires à l'homme pour pouvoir, et vous chercherez si l'
- Â partir de deux ou trois cas concrets d'émotion, de passion, ou de sentiment, tâchez de préciser le rôle du physiologique, du psychologique et du social dans la vie affective et de déterminer quel est le facteur essentiel de l'affectivité. ?
- Une culture peut elle etre porteuse de valeurs universelles ?