Preview only show first 10 pages with watermark. For full document please download

Gc1 9elkhaldi Gc1 16hafid

Analyse multidimensionnelle

   EMBED


Share

Transcript

Compte Rendue de TP : Analyse multidimensionnelle avec SPSS Résumé : Il s’agit de l’analyse multidimensionnelle appliquée avec le logiciel SPSS sur 2 bases de données, dans un premier temps on va étudier avec l’ACP les caractéristiques d’un ensemble de modèles de voiture, puis dans un deuxième temps on va étudier avec l’AFC les correspondances entre deux variables qualitatives (Les Couleurs de Yeux, et les Couleurs de Cheveux). DATE : 15-01-2018 Réalisée par : Encadré par : -EL KHALDI Imane 2GC1 N°09 -Professeur : EL KHATRI Saïd -HAFID Anas 2GC1 N°16 EL KHALDI IMANE - HAFID ANAS Page 1 TP1 : Analyse des composantes principales L’objectif d’utiliser l’ACP dans cette exemple  : C’est pour permettre aux fabricants de savoir sa position dans le marché et partant, avoir une idée sur les performances à améliorer dans son modèle. Les données sont-t-ils factorisables ? Matrice de corrélation Cylindrée Puissance Vitesse Poids Longueur Largeur Cylindrée 1,000 ,861 ,693 ,905 ,864 ,709 Puissance ,861 1,000 ,894 ,746 ,689 ,552 Vitesse ,693 ,894 1,000 ,491 ,532 ,363 Poids ,905 ,746 ,491 1,000 ,917 ,791 Longueur ,864 ,689 ,532 ,917 1,000 ,864 Largeur ,709 ,552 ,363 ,791 ,864 1,000 Corrélation 1- Plusieurs variables sont corrélées (>0.5). Indice KMO et test de Bartlett Mesure de précision de l'échantillonnage de Kaiser -MeyerOlkin. Khi-deux approximé Test de sphéricité de Bartlett ddl ,705 178,583 15 Signification de Bartlett ,000 2- 0 .71/p=17 %, c’està-dire uniquement le 1er axe (77.6% >17%), pour le 2éme axe (15%<17%). 2-si on fixe une variance résiduelle de 5% on retiendra 3 axes CP1, CP2 et CP3 qui donnent une variance expliquée de 96%>95%. 3-Critére de KAISSER : (applicable car les variables sont réduites) on retient les CP tel que λk >1, i.e. : on ne retient que la première CP. 4-Critére de CATTELL : d’après le graphe d’évolution des valeurs propres ci-dessus, on retient les 2  premiers axes. C /C : les 2 premiers axes expliquent 92.854% de l’inertie totale, 2 axes suffisent. Interprétation des axes : Figure 1 : Plan de projection des variables 1-2 EL KHALDI IMANE - HAFID ANAS Page 4 Figure 2: Plan de projection des variables 2-3 L’axe 1 est corrélé positivement avec toutes les variables initiales, donc l’axe 1 explique l’appréciation générale. L’axe 2 explique une opposition entre : - Un groupe de variables avec lesquelles la corrélation est positive qui sont : vitesse, puissance et cylindrée qu’on peut résumer en performance technique du moteur. Un autre groupe de variables avec lesquelles la corrélation est négative qui sont : Poids, largeur et longueur, qu’on peut résumer en caractéristiques physiques (dimensions de la voiture). L’axe 3 représente une opposition entre Largeur et Poids, mais ceci porte peu d’information, car  la variance expliquée par cet axe est faible. Le meilleur plan d’ajustement  : Le plan d’ajustement 1-2 explique 92,854 % de l’inertie totale, tandis que le plan 1-3 explique 81.607% et le plan 2-3 n’explique que 19.261%. EL KHALDI IMANE - HAFID ANAS Page 5 Donc le meilleur plan d’ajustement est le plan 1-2, expliquant ainsi 92.854% de l’inertie totale. Vérification de la cohérence des valeurs de la corrélation entre les variables et la projection plane de ces derniers sur le plan 1-2 : -(On a pas bien compris la question)- Les variables Longueur et Poids sont corrélées car l’angle entre les deux est presque nul. Les variables Largeur et Vitesse ne sont pas corrélées car l’angle entre eux tend vers pi/2. Interprétation de la position des voitures sur le plan 1-2 : On constate 5 zones : - La zone centrale : formée par les voitures à aspect général moyenne et performance moteur et dimension équilibrés EL KHALDI IMANE - HAFID ANAS Page 6 - La zone Nord-Est : formée par les voitures à aspect général bien, performance moteur bonne et de petite dimension La zone Nord-Ouest : formée par les voitures à aspect général mauvais, performance moteur bonne et de petite dimension. La zone Sud-Est : formée par les voitures à aspect général bien, performance moteur mauvaise et de grande dimension. La zone Sud-Ouest : formée par les voitures à aspect général mauvais, performance moteur mauvaise et de grande dimension. Remarque : - - Cette classification permet au producteur de faire une étude de marché selon les préférences du consommateur cible. Par exemple : Les habitant des pays de golf ont tendance à préférer des voiture esthétiquement distinguée et ne s’intéressent pas beaucoup aux performances techniques. Par contre les Allemands préférant des voitures à haute performances techniques et ne se soucient peu des dimensions. Cette étude permet également de tirer des informations sur les voitures à caractéristiques semblables. Graphiquement, elles se rapprochent comme c’est le cas par exemple de Renault 21 et Peugeot 405. TP2 : Analyse Factorielle des correspondances : Y-a-t-il un lien entre la couleur des cheveux et la couleur des yeux ? Récapitulatif  Dimensio n Valeur Inertie Khi-deux Sig. Proportion d'inertie singulière Valeur singulière de confiance Expliqué Cumulé Ecart-type Corrélation 2 1 ,457 ,209 ,894 ,894 ,032 2 ,149 ,022 ,095 ,989 ,042 3 ,051 ,003 ,011 1,000 1,000 1,000 Total ,234 138,290 a ,000   ,134 a. 9 degrés de liberté On à un degré de signification α tend vers 0, on peut donc accepter que D² soit non nulle, donc la liaison entre Couleur de Cheveux et Couleur des Yeux est significative au risque α. On est loin de l’indépendance. EL KHALDI IMANE - HAFID ANAS Page 7 Le nombre d’axe factoriels qu’on aura au maximum  : C’est  = min( − 1 ;  − 1) Avec p=n=4 nombre de modalité de chacune des variables. On aura donc au maximum 3 axes factoriels. Quel sont les axes à retenir ? On va retenir les deux premiers axes factoriels, car donne 98.9% de l’inertie expliquée. L’axe 3 ne donne que 1.1% de l’inertie expliquée. Représentation des différentes modalités dans le plan 1-2 : Pour la Variable Couleur des C heveux : Caractéristiques des points lignes cheveux Masse Score dans la Inertie Contribution dimension 1 2 De point à inertie de De dimension à inertie de point dimension 1 2 1 2 Total Noir ,182 -,746 ,556 ,055 ,222 ,379 ,838 ,152 ,990 Châtain ,483 -,219 -,085 ,012 ,051 ,023 ,864 ,042 ,906 Roux ,120 -,192 -,828 ,015 ,010 ,551 ,133 ,812 ,945 Blond ,215 1,236 ,180 ,151 ,717 ,047 ,993 ,007 1,000 ,234 1,000 1,000 Total actif 1,000 a. Normalisation principale symétrique L’information qui sort du plan est très faible, les cosinus carrés sont tous >0.5, toutes les modalités de la variable couleur des cheveux sont bien représentées dans le plan 1-2. Pour la Vari able Couleur des Yeux : Caractéristiques des points colonnes yeux Masse Score dans la Inertie Contribution dimension EL KHALDI IMANE - HAFID ANAS Page 8 1 2 De point à inertie de De dimension à inertie de dimension point 1 2 1 2 Total Marron ,372 -,728 ,229 ,093 ,431 ,130 ,967 ,031 ,998 Noisette ,157 -,315 -,434 ,013 ,034 ,198 ,542 ,336 ,879 Vert ,108 ,239 -,878 ,016 ,014 ,559 ,176 ,773 ,948 Bleu ,363 ,810 ,215 ,111 ,521 ,112 ,977 ,022 1,000 ,234 1,000 1,000 Total actif 1,000 a. Normalisation principale symétrique L’information qui sort du plan est très faible, les cosinus carrés sont tous >0.5, toutes les modalités de la variable couleur des yeux sont bien représentées dans le plan 1-2. Les couleurs des cheveux qui contribuent bien à l’axe 1  : Blond contribue avec 71.7% et noir avec 22.2%. Les couleurs des yeux qui contribuent bien à l’axe 1  : Bleu contribue avec 52.1% et Marron avec 43.1%. Les couleurs des cheveux qui contribuent bien à l’axe 2  : Roux contribue avec 55.1% et noir avec 37.9%. Les couleurs des yeux qui contribuent bien à l’axe 2  : Vert contribue avec 55.9%, Noisette avec 19.8% et Marron avec 13% EL KHALDI IMANE - HAFID ANAS Page 9 Le lien entre la couleur des cheveux et la couleur des yeux : Sur l’axe 1 (explique 89.4% de la liaison) qui représente le maximum d’inertie, on observe un lien fort entre Blond et Bleu , puis entre Noir et Marron avec une contribution moindre. Sur l’axe 2 (explique 9.5% de la liaison), on observe un lien fort entre Roux et Vert, puis entre Noir et Marron avec une contribution moindre. Remarque : Ces résultats sont tirés du tableau de contribution de chaque point à l’inertie d’une dimension donnée, mais on peut tout de même tirer la même information à partir de graphe. On constate également en étudiant les angles entre l es modalités des variables Couleur de Yeux et Couleur de Cheveux que : - Les gens qui ont des yeux bleus ont tendance à avoir des cheveux blonds. EL KHALDI IMANE - HAFID ANAS Page 10 - Les gens qui ont des yeux marron ont tendance à avoir des cheveux noirs. - Les gens qui ont des yeux noisette ont tendance à avoir des cheveux roux. EL KHALDI IMANE - HAFID ANAS Page 11