1 Méthode

1.1 5 étapes

  1. Hypothèse
  2. Le tableau de données
  3. La significativité de la relation : existe-t-elle ?
  4. L’intensité
  5. Les écarts au modèle
  6. Explication géographique

1.2 3 combinaisons

1.2.1 deux types de variables

  1. continu (quantitatif)
  2. classe ou catégorie (qualitatif)

Comprendre la différence entre l’histogramme et le graphique à barres, c’est distinguer entre les deux types de variables.

data <- read.csv2("data/fraisPersonnel.csv", fileEncoding = "UTF-8", dec = ".")
par(mfrow = c(2,1))
par(mar = c(4,4,2,2))
hist(data$montant.par.hbt, main = "fréquence absolue", xlab = "classes", ylab="effectif" , border = NA)
par(mar = c(8,4,2,2))
barplot(data$montant.par.hbt, names.arg= data$Nom,main = "distribution", xlab = "", ylab = "frais personnel (€ / hbt", las=2, cex.names =  0.6, border = NA)

1.2.2 Trois méthodes

  • Classe / catégorie -> Khi2

  • Continu -> Régression Correlation

  • Continu et classe / catégorie -> Analyse de variance

2 Application : prendre 2 variables, donner l’hypothèse et la méthode

Pour chaque exemple, justifier le traitement qu’il faudra utiliser et l’hypothèse de départ qu’il faudra mettre en doute.

2.1 exemple de l’exemple

hypothèse : groupe d’étudiants et réussite à l’examen (oui / non).

hypothèse : nombre de questions en cours et notes à l’examen

hypothèse : groupe d’éudiants et notes finales

2.2 En guise d’introduction pour le khi 2

## Warning in read.table("data/exKHI2.csv", sep = ",", row.names = 1, col.names =
## c("oui", : l'entête et 'col.names' sont de longueurs différentes
oui non
groupe1 15 15
groupe2 27 3
groupe3 5 25
## 
##  Pearson's Chi-squared test
## 
## data:  data
## X-squared = 32.42, df = 2, p-value = 9.124e-08

Il existe un lien entre groupe et résultat, puisque p-value est toute petite.

Certes… mais comment ?













L5GEABIM Analyses bivariées et multivariées