Table des matières

Visualisation des différentes tables

  1. Table Disponibilité Alimentaire
  2. Table Population
  3. Table Valeur Macro

Nettoyage des différentes tables

  1. Nettoyage Disponibilité Alimentaire
  2. Nettoyage Population
  3. Nettoyage Valeur Macro
  4. Merge et Nettoyage de la table résultante

Analyse exploratoire de données

  1. Classification ascendante hiérarchique, Dendrogramme
  2. Méthode K-Means
  3. Analyse en Composantes Principales, ACP
  4. Heatmap

Conclusion

⬆️

Visualisation des différentes tables

⬆️

1/ Table Disponibilité Alimentaire

Remarque: Il y a: -> 176600 individus -> 14 variables

⬆️

2/ Table Population

Remarque: Il y a: -> 4411 individus -> 15 variables

⬆️

3/ Table Valeur Macro

Remarque: Il y a: -> 844 individus -> 15 variables

⬆️

Nettoyage des différentes tables

⬆️

1/ Nettoyage Disponibilité Alimentaire

Remarque: Seule une année est disponible pour cette table

⬆️

2/ Nettoyage Population

⬆️

3/ Nettoyage Valeur Macro

⬆️

4/ Merge et Nettoyage de la table résultante

Objectif: construire une table de données pour la viande de Volailles
Ajout de la 3ème table

⬆️

Analyse exploratoire de données

Définition des Fonctions d'affichage:

⬆️

1/ Classification ascendante hiérarchique, Dendrogramme

Identifions le cluster de la France

Le Cluster est "3"
Vérifions les Pays appartenant à ce Cluster:

⬆️

2/ Méthode K-Means

Determinons le nombre de cluster par la méthode Elbow

D'après la méthode du coude, on remarque que la valeur 3 est la valeur la plus optimale

⬆️

3/ Analyse en Composantes Principales, ACP

Remarque: par la méthode du coude, on remarque qu'à partir du rang 4, le pourcentage d’inertie diminue beaucoup plus lentement
Remarque: Le premier plan factoriel représente 34.7 + 23.8 = 58.50% de l'inertie total 2 axes se démarquent de ce plan: Démographie F1 ("Population", "Production") et Richesse F2 ("PIB", "Importation") tandis que "croissance annuelle" est mal représenté sur le cercle

⬆️

4/ Heatmap

⬆️

Conclusion

A l'aide des différentes méthodes, on a pu déterminer les différents clusters et composantes de cette analyse.
Trois clusters se distinguent représentés par deux axes principales: la Richesse et la Démographie.
La France qui appartient au cluster n°3, présente certaines caractéristiques similaires à d'autres Pays de ce cluster.
Ces Pays pourraient être des candidats sérieux pour notre développement à l'International (Voir table ci-dessous).
En enrichissant nos données d'autres variables (modèle PESTEL), il serait possible d'affiner notre analyse.

Affinons notre cluster en sélectionnant:

La liste des 9 Pays ci-dessous présente la liste des Pays candidats à notre développement à l'International