Aller au contenu principal

Données ouvertes (Open Data)

👨‍🏫 Introduction

Objectif

Découvrir ce que sont les données ouvertes (Open Data) et manipuler des données à l'aide d'un tableur.

Préparation

Afin de ne pas mélanger les productions entre les travaux pratiques, mettre à jour les dossiers SNT selon l'ordinateur utilisé :

💻 Ordinateur portable
  1. Lancer
  2. Se rendre dans le dossier Mes documents
  3. Créer le dossier SNT s'il n'existe pas déjà (clic droit, Nouveau > Dossier)
  4. Dans le dossier SNT, créer le dossier Données structurées
  5. Dans le dossier Données structurées, créer le dossier TP1 - Données ouvertes
🖥 Ordinateur fixe des salles informatiques
  1. Depuis le bureau, cliquer sur l'icône intitulée Zone personnelle
  2. Créer le dossier SNT s'il n'existe pas déjà (clic droit, Nouveau > Dossier)
  3. Dans le dossier SNT, créer le dossier Données structurées
  4. Dans le dossier Données structurées, créer le dossier TP1 - Données ouvertes

Questionnaire

Les réponses aux questions de ces travaux pratiques sont à saisir dans le questionnaire [4TP1] Données ouvertes accessible depuis l'application Exercices de l'ENT.

Important

Soyez attentifs, les notions traitées dans le cadre de ces travaux pratiques seront à exploiter dans un devoir à réaliser en autonomie.

Partie 1 - Les données ouvertes

Exercice 1 - data.gouv.fr

  1. Se rendre sur le site data.gouv.fr
  2. Accéder à la page de présentation depuis le menu principal (bandeau en haut de page) :
    Commencer sur data.gouv.fr ▸ Qu'est-ce que data.gouv.fr ?
  3. Lire le contenu de la page intitulée À propos de data.gouv.fr
Question

En utilisant vos mots (sans paraphraser), quel est l'intérêt ce site ? Dans quel but a-t-il été créé ? (en une ou deux phrases)

Exercice 2 - Jeu de données

🛠 Accès aux jeux de données

  1. Depuis le site data.gouv.fr
  2. Cliquer sur l'entrée Données du menu principal
  3. Sur la page Jeux de données, trouver la mention du nombre de jeux de données disponibles au total
Question

Combien de jeux de données sont disponibles au total sur le site data.gouv.fr ?

🛠 Recherche d'un jeu de données

  1. Depuis la page Jeux de données
  2. Saisir dans le champ de recherche des jeux de données les mots-clés : films million entrées
  3. Entrer dans le jeu de données intitulé Films ayant réalisé plus d'un million d'entrées
  4. Consulter l'onglet Producteur
Questions

Qui a produit ces données ? Quel élément graphique permet de s'assurer de la fiabilité du producteur ?

🛠 Détail d'un jeu de données

  1. Consulter l'onglet Métadonnées
  2. Repérer les informations Couverture temporelle et Date de création
Questions

À quelle date ces données ont-elles été partagées ? À quelle période se rapportent les données partagées ?

🛠 Téléchargement des données

  1. Toujours depuis la page Films ayant réalisé plus d'un million d'entrées
  2. Se rendre à la section Fichiers de la page (faire défiler la page ou utiliser le sommaire sur la droite)
  3. Télécharger le fichier au format xlsx (format de l'application Microsoft Excel)
Problème de téléchargement

En cas de problème de téléchargement, le fichier est aussi directement disponible ici :
Films ayant réalisé plus d'un million d'entrées

  1. Fermer le fichier si celui-ci est ouvert
  2. Déplacer le fichier vers le dossier de travail SNT\Données structurées\TP1 - Données ouvertes
  3. Double-cliquer sur le fichier pour l'ouvrir
  4. L'application Microsoft Excel (ou LibreOffice Calc) doit se lancer

Partie 2 - Les tableurs

Principe

Le tableur

Un tableur est un logiciel permettant la manipulation de données organisées sous forme de tableaux. Il est possible d'appliquer sur ces données divers traitements tels que : des tris, des filtres ou des calculs.

Le classeur

Un document créé via un tableur (LibreOffice Calc, Microsoft Excel, ...) est appelé classeur. Un classeur contient des feuilles de calcul organisées en onglets.

La feuille de calcul

Une feuille de calcul correspond à un tableau pouvant contenir des valeurs ou des formules de calcul. Les cases du tableau sont appelées cellules.

La cellule

Chaque cellule est identifiable par sa référence. Une référence est formée de la lettre de la colonne suivie du numéro de ligne de la cellule.

Tableur

Exercice 3 - Analyse rapide des données

🛠 Exploration du fichier

  1. S'il n'est pas déjà ouvert, ouvrir le classeur des films ayant réalisé plus d'un million d'entées
  2. Changer d'année en cliquant sur l'onglet correspondant (les onglets se trouvent en bas de la fenêtre)
Questions
  • Quel film a fait le plus d'entrées en 2020 ?
  • Quel film français a fait le plus d'entrées en 2013 ?
  • Quelle est la nationalité du film ayant fait le plus d'entrées en 2005 ?

Exercice 4 - Filtrage des données

🛠 Activer les filtres

Attention

Si le classeur est en mode protégé, cliquer sur Activer la modification avant d'aller plus loin.

Mode protégé
  1. Activer la modification si le classeur est en mode protégé
  2. Se rendre sur la feuille de calcul de l'année 2018
  3. Sélectionner l'intégralité de la ligne 7 (en-têtes du tableau) en cliquant sur la case grise contenant le numéro de la ligne
  4. Activer les tris et les filtres en sélectionnant la fonction appropriée selon le logiciel utilisé (voir ci-dessous)
Microsoft Excel
  • menu ▸ Données ▸ Filtrer
  • raccourci clavier CTRL + MAJ + L
LibreOffice Calc
  • menu ▸ Données ▸ AutoFiltre
  • raccourci clavier CTRL + MAJ + L

🛠 Utiliser les filtres

Nous souhaitons ne visualiser que les films français. Pour cela :

  • Cliquer sur le triangle qui est apparu à droite de l'en-tête de colonne Nationalité
  • Tout décocher sauf FR
  • Seuls les films français doivent désormais être visibles
Questions

Quels sont les trois films français ayant fait le plus d'entrées en 2018 ?

Exercice 5 - Les fonctions de calcul

🛠 Nombre de films

Nous souhaitons compter le nombre de films affichés une fois le filtre appliqué. Toujours sur la feuille de calcul de 2018 :

  1. Sélectionner la cellule C51
  2. Saisir la formule =SOUS.TOTAL(3;C8:C49) en respectant chaque élément de ponctuation (=, ; et :)
Explications

La fonction SOUS.TOTAL permet d'appliquer un traitement (le traitement numéro 3) sur un groupe de cellules (C8:C49). Ici C8 correspond à la cellule du coin supérieur gauche de la sélection et C49 celle du coin inférieur droit. Ces deux cellules faisant partie de la même colonne C, nous appliquons donc finalement le traitement sur les cellules de la ligne 8 à la ligne 49 de la colonne C.

La documentation complète de cette fonction est disponible sur le support Microsoft

  1. Une fois la formule saisie, le nombre de films affichés devrait apparaître dans la cellule C51.
Question

Combien de films français ont dépassé le million d'entrées en 2018 ?

🛠 Nombre d'entrées

Nous souhaitons maintenant connaître le nombre d'entrées cumulées d'une sélection de films. Toujours sur la feuille de calcul de 2018 :

  1. Sélectionner la cellule E51
  2. Saisir la formule =SOUS.TOTAL(9;E8:E49) en respectant chaque élément de ponctuation (=, ; et :)
  3. Une fois la formule saisie, le nombre d'entrées cumulées devrait apparaître dans la cellule E51
Questions
  • Combien y a-t-il eu d'entrées cumulées pour les films français en 2018 ?
  • Combien y a-t-il eu d'entrées cumulées pour les films étrangers en 2018 ?

🛠 Filtres et tris

Attention

Si la colonne sortie contient des ###, cela signifie qu'elle n'est pas assez large pour afficher correctement les données. Il est possible de l'élargir. Pour cela :

  • Placer le curseur de la souris entre les lettres D et E
  • Maintenir le bouton gauche de la souris pressé
  • Glisser la souris vers la droite

Toujours sur la feuille de calcul de 2018 :

  1. Réinitialiser tous les filtres de façons à afficher tous les films de 2018 (important)
  2. Trier les films selon leur date de sortie croissante (Cliquer sur le triangle à droite de l'en-tête de colonne « sortie »)
  3. Quatre films sortis en 2017 sont présents.
  4. Appliquer le filtre permettant de les masquer et répondre àa la question suivante dans l'ENT
Question

Pour les films sortis en 2018 strictement, combien ont dépassé le million d'entrés ?

  1. Appliquer les filtres et les tris nécessaires pour que n'afficher que les films américains sortis en 2018, triés par ordre décroissant du nombre d'entrées.
Question

Quels sont les deux films américains en tête de liste ?

Exercice 6 - Les salles de cinéma

  1. Se rendre sur la page des jeux de données de data.gouv.fr
  2. Dans le champ de recherche, saisir les mots-clés : salles cinéma
  3. Accéder au jeu de données Les salles de cinéma en Île-de-France mis à jour le 6 décembre 2021
Problème de téléchargement

En cas de problème de téléchargement, le fichier est aussi directement disponible ici :
Les salles de cinéma en Île-de-France

Questions
  • Quelle est la salle de cinéma en Île-de-France ayant le plus de fauteuils ? Donner la ville, le nom de la salle et le nombre de fauteuils.
  • Combien d'écrans et de fauteuils dispose l'unique cinéma de Chelles ?
  • Combien de cinémas « Art et Essai » y a-t-il en Île-de-France ?
  • Combien de fauteuils ont l'ensemble des dix plus gros cinémas d'Île-de-France (en nombre de fauteuils) ?