Aller au contenu

DonnĂ©es et informations⚓

Sources et crédits pour ce cours

Pour préparer ce cours, j'ai utilisé :

DonnĂ©es structurĂ©es⚓

Exercice 1

Objectif : Réaliser des opérations de recherche (filtre) sur une table

  1. Se connecter Ă  son compte sur parcours-algorea.org.
  2. Dans le parcours thématique Données structurées, faire l'exercice Je choisis.
  3. Compléter le texte à trous du Quiz un filtre

Point de cours 1

Une donnĂ©e est une valeur dĂ©crivant un objet, une personne, un Ă©vĂ©nement digne d'intĂ©rĂȘt pour celui qui choisit de la conserver.

Exemple

La chanson She Belongs to Me peut ĂȘtre dĂ©crite par plusieurs donnĂ©es :

Titre Auteur Durée (en secondes) Année Album
'She Belongs to Me' 'Bob Dylan' 170 1965 ' Bringing It All Back Home'

Si on veut gĂ©rer une collection de chansons, on a besoin de dĂ©crire chaque objet chanson par les mĂȘmes catĂ©gories de donnĂ©es qu'on appelle des descripteurs. La valeur d'un descripteur est une donnĂ©e et doit appartenir au domaine qui caractĂ©rise le descripteur, on peut ainsi comparer les donnĂ©es de deux chansons (leur annĂ©e par exemple).

Exemple

On peut organiser une collection de chansons décrites avec cinq descripteurs.

Decripteur 1 : titre Decripteur 2 : auteur Decripteur 3 : durée (en secondes) Descripteur 4 : année Descripteur 5 : album
Domaine : chaĂźne de caractĂšres Domaine : chaĂźne de caractĂšres Domaine : entiers Domaine : entiers Domaine : chaĂźne de caractĂšres
'She Belongs to Me' 'Bob Dylan' 170 1965 'Bringing It All Back Home'
'Under the Bridge' 'Red Hot Chili Pepper' 284 1991 'Blood Sugar Sex Magik'

Une collection regroupe des objets partageant les mĂȘmes descripteurs (par exemple, une collection de chansons). La structure de table permet de prĂ©senter une collection : les objets en ligne, les descripteurs en colonne et les donnĂ©es Ă  l'intersection. Les donnĂ©es sont alors dites structurĂ©es.

alt

Source : cours de CĂ©dric Gouygou

Des donnĂ©es structurĂ©es peuvent ĂȘtre interprĂ©tĂ©es pour en extraire de l'information. L'informatique est la science du traitement automatique de l'information.

exemple

Avec un filtre sur les valeurs du descripteur Couleur on peut extraire de la table ci-dessous tous les végétaux de couleur verte :

alt

Source : https://parcours.algorea.org/

Exercice 2

Objectif : Réaliser des opérations de recherche (filtre) sur une table

  1. Se connecter Ă  son compte sur parcours-algorea.org.
  2. Dans le parcours thématique Données structurées, faire l'exercice Non, pas ceux là !.

Exercice 3

Objectif : Réaliser des opérations de recherche (filtre) et de tri sur une table

  1. Se connecter Ă  son compte sur parcours-algorea.org.
  2. Dans le parcours thématique Données structurées, faire l'exercice Dans un certain ordre
  3. Compléter le texte à trous du Quiz - Un tri.
  4. Dans le parcours thĂ©matique DonnĂ©es structurĂ©es, faire l'exercice Ça et ça, ça ou ça !.

Formats de fichiers⚓

Point de cours 2

Pour assurer leur durabilité et leur partage, les données sont conservées sous différents formats de fichiers.

Format CSV

Le format de fichier CSV (Comma-Separated Values) est un format de fichier texte utilisé pour enregistrer des données structurées en table :

  • chaque titre de colonne correspond Ă  un descripteur
  • chaque ligne contient l'enregistrement des donnĂ©es d'un objet : les valeurs pour chaque descripteur sont sĂ©parĂ©es par un symbole (virgule, point virgule ou tabulation selon le type de format CSV).

Un exemple de table avec deux descripteurs, trois enregistrements et le symbole ',' comme séparateur :

📋 Texte
Nom,PrĂ©nom,Âge
Yamal,Lamine,17
Mbappé,Kylian,25                      
Foden,Phil,24

Un format de donnĂ©es est considĂ©rĂ© comme ouvert (ou libre) si son mode d'organisation est rendu public par son crĂ©ateur et qu'aucune restriction lĂ©gale (telles que le droit d'auteur, les brevets ou le copyright) n'empĂȘche son utilisation libre.

Les formats ouverts sont souvent conçus pour favoriser l'interopérabilité : un document sauvegardé dans un format ouvert ne dépend pas du logiciel utilisé pour le créer, le modifier ou le lire. Ainsi, l'utilisateur peut choisir librement le logiciel qu'il souhaite utiliser.

Les métadonnées d'un fichier sont des informations descriptives sur les données contenues dans ce fichier, telles que le titre, l'auteur, la date de création ou le format. Elles facilitent la recherche, la gestion et l'utilisation des données.

Exemple

Par exemple le jeu de données des Effectifs délÚves en lycée d'enseignement général et technologique sur https://www.data.gouv.fr/ comporte deux fichiers dont un au format CSV et l'autre au format JSON. Les métadonnées de ces fichiers portent sur les URL d'accÚs, la description du contenu, les dates de création et de modification ...

alt

Exercice 4

Objectif : Identifier les principaux formats et représentations de données

Pour chaque question de ce QCM, plusieurs bonnes réponses sont possibles.

Questions

  1. Que représente le titre d'une colonne dans un fichier CSV ?

    • La valeur d'une donnĂ©e

    • Un descripteur

    • Une mĂ©tadonnĂ©e

    • Un commentaire

  2. Une suite bureautique permettant de créer des fichiers en format ouvert est :

    • Microsoft Office

    • Libre Office

    • Only Office

    • Collabora

  3. Un fichier CSV est :

    • un fichier textuel lisible par un humain

    • un fichier binaire illisible par un humain

    • un format des dĂ©buts de l'informatique qui n'est plus utilisĂ©

    • lisible par un logiciel tableur

Exercice 5

Objectif : Identifier les principaux formats et représentations de données

  1. Se connecter Ă  son compte sur parcours-algorea.org.
  2. Dans le parcours thématique Données structurées : Progresser et Valider / Format de données, lire la présentation du format CSV.
  3. Dans le parcours thématique Données structurées : Progresser et Valider / Format de données, faire l'exercice Reproduire un CSV.
  4. Faire l'exercice Dupliquer une table sauf la version ⭐⭐⭐⭐.

Exercice 6

Le format de fichier vCard est un format standard ouvert d'échange de données personnelles au format de carnet d'adresses qui peut contenir une ou plusieurs adresses. Lorsqu'un fichier vCard ne contient qu'une seule adresse, nous parlons plus naturellement de carte de visite virtuelle.

Norme du format vCard

La norme du format vCard version 4.0 est décrite dans l'article Wikipedia :

Toute vCard commence par BEGIN:VCARD et se termine par END:VCARD. Toute vCard doit contenir : * la propriété VERSION, qui définit la version de la vCard. VERSION doit apparaßtre immédiatement aprÚs BEGIN. * la propriété N: avec des champs textuels séparés par un ; le nom, le prénom les titres etc ...

Voici un exemple de fichier VvCard :

📋 Texte
BEGIN:VCARD
VERSION:4.0
FN: Evariste Galois
N: Galois;Evariste;;Pr;
EMAIL: evariste.galois@ens-ulm.fr
TEL:06 31 41 59 26
ADR:;;45 rue d'Ulm;Paris;;75005;France
BDAY:1970-10-25
END:VCARD
  1. Donner la définition d'un format de fichier ouvert.
  2. Indiquer quelle est l'extension d'un fichier vCard.
  3. Avec l'éditeur de textes Notepad++, créer un fichier au format vCard avec la carte de visite imaginaire d'un homonyme d'une figure de l'informatique choisie parmi les 7 familles de l'informatique :

  4. Importer ce fichier vCard comme nouveau contact sur son Webmail.