DonnĂ©es et informationsâïž
Sources et crédits pour ce cours
Pour préparer ce cours, j'ai utilisé :
- le programme de SNT
- le parcours thématique Données strucuturées proposé par l'association France IOI sur le site https://parcours.algorea.org
- le cours de CĂ©dric Gouygou
- un TP Capytale d'une formation SNT pour l'académie de Rennes
DonnĂ©es structurĂ©esâïž
Exercice 1
Objectif : Réaliser des opérations de recherche (filtre) sur une table
- Se connecter Ă son compte sur parcours-algorea.org.
- Dans le parcours thématique Données structurées, faire l'exercice Je choisis.
- Compléter le texte à trous du Quiz un filtre
Point de cours 1
Une donnĂ©e est une valeur dĂ©crivant un objet, une personne, un Ă©vĂ©nement digne d'intĂ©rĂȘt pour celui qui choisit de la conserver.
Exemple
La chanson She Belongs to Me peut ĂȘtre dĂ©crite par plusieurs donnĂ©es :
Titre | Auteur | Durée (en secondes) | Année | Album |
---|---|---|---|---|
'She Belongs to Me' | 'Bob Dylan' | 170 | 1965 | ' Bringing It All Back Home' |
Si on veut gĂ©rer une collection de chansons, on a besoin de dĂ©crire chaque objet chanson par les mĂȘmes catĂ©gories de donnĂ©es qu'on appelle des descripteurs. La valeur d'un descripteur est une donnĂ©e et doit appartenir au domaine qui caractĂ©rise le descripteur, on peut ainsi comparer les donnĂ©es de deux chansons (leur annĂ©e par exemple).
Exemple
On peut organiser une collection de chansons décrites avec cinq descripteurs.
Decripteur 1 : titre | Decripteur 2 : auteur | Decripteur 3 : durée (en secondes) | Descripteur 4 : année | Descripteur 5 : album |
---|---|---|---|---|
Domaine : chaĂźne de caractĂšres | Domaine : chaĂźne de caractĂšres | Domaine : entiers | Domaine : entiers | Domaine : chaĂźne de caractĂšres |
'She Belongs to Me' | 'Bob Dylan' | 170 | 1965 | 'Bringing It All Back Home' |
'Under the Bridge' | 'Red Hot Chili Pepper' | 284 | 1991 | 'Blood Sugar Sex Magik' |
Une collection regroupe des objets partageant les mĂȘmes descripteurs (par exemple, une collection de chansons). La structure de table permet de prĂ©senter une collection : les objets en ligne, les descripteurs en colonne et les donnĂ©es Ă l'intersection. Les donnĂ©es sont alors dites structurĂ©es.
Source : cours de CĂ©dric Gouygou
Des donnĂ©es structurĂ©es peuvent ĂȘtre interprĂ©tĂ©es pour en extraire de l'information. L'informatique est la science du traitement automatique de l'information.
exemple
Avec un filtre sur les valeurs du descripteur Couleur on peut extraire de la table ci-dessous tous les végétaux de couleur verte :
Source : https://parcours.algorea.org/
Exercice 2
Objectif : Réaliser des opérations de recherche (filtre) sur une table
- Se connecter Ă son compte sur parcours-algorea.org.
- Dans le parcours thématique Données structurées, faire l'exercice Non, pas ceux là !.
Exercice 3
Objectif : Réaliser des opérations de recherche (filtre) et de tri sur une table
- Se connecter Ă son compte sur parcours-algorea.org.
- Dans le parcours thématique Données structurées, faire l'exercice Dans un certain ordre
- Compléter le texte à trous du Quiz - Un tri.
- Dans le parcours thĂ©matique DonnĂ©es structurĂ©es, faire l'exercice Ăa et ça, ça ou ça !.
Formats de fichiersâïž
Point de cours 2
Pour assurer leur durabilité et leur partage, les données sont conservées sous différents formats de fichiers.
Format CSV
Le format de fichier CSV (Comma-Separated Values) est un format de fichier texte utilisé pour enregistrer des données structurées en table :
- chaque titre de colonne correspond Ă un descripteur
- chaque ligne contient l'enregistrement des données d'un objet : les valeurs pour chaque descripteur sont séparées par un symbole (virgule, point virgule ou tabulation selon le type de format CSV).
Un exemple de table avec deux descripteurs, trois enregistrements et le symbole ',' comme séparateur :
Nom,PrĂ©nom,Ăge
Yamal,Lamine,17
Mbappé,Kylian,25
Foden,Phil,24
Un format de donnĂ©es est considĂ©rĂ© comme ouvert (ou libre) si son mode d'organisation est rendu public par son crĂ©ateur et qu'aucune restriction lĂ©gale (telles que le droit d'auteur, les brevets ou le copyright) n'empĂȘche son utilisation libre.
Les formats ouverts sont souvent conçus pour favoriser l'interopérabilité : un document sauvegardé dans un format ouvert ne dépend pas du logiciel utilisé pour le créer, le modifier ou le lire. Ainsi, l'utilisateur peut choisir librement le logiciel qu'il souhaite utiliser.
Les métadonnées d'un fichier sont des informations descriptives sur les données contenues dans ce fichier, telles que le titre, l'auteur, la date de création ou le format. Elles facilitent la recherche, la gestion et l'utilisation des données.
Exemple
Par exemple le jeu de données des Effectifs délÚves en lycée d'enseignement général et technologique sur https://www.data.gouv.fr/ comporte deux fichiers dont un au format CSV et l'autre au format JSON. Les métadonnées de ces fichiers portent sur les URL d'accÚs, la description du contenu, les dates de création et de modification ...
Exercice 4
Objectif : Identifier les principaux formats et représentations de données
Pour chaque question de ce QCM, plusieurs bonnes réponses sont possibles.
Questions
-
Que représente le titre d'une colonne dans un fichier CSV ?
- La valeur d'une donnée
- Un descripteur
- Une métadonnée
- Un commentaire
-
Une suite bureautique permettant de créer des fichiers en format ouvert est :
- Microsoft Office
- Libre Office
- Only Office
- Collabora
-
Un fichier CSV est :
- un fichier textuel lisible par un humain
- un fichier binaire illisible par un humain
- un format des débuts de l'informatique qui n'est plus utilisé
- lisible par un logiciel tableur
Exercice 5
Objectif : Identifier les principaux formats et représentations de données
- Se connecter Ă son compte sur parcours-algorea.org.
- Dans le parcours thématique Données structurées : Progresser et Valider / Format de données, lire la présentation du format CSV.
- Dans le parcours thématique Données structurées : Progresser et Valider / Format de données, faire l'exercice Reproduire un CSV.
- Faire l'exercice Dupliquer une table sauf la version ââââ.
Exercice 6
Le format de fichier vCard est un format standard ouvert d'échange de données personnelles au format de carnet d'adresses qui peut contenir une ou plusieurs adresses. Lorsqu'un fichier vCard ne contient qu'une seule adresse, nous parlons plus naturellement de carte de visite virtuelle.
Norme du format vCard
La norme du format vCard version 4.0 est décrite dans l'article Wikipedia :
Toute vCard commence par BEGIN:VCARD et se termine par END:VCARD. Toute vCard doit contenir : * la propriété VERSION, qui définit la version de la vCard. VERSION doit apparaßtre immédiatement aprÚs BEGIN. * la propriété N: avec des champs textuels séparés par un ; le nom, le prénom les titres etc ...
Voici un exemple de fichier VvCard :
BEGIN:VCARD
VERSION:4.0
FN: Evariste Galois
N: Galois;Evariste;;Pr;
EMAIL: evariste.galois@ens-ulm.fr
TEL:06 31 41 59 26
ADR:;;45 rue d'Ulm;Paris;;75005;France
BDAY:1970-10-25
END:VCARD
- Donner la définition d'un format de fichier ouvert.
- Indiquer quelle est l'extension d'un fichier vCard.
-
Avec l'éditeur de textes Notepad++, créer un fichier au format vCard avec la carte de visite imaginaire d'un homonyme d'une figure de l'informatique choisie parmi les 7 familles de l'informatique :
-
Importer ce fichier vCard comme nouveau contact sur son Webmail.