Devoir de Philosophie

Thème 5 : Les données structurées et leur traitement Activité : Présentation et travail sur les tables de données

Publié le 05/03/2024

Extrait du document

« Thème 5 : Les données structurées et leur traitement Activité : Présentation et travail sur les tables de données Cette activité est à faire pendant les vacances de Pâques pour semaine de la rentrée. Vous pouvez poser des questions via l’ENT. Une donnée est la représentation d’une information.

Bien avant la naissance de l’informatique, on a eu besoin de stocker, puis de structurer ces informations, pour pouvoir les utiliser. Les données constituent désormais la matière première de toute activité numérique.

À ce titre, de nouvelles formes de stockage, de structuration et d’exploitation ont vu le jour au regard de l’explosion de la quantité de données disponibles, jusqu’à l’émergence d’une science du traitement des données : la data science. • Repères historiques 1928 : cartes perforées 80 colonnes de IBM 1956 : invention du disque dur 1979 : VisiCalc premier tableur, 2000 : émergence de la data science 2013 : charte du G8 pour l’ouverture des données publiques. 1) Structuration des données • Une donnée est un élément (chaîne de caractères, nombre, image…) décrivant un objet (individu, société, événement, machine, fichier…).

Par exemple, le numéro de téléphone d’un contact est une donnée. Une donnée peut être créée par un individu ou par un appareil. • Une donnée personnelle est une information se rapportant à une personne physique identifiée ou identifiable par référence à des éléments qui lui sont propres (nom, numéro de sécurité sociale…). • Structurer correctement des données permet de les utiliser et les exploiter aisément afin de produire de l'information.

Il faut donc organiser et classer les données. • Plusieurs descripteurs peuvent être utiles pour décrire un objet.

Par exemple, un passeport français contient plusieurs descripteurs comme le numéro du passeport, le nom, les prénoms, le sexe, la taille, la couleur des yeux, la date de naissance, le lieu de naissance… Par exemple, sur le passeport de l'acteur français Pierre Richard : • à côté du descripteur lieu de naissance, il est inscrit la valeur Valenciennes ; • à côté du descripteur date de naissance, il est inscrit la valeur 16/08/1934. • Une collection de données est un moyen de regrouper de manière structurée des objets partageant les mêmes descripteurs (par exemple, la collection des contacts d’un carnet d’adresses).

: les descripteurs en colonne, les objets en ligne et les valeurs dans les cellules situées à l'intersection. • Une base de données regroupe plusieurs collections de données reliées entre elles.

Par exemple, la base de données d’une bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués. • Comme sur papier, on utilise souvent des tableaux pour organiser les données numériques en colonnes et en lignes.

En informatique, on appelle table, un tableau dans lequel la première ligne sert à décrire la forme des lignes suivantes et on appelle nom de champ (ou critère) l’intitulé qui sert à décrire la nature des informations notées dans les colonnes.

Les descripteurs en colonne, les objets en ligne et les valeurs dans les cellules situées à l'intersection. • • Dans la table ci-contre, présentant des données sur la France et ses pays limitrophes : Les champs sont : Pays, Population, Superficie Les objets sont France, Allemagne Les descripteurs sont : Population et Superficie ; les objets sont France, Allemagne ….

; les valeurs sont 66 992 699, 551 695…. Chapitre N5 SNT Données structurées Activité 1 page 1/4 2) Stockage des données  Format : Pour mémoriser les tables dans un ordinateur, on les stocke dans des fichiers à différents formats dont le rôle est de préciser comment sont organisées les différentes lignes et colonnes. Plusieurs formats sont couramment utilisés parmi lesquels : - Le format CSV (Comma Separated Values) dans lequel chaque ligne contient des valeurs sous un format texte simple et séparées par des symboles de ponctuations (la virgule ; le point-virgule ; l’espace ; la tabulation par exemple).

La première ligne contenant les noms des champs. • On peut ouvrir un fichier csv avec un éditeur de texte basique (notepad ++).

Voici un exemple (avec séparateur « , »): Nom,Prénom,Date de naissance,Lieu de naissance Macron,Emmanuel,21 12 1977,Amiens Hollande,François,12 08 1954,Rouen • Le caractère de séparation choisi ne doit pas figurer dans les valeurs sinon un logiciel ne pourra pas identifier correctement les descripteurs. - Le format ODS (Open Document Spreadsheet), utilisé par les logiciels tableur (du type : Excel). - Le format JSON (JavaScript Object Notation), format de données textuelles en paires de nom/valeur. Les nom et valeur sont séparés par deux points « : » et chaque paire est séparée de la suivante par une virgule.  Métadonnées : À tout fichier sont associées des métadonnées qui permettent d’en décrire le contenu.

Ces métadonnées varient selon le type de fichier (date et coordonnées de géolocalisation d’une photographie, auteur et titre d’un fichier texte, etc.)  Propriétés des données : Certaines des données sont dites ouvertes (OpenData) et permettent des usages libres. Mais on assiste aussi au développement d’un marché de collecte et de vente de données par des entreprises spécialisées, parfois sans informer les usagers.

La France a donc choisi de mettre en place un cadre juridique permettant de protéger les usagers : le règlement général sur la protection des données (RGPD). 3) Traitement des données Les logiciels tableur sont des outils pour traiter des données organisées en colonnes et en lignes. Ils permettent de : - trier des.... »

↓↓↓ APERÇU DU DOCUMENT ↓↓↓

Liens utiles