Qu’est-ce que les données structurées?

Les données structurées font référence à toutes les données qui résident dans un champ fixe dans un enregistrement ou un fichier. Cela inclut les données contenues dans des bases de données relationnelles et des feuilles de calcul.


Caractéristiques des données structurées

Les données structurées dépendent d'abord de la création d'un modèle de données, d'un modèle des types de données d'entreprise qui seront enregistrées et de la manière dont elles seront stockées, traitées et accessibles. Cela inclut la définition des champs de données qui seront stockés et la manière dont ces données seront stockées: type de données (numérique, devise, alphabétique, nom, date, adresse) et toute restriction sur l'entrée de données (nombre de caractères; limité à certains termes tels que comme M., Mme ou le Dr; M ou F).

Les données structurées ont l'avantage d'être facilement saisies, stockées, interrogées et analysées. À une certaine époque, en raison du coût élevé et des limites de performances du stockage, de la mémoire et du traitement, les bases de données relationnelles et les feuilles de calcul utilisant des données structurées étaient le seul moyen de gérer efficacement les données. Tout ce qui ne pourrait s'intégrer dans une structure bien organisée devrait être stocké sur papier dans un classeur.

Gérer les données structurées

Les données structurées sont souvent gérées à l'aide du langage SQL (Structured Query Language), un langage de programmation créé pour gérer et interroger des données dans des systèmes de gestion de bases de données relationnelles. Initialement développé par IBM au début des années 1970 et développé plus tard commercialement par Relational Software, Inc. (aujourd'hui Oracle Corporation).

Les données structurées constituaient une énorme amélioration par rapport aux systèmes non structurés strictement papier, mais la vie ne rentre pas toujours dans de petites boîtes ordonnées. En conséquence, les données structurées devaient toujours être complétées par un stockage papier ou microfilm. Au fur et à mesure que les performances technologiques se sont améliorées et que les prix ont chuté, il a été possible d'introduire dans les systèmes informatiques des données non structurées et semi-structurées.


Données non structurées et semi-structurées

Les données non structurées sont toutes ces choses qui ne peuvent pas être si facilement classées et rentrées dans une boîte soignée: photos et images graphiques, vidéos, données d'instruments en streaming, pages Web, fichiers PDF, présentations PowerPoint, e-mails, entrées de blog, wikis et documents de traitement de texte .

Les données semi-structurées sont un croisement entre les deux. C'est un type de données structurées, mais il manque la structure stricte du modèle de données. Avec les données semi-structurées, des balises ou d'autres types de marqueurs sont utilisés pour identifier certains éléments dans les données, mais les données n'ont pas de structure rigide. Par exemple, les logiciels de traitement de texte peuvent désormais inclure des métadonnées indiquant le nom de l'auteur et la date de création, la majeure partie du document étant simplement du texte non structuré. Les courriers électroniques ont l'expéditeur, le destinataire, la date, l'heure et d'autres champs fixes ajoutés aux données non structurées du contenu du message électronique et des pièces jointes. Les photos ou autres graphiques peuvent être balisés avec des mots-clés tels que le créateur, la date, le lieu et les mots-clés, ce qui permet d'organiser et de localiser les graphiques. XML et d'autres langages de balisage sont souvent utilisés pour gérer des données semi-structurées.


Normes de technologie des données structurées

SQL est une norme de l'American National Standards Institute depuis 1986. Il est géré par l'International Committee for Information Technology Standards (INCITS) Comité technique DM 32 Gestion et échange de données. Le comité a deux groupes de travail, l'un pour les bases de données et l'autre pour les métadonnées. HP, CA, IBM, Microsoft, Oracle, Sybase (SAP) et Teradata participent tous, ainsi que plusieurs agences gouvernementales fédérales. Les deux documents de projet du comité contiennent des liens vers de plus amples informations sur chaque projet. SQL est devenu une norme de l'Organisation internationale de normalisation (ISO) en 1987. Les normes publiées sont disponibles à l'achat auprès du Boutique ANSI eStandards, sous la classification INCITS / ISO / CEI 9075.

Laisser un commentaire