vendredi 6 janvier 2012

Le dictionnaire des données Cours Merise Elaboration d'un Dictionnaire des données DD

1- Introduction

2- Les techniques et les outils
2.1 La localisation des informations
2.2 Les techniques de recueil
2.2.1 Les documents
2.2.2 Les entrevues
2.2.3 Les questionnaires

3- Classification des données

4- Typologie des données
4.1 Notion de domaine
4.2 Types de données

5- Le dictionnaire des données
5.1 Formalisme
5.2 Exploitation

1- Introduction

Le dictionnaire des données est en fait le résultat de la phase de collecte des données. C'est comme vu précédemment la première phase à l'informatisation d'un SI (ou d'un domaine d'un SI). Cette phase est également appelée recueil d'information.

Cette phase de recueil est effectuée en plusieurs étapes :
2- Les techniques et les outils

2.1 La localisation des informations

Le premier problème à résoudre est de trouver l’information. On recherchera dans :
  • Les documents
  • Les règlements
  • Les normes, les procédures,
  • Les bases de données, les fichiers

Certaines informations sont difficiles à mettre en évidence car elles ne sont pas formalisées. Il faudra alors rechercher dans des domaines similaires le besoin d'information.

2.2 Les techniques de recueil

Pour recenser les informations, on utilise essentiellement :
  • L’étude de documents
  • Les entrevues
  • Parfois les questionnaires
2.2.1 Les documents

L’essentiel des données peut être retrouvé sur les documents en circulation.
On s’efforcera :
  • De rassembler un maximum de documents (fiches, impressions, états, journaux …),
  • De s’assurer que les documents sont encore valides,
  • D’utiliser des documents remplis et de repérer les informations réellement utilisées afin d'avoir une vue claire de ce qui est utile et parfois même non formalisé mais nécessaire au fonctionnement
  • D’attacher une attention particulière aux documents non formalisés (ils traduisent souvent l’existence d’une évolution non prise en compte par les procédures ou d’une inadéquation de la procédure en cours),
  • De décoder les codes et abréviations utilisés.

2.2.2 Les entrevues

Les entrevues sont des éléments importants qui de plus privilégient le contact et l'écoute. Ils devront faire l'objet de prise de note et de synthèse afin d'en augmenter leur efficacité.

• Avec la direction
Le but est d'obtenir des informations générales : organisation des services, objectifs stratégiques, procédures et règles de gestion globales…En finalité, cette entrevue permettra de cadrer exactement le domaine à informatiser afin d'éviter des débordements sur d'autres domaines non prévus au départ.

• Avec les utilisateurs

Cette partie avec les utilisateurs est primordiale dans la mesure où ce sont les acteurs importants qui utilise les outils au quotidien, et qui peuvent apporter des éléments importants sur les données manipulées ainsi que sur les interactions entre elle. De plus, le fait d'impliquer les utilisateurs dés le début du projet permet de faciliter la phase ultérieure de mise en place. Cette ou ces entrevues ont donc pour objectif :

o Obtenir une description précise et détaillée des procédures
o Mettre en évidence des dysfonctionnements
o Obtenir des propositions, des critiques, des suggestions
o Rechercher des procédés non officiels

2.2.3 Les questionnaires

C’est un outil assez délicat à utiliser pour le recensement des données. Il faut donc une bonne connaissance du domaine étudié, proposer des réponses exhaustives, limiter les questions ouvertes (réticence à la rédaction). Les questionnaires peuvent être utilisés pour préciser un problème donné, une chronologie d’événements, obtenir un avis sur une procédure, des suggestions… Cet outil est assez peu utilisé.

3- Classification des données

On peut distinguer :
  • Les données élémentaires : l’information se confond avec la valeur prise par la donnée. Par exemple, un nom, une date… Ces données doivent être recensées de manière exhaustive.
  • Les données calculées ou déduites : elles sont obtenues par l’application d’un traitement mathématique ou logique. Ces données sont associées à des règles de calcul (règles de gestion). Il faut penser à bien identifier et conserver la règle de gestion qui permet d’arriver au résultat. Cette règle permettra ensuite par traitement d'obtenir le résultat désiré.
  • Les données composées : certaines données sont regroupées en une même entité sémantique (par exemple une adresse). Ces informations doivent être décomposées en données élémentaires. Toutefois, s’il est montré qu’une donnée composée n’est jamais décomposée dans la chaîne de traitement de l’information, on peut envisager de la conserver telle quelle.
4- Typologie des données

4.1 Notion de domaine

Certaines données ont des valeurs prises dans le même ensemble. Par exemple, langue parlée, langue lue et langue maternelle prennent leur valeur dans un ensemble « Langues ».

On appelle domaine l’ensemble des valeurs prises par une donnée, indépendamment du contexte de son utilisation.

L’identification d’un domaine est une opération importante lors du recueil des données. Il s’agit de déterminer précisément l’ensemble des valeurs possibles s’il s’agit d’un domaine exhaustif ou les règles de représentation (codification, types, bornes…) dans les autres cas.
Exemples :

o domaine exhaustif : permis de conduire (A, A1, B, C, D, C1, E, F)
o domaine borné : notes (min 0, max 20)
o domaine typé : noms (30 caractères alphabétiques)

4.2 Types de données

Les types de données ont un sens plus restrictif que le domaine. Alors que le domaine s’applique à la valeur d’une donnée, le type est une contrainte physique liée à la manière dont sera stockée la donnée dans le système d’information.

Les principaux types à retenir sont :

o Alphanumérique (AN) (on cherchera à déterminer la taille maximale)
o Numérique (on peut préciser entier, réel, monétaire…)
o Date (Date/Heure, Date, Heure )
o Logique ou booléen (L ou B)

5- Le dictionnaire des données

Pendant la phase de conception, les données recueillies et spécifiées sont inscrites dans un dictionnaire. Ce dictionnaire est un outil important car il constitue la référence de toutes les études effectuées ensuite.

5.1 Formalisme

Les données sont présentées dans un tableau.

5.2 Exploitation

L’ensemble des données recueillies constitue le dictionnaire des données brut. Toutes les données ne seront pas utilisées de la même manière. Pour la phase de modélisation des données, il convient d’épurer ce dictionnaire brut :
  • des synonymes (données ayant le même sens) car ils constituent des redondances ambiguës,
  • des polysèmes (mots ayant plusieurs sens) car ils peuvent provoquer des malentendus.

Les données calculées doivent être examinées avec soin.

La règle est la suivante :

Si une donnée calculée peut être obtenue par l’application d’un traitement à partir de données élémentaires valides, on peut la supprimer du dictionnaire.

Par exemple :

Examinons le cas de la donnée calculée MntCde du dictionnaire. Sa valeur est obtenue par l’application du calcul : MntCde = PrixCde * QteCde

Les données élémentaires (PrixCde et QteCde) qui participent à son calcul sont présentes. On peut donc éliminer cette donnée pour la phase de modélisation conceptuelle.

Par contre, si la formule de calcul avait été la suivante : MntCde = PrixProduit * QteCde

dans laquelle le PrixProduit est le prix catalogue du produit. Si MntCde disparaît du dictionnaire, on serait dans l’incapacité de reconstituer ce montant car la donnée PrixProduit peut évoluer dans le temps (changement de tarif du Produit). Il est donc impératif dans ce cas, soit de garder MntCde, soit de rajouter dans le dictionnaire la ou les données permettant d'obtenir ce résultat.

0 commentaires:

Enregistrer un commentaire

Share

Twitter Delicious Facebook Digg Stumbleupon Favorites

 

IP