INFOGESTION

Espace de discussion étudiants
 
AccueilAccueil  PortailPortail  FAQFAQ  RechercherRechercher  S'enregistrerS'enregistrer  MembresMembres  GroupesGroupes  Connexion  

Partagez | 
 

 INFORMATIONS SUR BASES DE DONNEES ET SA CONCEPTION

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
Syssie



Nombre de messages : 9
Date d'inscription : 29/04/2009

MessageSujet: INFORMATIONS SUR BASES DE DONNEES ET SA CONCEPTION   Lun 22 Juin - 9:23

De: Sybille Bertrand
Etudiante en GSI au CMP

Il est important de savoir qu'est une base de données et comment le concevoir, de ce fait voici quelques informations y relatives.

BASE DE DONNEES

En informatique une base de données (abrégé BD ou BDD) est un ensemble de fichiers organisés selon des procédés qui facilitent le stockage et la manipulation de très grandes quantités d'informations.

Une banque de données est un stock d'informations relatives à un sujet de connaissances et librement consultables. Les informations en question sont souvent stockées dans des bases de données.

CONCEPTION DE BASES DE DONNEES
La conception de bases de données contient trois étapes:

ETAPE 1

Analyse des documents

La première étape, dans la construction d'une base de données, consiste à réunir tous les documents représentatifs des données que l'on souhaite modéliser.
Le terme "documents" doit être ici pris dans un sens large. Il peut s'agir en effet soit de documents papier, soit de documents magnétiques (enregistrement d'entretiens, disque ou disquette informatique)... soit de tout autre support utilisable pour conserver des informations.

Documents de travail
Pour illustrer les différentes étapes de conception d'une base de données nous utiliserons, comme exemple type, la gestion d'étudiants qui suivent les différents enseignements d'un diplôme.

Les documents de travail utilisés sont les suivants :

Liste des étudiants
N° étudiant Nom de l'étudiant Date de naissance Sexe
1 Dupont, Charles 18-03-1981 H (Homme)
2 Dubois, Jules 02-11-1982 H (Homme)
3 Favier, Isabelle 02-02-1979 F (Femme)


Relevé de notes
N° étudiant : 1 Dupont, Charles
N° matière Nom Coefficient Note / 20
1 Mathématiques 3 10
2 Informatique 2 9
3 Sociologie 2 12,5
4 Histoire 1 13
5 Géographie 1 7
Moyenne Générale 10,3

Liste des enseignants
N° enseignant Nom Grade Ancienneté Matière enseignée
10 Bertrand, Pierre ASS 2 Sociologie
11 Dupont, Auguste MCF 3 Mathématiques
... ... ... ... ...
15 Simon, Etienne ASS 5 Histoire


Règles de gestion :
- Une matière n'est enseignée que par un seul enseignant.
- Un étudiant n'a qu'une note par matière.
Dictionnaire des données
Partant des documents, la phase d'analyse consiste à en extraire les informations élémentaires (non décomposables) qui vont constituer la future base de données.

La réunion de l'ensemble des données élémentaires, que l'on appelle des attributs ou des champs, constitue le dictionnaire des données. Chaque attribut (champ) du dictionnaire de données peut être caractérisé par les propriétés suivantes :
Propriété Signification
Mnémonique Abréviation du nom de l'attribut.
Libellé Libellé contenant la signification précise et le rôle de l'attribut.
Type de donnée Type de l'attribut : entier, réel, chaîne de caractères, date...
Contraintes d'intégrité Liste des contraintes sur les valeurs possibles de l'attribut
Règle de calcul Règle de calcul (d'obtention) de l'attribut correspondant.
• Le dictionnaire des données relatifs aux documents précédents est le suivant :
Mnémonique Libellé Type Contraintes Règle de calcul
Ancien Ancienneté dans le grade Entier >=0
Cdsexe Code sexe Chaîne(1) H ou F
Coeff Coefficient de la matière Entier >0 et <6
Dtnaiss Date de naissance Date
Grade Grade de l'enseignant Chaîne(3) ASS ou MCF ou PR
Lbsexe Libellé du sexe Chaîne(7) Homme ou Femme
Moyenne Moyenne au diplôme Réel >=0 et <=20 SUM( Note*Coeff)/SUM(Coeff)
Nomat Nom de la matière Chaîne(15)
Nomens Nom de l'enseignant Chaîne(20)
Nometu Nom de l'étudiant Chaîne(20)
Note Note obtenue à la matière Réel >=0 et <=20
Numat N° de la matière Entier >0
Numens N° de l'enseignant Entier >0
Numetu N° de l'étudiant Entier >0

ETAPE 2

Structuration des données
Les informations contenues dans le dictionnaire de données doivent être structurées en "paquets" homogènes (entités, tables) dans lesquels la répétition (redondance) d'informations doit être minimale.
Les attributs qui sont calculés (qui ont une règle de calcul) ne doivent pas être pris en compte dans la phase de structuration des données. Ils sont en effet obtenus à partir d'autres attributs, et les inclure dans la phase de structuration introduirait une forme de redondance et donc des possibilités d'incohérence. Dans notre exemple, l'attribut "Moyenne" appartient à cette catégorie.
On dira qu'un ensemble d'attributs est homogène si tous les attributs qui le compose ont un lien "direct".
La redondance à l'intérieur d'un ensemble doit être minimale car la redondance est source d'incohérence. En effet, si la même information est répétée plusieurs fois, cela signifie :
• Qu'elle devra être saisie plusieurs fois, ce qui multiplie les risques d'erreurs de frappe.
• Que lorsqu'elle devra être mise à jour, les modifications devront intervenir à plusieurs endroits d'où des risques de mise à jour partielle.
Pour regrouper les attributs du dictionnaire de données on utilise un élément structurant qui s'appelle la dépendance fonctionnelle (DF).
------------------------------------
Pour une justification plus formelle du processus de structuration des données présenté ci-après, se reporter, dans ces pages à la rubrique Normalisation.
------------------------------------
Notion de dépendance fonctionnelle (DF)
On dit qu'il existe une dépendance fonctionnelle entre un attribut A1 et un attribut A2, on note A1 -> A2, si connaissant une valeur de A1 on ne peut lui associer qu'une seule valeur de A2. On dit aussi que A1 détermine A2. A1 est la source de la dépendance fonctionnelle et A2 le but.
Exemple de DF
Dans notre base de données exemple, connaissant un numéro d'étudiant, on connaît de manière unique le nom de cet étudiant et, entre autres, sa date de naissance. On a donc :

Numetu -> Nometu, Dtnaiss.
En revanche, l'expression : Numetu -> Note est fausse.
En effet, connaissant un numéro d'étudiant on peut connaître les notes qu'il a obtenu dans chaque matière. La connaissance du numéro d'étudiant ne permet donc pas de connaitre une note particulière et il n'y a donc pas de DF.
DF simple :
On dira qu'une DF est simple si sa source n'est composée que d'un seul attribut.
Une DF simple caractérise une entité (table) dont la source est la clé et dont les propriétés sont constituées par le but de la DF.

DF composée :
On dira qu'une DF est composée si sa source est composée par la réunion de plusieurs attributs.
Une DF composée caractérise une association entre entités (tables) dont la source est la clé et dont les propriétés sont constituées par le but de la DF. Il ne doit pas y avoir d'attributs superflus dans la source d'une DF composée. Par exemple si nous avons les 2 DF composées :

1- A1, A2, A3 -> A4
2- A1, A2 -> A4

La DF numéro 1 est incorrecte puisque A3 est superflu. La DF composée "correcte" est : A1, A2 -> A4
Pour représenter les entités et associations nous utiliserons la notation suivante :
NOM_DE_L'ENTITE (Source, But ...). La clé est soulignée.
Soit par exemple :
DF Entités
A1 -> A2, A3, A4 ENTITE1 (A1, A2, A3, A4)
A3 -> A4 ENTITE2 (A3, A4)
A1, A5 -> A6 ASSOC1 (A1, A5, A6)




Suppression de la redondance d'informations
L'utilisation des DF permet de structurer les informations contenues dans le dictionnaire des données mais n'élimine pas, directement, la redondance éventuelle de ces informations.
Par exemple, dans le tableau ci-dessus, les attributs A3 et A4 sont redondants puisqu'ils se trouvent dans deux entités : ENTITE1 et ENTITE2. Il est donc nécessaire d'éliminer cette redondance sans toutefois perdre des informations : c'est à dire supprimer des entités.
Dans cet exemple, on ne peut supprimer A3 de l'entité2 car cela impliquerait la suppression de l'entité et donc une perte d'information. A4 ne peut pas non plus être supprimé de l'entité2 puisque c'est la seule propriété de cette entité. En revanche A4 peut être supprimé de l'entité1, sans perte d'information, puisqu'il peut être obtenu (dérivé) par le biais de A3, en utilisant la propriété de transitivité des DF.
La structure "optimale" (cohérence maximale et redondance minimale) du schéma de DF précédent est donc :
A1 -> A2, A3
A3 -> A4
A1, A5 -> A6
D'où la règle :
Pour supprimer les redondances sur un ensemble de DF il faut éliminer les attributs qui peuvent être obtenu par transitivité.
Démarche de structuration des données
La structuration des données du dictionnaire des données s'effectue en 5 étapes :
1. Détermination de la liste des DF simples
2. Prise en compte des attributs non classés dans l'étape 1 et détermination des DF composées
3. Elimination des transitivités du schéma des DF
4. Construction, à partir des DF simples, des entités de la base de données
5. Construction, à partir des DF composées, des associations de la base de données
L'application de cette démarche à notre exemple nous donne les résultats suivants :
1-DF simples de la base de données ETUDIANTS
Numetu -> Nometu, Dtnaiss, Cdsexe, Lbsexe
Cdsexe -> Lbsexe
Numens -> Nomens, Grade, Ancien
Numat -> Nomat, Coeff, Numens, Nomens, Grade, Ancien
2-Attributs non classé et DF composées de la base de données ETUDIANTS
L'attribut "note" n'a pas été classé dans l'étape précédente, il intervient donc dans une DF composée. Cette DF est la suivante :
Numetu, Numat -> Note
3-Elimination des transitivités de l'ensemble des DF
Numetu -> Nometu, Dtnaiss, Cdsexe
Cdsexe -> Lbsexe
Numens -> Nomens, Grade, Ancien
Numat -> Nomat, Coeff, Numens
4-Construction des entités
ETUDIANT (Numetu, Nometu, Dtnaiss, Cdsexe)
SEXE (Cdsexe, Lbsexe)
ENSEIGNANT (Numens, Nomens, Grade, Ancien)
MATIERE (Numat, Nomat, Coeff, Numens)
5-Construction des associations
NOTES (Numetu, Numat, Note)
Etape précédente| Etape suivante | Conception BD

ETAPE 3

Construction du schéma des données

La dernière étape consiste à mettre en relation les entités et associations trouvées dans l'étape précédente afin de construire la structure générale des données : le schéma des données.
------------------------------------
Le schéma obtenu par application de la méthode est le schéma conceptuel des données.
------------------------------------
Mise en relation des entités
Les entités sont mise en relation par l'intermédiaire des attributs qu'elles possèdent en commun. Les types de relations autorisées pour relier deux entités (associations) appartiennent aux deux catégories suivantes :
• Relation de type 1-1 : à un élément de l'ensemble départ on ne peut faire correspondre qu'un seul élément de l'ensemble d'arrivée et réciproquement.
• Relation de type 1-n : à un élément de l'ensemble de départ on peut faire correspondre plusieurs éléments de l'ensemble d'arrivée.
------------------------------------
Par application de la méthode, les seules relations possibles entres entités et associations sont des relations de type n-1, soient des dépendances fonctionnelles. Cette étape vise donc à déterminer les dépendances fonctionnelles entre entités et associations : construction du graphe des index.
------------------------------------
Pour déterminer les relations entre entités (associations), il faut donc examiner le cardinal de chacune des entités qui interviennent dans la relation.
Dans notre exemple, nous avons des relations suivantes :
Entité source Entité but Relation sur l'attribut Type de relation
SEXE ETUDIANT Cdsexe 1-n
ETUDIANT NOTES Numetu 1-n
MATIERE NOTES Numat 1-n
ENSEIGNANT MATIERE Numens 1-n
Si l'on examine la première ligne du tableau, nous avons précisé que la relation entre SEXE et ETUDIANT était de type 1-n.
En effet, dans l'entité SEXE, une valeur particulière de l'attribut Cdsexe (H ou F) ne sera présente qu'une seule fois(1). En revanche, dans l'entité ETUDIANT, la même valeur de l'attribut Cdsexe pourra être présente plusieurs fois(n), autant de fois qu'il y a d'étudiants de ce sexe.
Représentation graphique du schéma des données
Pour avoir une vision synthétique de la structure de la base de données (le schéma des données) on utilise une représentation graphique du type suivant :

Cette représentation est le schéma de la base de données "ETUDIANTS". C'est la struture de représentation optimale des données de notre problème : Cohérence maximale et redondance minimale.
Remarque importante pour les "puristes"
------------------------------------
Le schéma ci-dessus est bien le schéma conceptuel des données et non le schéma logique des données. En effet, les relations n-1 représentent les dépendances fonctionnelles qui existent entre les entités et associations. Le schéma précédent doit donc être vu comme une image du graphe des dépendances fonctionnelles. Il s'agit en fait de la couverture minimale du graphe.
Avec cette méthode, le passage du schéma conceptuel au schéma logique puis physique est évident :
Schéma logique : Les dépendances fonctionnelles entre entités et associations deviennent des contraintes d'intégrité référentielle.
Schéma physique : Chaque entité/association devient une table
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Frantz

avatar

Nombre de messages : 162
Date d'inscription : 10/10/2005

MessageSujet: Les syntheses   Mer 24 Juin - 11:32

Salut Syssie,

Je pense que si tu avais resumé tes recherches cela nous aurait tous arrangé. Te connaissant, je suis surpris que tu aies posté ce message sans préciser la source. A moins qu'il vient de toi.

Le prof.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
 
INFORMATIONS SUR BASES DE DONNEES ET SA CONCEPTION
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» quel logiciel pour exploiter des grosses bases de données?
» Ratrapage TD droit administratif : informations
» Beaucoup d'informations sur Garabandal
» Les bases de données statistiques et leurs réseaux.
» TCF (informations)

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
INFOGESTION :: INFOGESTION-
Sauter vers: