Des articles antérieurs ont traité de l’approche Data Vault de modélisation d'entrepôt de données, une approche complémentaire à la modélisation dimensionnelle. Rappelons-en les principales caractéristiques :

  • Elle intègre les concepts d’affaires communs (appelés « hubs ») et les liens inter-concepts depuis différentes sources.
  • Elle stocke systématiquement l’historique de la description des concepts et des liens inter-concepts dans des satellites.
  • Dans sa version brute, il n’y a aucune transformation de données; il n’y a que de l’intégration.
  • Les données sont accompagnées de leur source de provenance et du moment où la source a fourni la donnée.
  • Des trois derniers points, on en déduit qu’il y a traçabilité complète (sans perte de données) des sources : il est possible de déduire l’« état » à n’importe quel moment dans le temps des concepts et liens inter-concepts.
  • Comme il n’y a aucune transformation, l’ajout de données est très rapide.

Un modèle Data Vault existant peut être élargi, afin d’y inclure des concepts. Découvrez comment y ajouter des concepts d’affaires dérivés!  (et des liens inter-concepts) qui ne se retrouvent pas nécessairement dans les sources pour en faire un modèle de concepts d’affaires plus riche. Par exemple : une organisation pourrait avoir une notion de « client privilégié » qu’on ne retrouve pas ou que l’on ne retrouve que partiellement dans les sources. Pour ajouter ces concepts, des règles (de transformations) d’affaires (exemple : règles de classification, d’association, etc.) sont appliquées. On parle alors de concepts d’affaires dérivés. La figure 1 illustre le lien de classification entre le concept client et le concept dérivé client privilégié.

tab 5

Figure 1 - Ajout du concept de client privilégié

Comme les règles d’affaires peuvent varier dans le temps et qu’on veut garder l’historique des concepts d’affaires dérivés, il est de mise de conserver le résultat de l’application des règles d’affaires et ainsi de ne pas considérer que les règles d’affaires courantes.

Les concepts d’affaires sont ajoutés au modèle Vault brut. Les concepts (« hubs »), liens inter-concepts et satellites du modèle brut ne sont aucunement affectés par ces ajouts. La partie brute du modèle Vault demeure intacte et les caractéristiques telles que la traçabilité du modèle sont préservées. Les liens entre la partie brute et la partie dérivée s’effectuent à l’aide de liens inter-concepts, comme le lien de classification de la figure 1. Le couplage entre la partie brute et la partie dérivée du modèle Vault s’en trouve donc minimisé ce qui est une bonne pratique d’architecture. La figure 2 illustre ce modèle Vault augmenté.

Figure 2 - Modèle Vault enrichi (partie brute en vert à laquelle s’ajoute la partie dérivée en orange)

En général, un concept peut être déjà bien défini dans les sources (l’entrepôt brut correspond alors à l’entrepôt d’affaires), peut n’être que partiellement présent dans les sources ou être absent des sources. Dans les deux derniers cas, des règles d’affaires sont nécessaires pour dériver le concept d’affaires. Remarque : idéalement, tous les concepts d’affaires voulus seraient définis dans les sources.

L’avantage de compléter les contextes d’affaires directement dans le modèle Vault est que cela lui permet d’être non seulement un entrepôt brut de stockage, mais également un modèle intégré des concepts de l’organisation. Certains pourraient argumenter que ce complément de concepts apparaîtrait de toute façon dans le modèle dimensionnel. C’est vrai, sauf que le modèle dimensionnel est optimisé pour la consommation et ne se préoccupe pas uniquement d’intégration de concepts.

Qui plus est, cet ajout de concepts d’affaires dérivés ne représente pas beaucoup d’efforts supplémentaires puisque, de toute façon, les règles d’affaires auront besoin d’être appliquées pour acheminer les concepts dérivés dans la partie consommation de l’entrepôt.

Partager cet article
  


CONTACT

agileDSS Inc.
407, rue McGill, bureau 500.
Montréal (QC) H2Y 2G3.

info@agiledss.com
(514) 788-1337