学院首页>网络编程>其它编程>《数据建模》读书笔记

《数据建模》读书笔记

作者: 来源: 添加时间:2006-5-22 12:04:22
最近逛书店发现一本数据建模的好书——《数据建模:分析与设计的工具和技巧》(Data Modeler’s Workbench:Tools and Techniques for Analysis and Design),作者Steve Hoberman。粗读完一遍后,感觉这本书的确无愧于译者和国外专家们的盛赞:“这本书充满了对改进数据模型和设计有益的技术和技巧,并且它还极富阅读乐趣——一个了不起的结合!任何一个数据建模者都应该拥有一本Steve Hoberman的关于数据建模工具和技术的书。” 
  尽管我对自己所掌握的数据建模知识有一定的自负,读完该书后,还是获益良多。本着好书大家一起分享的想法,我把该书的每个章节的总结和技巧建议列出来,以方便手头暂时没有该书的朋友在数据建模时参考。该书所介绍的工具和模版可在作者的Web站点下载,地址是:
  www.wiley.com/compbooks/hoberman
  第一章:使用趣闻、类比和演示文稿来阐明数据建模的概念
  在一般的日常沟通中。我们可能会说出并听到许多故事、或者趣闻这些故事涉及的论题范围很大。有些例子是周末发生在我们自己身边的事情,或者是与我们的工作项目有关的经历。这些趣闻有助于加强我们和周围人们的关系,增进我们的愉悦情绪,而且对我们有教育作用。我们能够把由语言表达出来的东西形象化。有时,当故事结束时,给我们留下的是以前未曾想到的信息或更多的认识。在解释数据建模概念时,趣闻是极其有效的。原因有如下几个:
  它们建立起持久的形象。
  它们引人入胜、使人愉悦。
  它们增经人们之间的关系。
  它们减缓压力。
  成功编造并讲述一个数据建模方面的趣闻有下面三个简单的步骤:
  1)定义一个论题。要在心中保证,你讲述的这个趣闻有一个特定的目标或论题,也就是说,这个故事是为了解释一个数据建模的概念或术语。
  2)选择你的故事。我们可以选择的故事类型多种多样。我们要考虑选择一个有趣并有益,而且能够明白无误地传达主题意图的简短的故事。
  3)演练你的故事。一旦找到了合适的故事,你要好好演练一番,直到你自信它能够在两分钟的时间内充分表达你的论题。要避免讲述拖拖拉拉的故事。
  数据模型类比
  类比就是把两个或多个概念进行相互比较,以强调它们之间的相似或差异。类比是介绍外来事物或新鲜事物的一个很好的技巧,尤其是向非计算机专业的人士介绍计算机的专业知识时。Hoberman在数据建模中最常见的几个类比如下(他用这些类比轻松的打动管理层给他涨了一倍的工资^_^):
  主体域模型是一个居高临下的视点。
  数据模型是一个设计图。
  企业模型是一个世界地图。
  标准就是城市规划。
  元数据仓储库是一个图书馆。
  数据仓库是“心脏”。
  第二章:元数据宾果游戏
  简单来说,即通过宾果卡片游戏的方式,调动项目团队成员的积极性,来确定数据模型,并确定元数据的有效性。元数据宾果游戏强调“共赢”,如果运气好,游戏结束时每个人都能赢。
  第三章:确保高质量的定义
  本章集中讨论一个被称为“定义检查单”(Definition Checklist)的工具,它包含了确保定义的质量处于最高水平的准则。
  第四章:数据建模者的项目计划
  本章重点介绍确定数据建模阶段、任务、工具和时限的四个工具:
  ·数据建模阶段的工具:用来确定最高层次上的数据建模步骤。
  ·阶段—任务—工具:提取出“数据建模阶段”的各个阶段并把他们分解成数据建模任务。
  ·优先级三角形:你可以从以下三项中取两项极值:很高的质量、最短的时间与最低的成本,但你永远也别想三者兼得。
  ·可靠的估算工具:“主体域工作量时限”根据应用程序的类型,确定每个数据建模阶段应占整个项目的百分比。“任务工作量工具”提取在“阶段—任务—工具”中确定的每项任务,并列出它们应占整个数据建模工作产品的百分比。这两个工具的组合可使你向项目经理提供一份具有一定精确度的合理估算。
  第五章:主体域分析
  本章主要探讨五个关键的工具,这五个工具对数据建模工作的主体域分析阶段有帮组作用。它们应该按照下面的顺序被逐个完成:
  1)主体域检查单:新应用程序中的主体域的完整列表,还有各个主体域的定义和同义词(或别名)。
  2)主体域CRUD(Create Read Update Delete)矩阵:包含新应用程序和现有应用程序之间的主体域方面的差别和重复之处,确定应用程序的范围。
  3)In-the-Know模版:确定完成这个新应用程序的数据间模工作产品所需要的、被用作资源的人员和文档。
  4)主体域家族树:包含每一个主体域的源应用程序和若干其他的关键信息,阐明主体域数据将来自哪里。
  5)主体域力度矩阵:使用一个电子表格的格式,记录每一个度量和事实主体域的发布层次。
  第六章:主体域建模
  本章阐述三个队主体域信息进行建模的强大工具:
  ·“业务清理板”模型。
  ·“应用程序清理板”模型。
  ·“早期现实性检查”模型。
  第七章:逻辑数据分析
  本章关注四个逻辑数据分析工具,它们应该按照下面的次序被使用:
  1)数据元素家族树:包含应用程序的数据元素的完整列表,以及每个数据元素的来源和变换信息,还有其他几个关键的数据元素元数据。
  2)数据元素粒度矩阵:用一个电子表格的格式,来记录每个度量和事实的发布层次。
  3)数据质量记录模板:展示每个数据元素的员数据和一些实际数据的对比。
  4)数据质量确认模板:记录每个数据元素的元数据和一些实际数据的对比的结果。
  第八章:规范化之旅和反向规范化生存指南(强烈推荐:是我目前所读过最好的关系型数据库的规范化技术文档)
  规范化是一个剔除冗余并应用规则的过程,它的目的是为了更好的理解和表达存在于数据元素之间的依赖性和参与性。规范化包含6个层次,最高层是第五范式(5NF)。一般的技术文档上都认为达到3NF即可,Steve Hoberman给我们指明了更高的目标:5NF。Graeme Simsion写过一本名为《Data Modeling Essentials》的书,在这本书中,他写道:“较高层次的范式常被从业者误解并因此而被忽视,或为了支持不可靠的建模时间而被引用。”但是,我们需要理解这些较高层次的规范化,因为它们体现了额外的规范化机会,并帮组我们进一步减少冗余信息、改进设计的灵活性。尽管余下的三个规范化层次有可能仅仅产生次数很少的变化,但它们仍然具有一些提高灵活性和效率的机会。下面是BCNF&4NF&5NF的定义(比国内教材上罗列的数学公式容易理解得多:
第 1 页,共 2 页 [1] [2]
站内搜索