㈠ 怎么理解数据仓库中的面向主题
1、面向主题,是让你面向主题去分析问题,架构模型,而不是非要物理上回分开,就像答面向对象编程一样
2、“很多资料中都写数据仓库的数据模型是使用“第三范式”,数据集市才使用多维的星型模型”这个是不对的,因为在Inmon 和 Kimball 的书中都没有表示这种说法
Inmon 表是建数仓需要有个企业级的一致数据模型,并没有表示非要第三范式,这个第三范式是 Kimball 在自己的书里说 Inmon 的方式用第三范式不好啦啥的,具体自己看书《数据仓库工具箱-维度建模权威指南》第一种1.5节
数据集市使用维度建模,这个说法Kimball 也没有说过,而是 Inmon 在自己的书里说维度建模只适合数据集市,具体看《数据仓库》第5张5.19节(应该是这一节)
PS:其实感觉他俩的观点差不多,只是根据他们必须得给自己的观点加油呐喊而已,两个人互撕很多年了
㈡ 历史的维度是什么意思
一:零维,一维,二维,三维。
零维度空间是一个点,无限小的点,不占任何空间,点就是零维空间。当无数点集合排列之后,形成了线,直线就是一维空间,无数的线构成了一个平面,平面就是二维空间。无数的平面并列构成了三维空间,也就是立体的空间
二:第四维:时间
三维的世界是静止的,当三维世界以时间为基准发生变化时,四维空间就产生了,如果把时间看作一根轴线,则这个轴线上的任意一个点,都是一个三维空间,也就是说无数个三维空间依据时间轴线集合,构成了四维空间。
在四维空间中,时间呈线性进行,虽然未来不可预测,但源头只有一个,将来也只有一个,不管下一秒将发生什么,即将发生的未来只有一个。
同样,忽略了三维属性后,我们将会发现,任意一个四维物体在时间轴上都表现为一条线段。
三:时间平面
假设无数的时间轴线集合起来,会构成什么呢?
一个时间平面。这个时间平面就是五维空间,它是由无数个四维空间根据某一轴线集合而成的。
但是,请不要问我这条轴线的标准是什么,因为我是一个四维的生命体,我无法为一个我根本观察不到的现象制订标准。
但是我们可以想象,一个五维空间的物体,应该是跨越不同时间轴线的。在任意一个时间轴线上,你只能观察到它的一部分。
四:时间轴线间的跳跃。
假设说一个四维生命体想要跳跃到其他时间轴线上,那么它就必须先成为一个五维的生命体,很显然,在跳跃的过程中,它会同时出现在两条时间轴线上,这时它已符合了五维生命体的要求。
这个事实用另一句话来表述就是:在四维空间中,时间是线性的,方向和进程不可改变。只有在五维空间中,你可以改变时间的方向和进程。
所以:与其说你改变了历史,不如说你改变了自己当前所处的时间轴线。
五:无限与永恒
虽然人类可以想象出无限的概念,但是我们却无法看到五维世界是什么样子。
虽然人类可以明白永恒的概念,可我们却无法创造出一个永恒的事物。
虽然我可以构想出整个五维空间的模型,可我却不了解你,我的爱人,你现在在想些什么。
虽然我无法创造的永恒的事物,可是此刻,我对你的思念却成为了永恒。
一:零维,一维,二维,三维。
零维度空间是一个点,无限小的点,不占任何空间,点就是零维空间。当无数点集合排列之后,形成了线,直线就是一维空间,无数的线构成了一个平面,平面就是二维空间。无数的平面并列构成了三维空间,也就是立体的空间
二:第四维:时间
三维的世界是静止的,当三维世界以时间为基准发生变化时,四维空间就产生了,如果把时间看作一根轴线,则这个轴线上的任意一个点,都是一个三维空间,也就是说无数个三维空间依据时间轴线集合,构成了四维空间。
在四维空间中,时间呈线性进行,虽然未来不可预测,但源头只有一个,将来也只有一个,不管下一秒将发生什么,即将发生的未来只有一个。
同样,忽略了三维属性后,我们将会发现,任意一个四维物体在时间轴上都表现为一条线段。
三:时间平面
假设无数的时间轴线集合起来,会构成什么呢?
一个时间平面。这个时间平面就是五维空间,它是由无数个四维空间根据某一轴线集合而成的。
但是,请不要问我这条轴线的标准是什么,因为我是一个四维的生命体,我无法为一个我根本观察不到的现象制订标准。
但是我们可以想象,一个五维空间的物体,应该是跨越不同时间轴线的。在任意一个时间轴线上,你只能观察到它的一部分。
四:时间轴线间的跳跃。
假设说一个四维生命体想要跳跃到其他时间轴线上,那么它就必须先成为一个五维的生命体,很显然,在跳跃的过程中,它会同时出现在两条时间轴线上,这时它已符合了五维生命体的要求。
这个事实用另一句话来表述就是:在四维空间中,时间是线性的,方向和进程不可改变。只有在五维空间中,你可以改变时间的方向和进程。
所以:与其说你改变了历史,不如说你改变了自己当前所处的时间轴线。
五:无限与永恒
虽然人类可以想象出无限的概念,但是我们却无法看到五维世界是什么样子。
虽然人类可以明白永恒的概念,可我们却无法创造出一个永恒的事物。
虽然我可以构想出整个五维空间的模型,可我却不了解你,我的爱人,你现在在想些什么。
虽然我无法创造的永恒的事物,可是此刻,我对你的思念却成为了永恒。
㈢ 谁有这本书 《Microsoft数据仓库工具箱
数据仓库:《数据库系统概念》第六版 这本书比较好。 商务智能:《商业智能深入浅出:Cognos,Informatica技术与应用》 由于正式发行的商务智能cognos书目前我只发现这一本,所以买了。浏览了一下,不推荐,因为书里边讲的特理论。
㈣ 《数据挖掘概念与技术(原书第3版)》pdf下载在线阅读,求百度网盘云资源
《数据挖掘》((美)Jiawei Han)电子书网盘下载免费在线阅读
资源链接:
链接:https://pan..com/s/1Nla-Mw4lQs5cgYnQZ-o7Ag
书名:数据挖掘
作者:(美)Jiawei Han
译者:范明
豆瓣评分:7.9
出版社:机械工业出版社
出版年份:2012-8
页数:468
内容简介:数据挖掘领域最具里程碑意义的经典著作
完整全面阐述该领域的重要知识和技术创新
这是一本数据挖掘和知识发现的优秀教材,结构合理、条理清晰。本书既保留了相当篇幅讲述数据挖掘的基本概念和方法,又增加了若干章节介绍数据挖掘领域最新的技术和发展,因此既适合初学者学习又适合专业人员和实践者参考。本书视角广阔、资料翔实、内容全面,能够为有意深入研究相关技术的读者提供足够的参考和支持。总之, 强烈推荐从高年级本科生到专业人员和实践者都来阅读这本书!
—— 美国CHOICE杂志
这是一本非常优秀的数据挖掘教材,最新的第3版反映了数据挖掘领域的最新发展和变化。书中增加了2006年第2版以来最新的引用资料,新增小节讨论可视化、模式挖掘以及最新的聚类方法。本书配有丰富及完善的教辅支持,包括配套网站、大量的习题集以及习题答案等。尽管这是一本数据挖掘的教材,但对于读者没有太高的要求,只需要读者具有少量编程经验并了解基本的数据库设计和统计分析知识。还有两点值得注意:第一,本书的参考书目是关于了解数据挖掘研究的非常好的参考列表;第二,书中的索引非常全面和有效,能够帮助读者很容易地定位相关知识点。其他学科的研究人员和分析人员,例如,流行病学家、金融分析师、心理测量研究人员,也会发现本书非常有用。
—— Computing Reviews
当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。
【本书特色】
引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。
全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。
作者简介:Jiawei Han(韩家炜)伊利诺伊大学厄巴纳-尚佩恩分校计算机科学系Abel Bliss教授。由于在数据挖掘和数据库系统领域卓有成效的研究工作,他曾多次获得各种荣誉和奖励,包括2004年ACM SIGKDD颁发的最佳创新奖,2005年IEEE Computer Society颁发的技术成就奖,2009年IEEE颁发的W. Wallace McDowell奖。他是ACM和IEEE Fellow。
Micheline Kamber 拥有加拿大康考迪亚大学计算机科学硕士学位,她是NSERC Scholar,先后在加拿大麦吉尔大学、西蒙-弗雷泽大学及瑞士从事研究工作。
Jian Pei(裴健)目前是加拿大西蒙-弗雷泽大学计算机科学学院教授。2002年,他在Jiawei Han教授的指导下获得西蒙-弗雷泽大学博士学位。

㈤ 求《数据仓库工具箱第三版》全文免费下载百度网盘资源,谢谢~
《数据仓库工具箱第三版》网络网盘pdf最新全集下载:
链接: https://pan..com/s/1_WvWXwHTJMJT3D4pzs9v9Q

㈥ 麻烦哪位高人推荐几本数据挖掘的书
楼上来在误人子弟了,数据库自和数据仓库还是区别一大把的,可能数据仓库的很多实现上还是借助于数据库,但是要记住,现在已经很多成熟的东西是不基于数据库了,或者精确一点说是不借助于传统的关系型数据库了,比如Hyperion的数据仓库产品的话,就是搭建在ESSBASE上的,这就是一种多维数据库。
另外传统数据库的设计和现在OLAP数据仓库的设计完全是不一样的,传统一般采用的雪花模型在OLAP中基本上不会采用的。所以还是很多不同的,不能等同对待
如果要学数据仓库的话,我建议你看两本书:构建数据仓库、数据仓库工具箱:维度建模的完全指南
把这两本书看看就基本上具备理论基础了。
㈦ 数据仓库怎么上手
额 我是做DW的 先说你第一个问题哈 ETL 表面意思是清洗转换加载 这个不说了 网上自己内搜就行,我要说的容是,这个过程其实实施起来没网上说的那么复杂,ETL是为你的数据从业务数据库流入到DW服务的 第二个问题 你现在有前台界面和数据库建DW有这些东西足够你用了,如果说还缺点什么,最好把你们统计系统的数据库数据字典搞一份 总结一下 你现在其实最缺的不是技术 是例子 因为我猜你还不知道DW应该长什么样 推荐你本书,拉尔夫的《数据仓库工具箱》 另外补充楼上说的 数据量大小和用不用工具是没有半毛钱关系的 新手推荐手写
㈧ 数据仓库模型设计 用什么工具箱
datastage,di,informatic等等是用来做ETL的,saybase
powerdesinger数据仓库建模的
也可以不用工具
直接写存储过程的
给分吧楼主
没看明白也可以追问