⑴ 關於大數據的書值得去看的有哪些可以推薦的
阿里巴巴數據技術及產品部的《大數據之路:阿里巴巴大數據實踐》。它山之石,可以攻玉,大公司實踐的書可以多讀,筆者專門為這本書寫過兩篇讀書心得,裡面有很多的干貨,可以起到開闊視野的作用,對實際工作有借鑒意義,值得精讀。
⑵ 麻煩哪位高人推薦幾本數據挖掘的書
樓上來在誤人子弟了,資料庫自和數據倉庫還是區別一大把的,可能數據倉庫的很多實現上還是藉助於資料庫,但是要記住,現在已經很多成熟的東西是不基於資料庫了,或者精確一點說是不藉助於傳統的關系型資料庫了,比如Hyperion的數據倉庫產品的話,就是搭建在ESSBASE上的,這就是一種多維資料庫。
另外傳統資料庫的設計和現在OLAP數據倉庫的設計完全是不一樣的,傳統一般採用的雪花模型在OLAP中基本上不會採用的。所以還是很多不同的,不能等同對待
如果要學數據倉庫的話,我建議你看兩本書:構建數據倉庫、數據倉庫工具箱:維度建模的完全指南
把這兩本書看看就基本上具備理論基礎了。
⑶ 哪可以下載到《數據倉庫工具箱:維度建模的完全指南》中文電子版本
六維空間
⑷ 怎麼理解數據倉庫中的面向主題
1、面向主題,是讓你面向主題去分析問題,架構模型,而不是非要物理上回分開,就像答面向對象編程一樣
2、「很多資料中都寫數據倉庫的數據模型是使用「第三範式」,數據集市才使用多維的星型模型」這個是不對的,因為在Inmon 和 Kimball 的書中都沒有表示這種說法
Inmon 表是建數倉需要有個企業級的一致數據模型,並沒有表示非要第三範式,這個第三範式是 Kimball 在自己的書里說 Inmon 的方式用第三範式不好啦啥的,具體自己看書《數據倉庫工具箱-維度建模權威指南》第一種1.5節
數據集市使用維度建模,這個說法Kimball 也沒有說過,而是 Inmon 在自己的書里說維度建模只適合數據集市,具體看《數據倉庫》第5張5.19節(應該是這一節)
PS:其實感覺他倆的觀點差不多,只是根據他們必須得給自己的觀點加油吶喊而已,兩個人互撕很多年了