Ⅰ 誰有這本書 《Microsoft數據倉庫工具箱
數據倉庫:《資料庫來系統概源念》第六版 這本書比較好。 商務智能:《商業智能深入淺出:Cognos,Informatica技術與應用》 由於正式發行的商務智能cognos書目前我只發現這一本,所以買了。瀏覽了一下,不推薦,因為書里邊講的特理論。
Ⅱ 怎麼理解數據倉庫中的面向主題
1、面向主題,是讓你面向主題去分析問題,架構模型,而不是非要物理上回分開,就像答面向對象編程一樣
2、「很多資料中都寫數據倉庫的數據模型是使用「第三範式」,數據集市才使用多維的星型模型」這個是不對的,因為在Inmon 和 Kimball 的書中都沒有表示這種說法
Inmon 表是建數倉需要有個企業級的一致數據模型,並沒有表示非要第三範式,這個第三範式是 Kimball 在自己的書里說 Inmon 的方式用第三範式不好啦啥的,具體自己看書《數據倉庫工具箱-維度建模權威指南》第一種1.5節
數據集市使用維度建模,這個說法Kimball 也沒有說過,而是 Inmon 在自己的書里說維度建模只適合數據集市,具體看《數據倉庫》第5張5.19節(應該是這一節)
PS:其實感覺他倆的觀點差不多,只是根據他們必須得給自己的觀點加油吶喊而已,兩個人互撕很多年了
Ⅲ 大數據都需要學什麼
這要看你學到什麼程度了,初級的大數據工程師,大數據開發工程師,大數據維護工程師啊,再往後發展大數據研發工程師,大數據架構師,數據分析師,大數據高級工程師,大數據分析師專家,大數據挖掘師,大數據演算法師等;不管的研發,還是數據分析,還是運維,都要看以後的工作需要和發展,還有自我提升等,不同的方向分工又不太相同,大數據作為一門基礎科學,無論在數據開發及分析、物聯網和人工智慧演算法訓練領域,都有著核心技術和職位訴求。具體學習大數據一般分為以下幾個階段:
第一階段:大數據基礎
Java基礎——Java語法基礎。掌握JAVA的開發環境搭建以及基礎知識等.能夠熟練使用邏輯語法進行代碼編寫
數據結構——數組、鏈表、棧、隊列、排序、二分查找、散列表、哈希表、二叉樹,紅黑樹、遞歸樹,堆和棧。繼續提升大家的計算機素養,掌握演算法初步。
MySQL基礎——mysql安裝、基本SQL語句、SQL優化。掌握資料庫的基本應用。
Javaweb——tomacat、servlet、JSP 、MVC。掌握web開發的相關內容,理解數據來源
高級java——面向對象、網路編程、反射、多線程。理解分布式程序運行原理,為以後閱讀大數據框架打下基礎。
linux基礎——虛擬機安裝、常用linux命令、shell腳本。學會使用linux操作系統,為部署大數據集群做准備。
第二階段:大數據框架
Hadoop——分布式存儲、分布式計算、公共通用介面。掌握部署大數據集群,熟練編寫map-rece程序。
Zookeeper——Zookeeper協調機制、選舉機制。搭建高可用集群。
Hive——數據倉庫搭建、數據導入和分析。初步掌握數據倉庫的概念,為後續企業級數倉做准備。
Hbase——Hbase集群搭建、大數據資料庫工作原理、列式存儲、高吞吐量應用開發。掌握大數據資料庫Hbase的應用,科學的行鍵設計,熱點數據處理。
Kafka——理解消息隊列、Kafka集群部署、高並發高可用數據採集框架搭建。掌握高可以高並發數據隊列系統設計、能處理峰值問題。
Scala——Scala語法基礎、常用運算元、非同步通信。掌握優秀的數據處理語言Scala
Spark——Spark集群搭建、離線數據處理、實時數據處理、機器學習、圖計算。掌握一棧式解決方案Spark,它是大數據的核心模塊。
常用輔助框架——Sqoop、Flume、Presto、impala、Phoenix、oozie、ElasticSearch、kylin、MongoDB、Redi、Druid。掌握常用工具和與大數據緊密相關的框架,提高工作效率,拓展框架功能。
第三階段:機器學習
python基礎——python基礎語法、面向對象、Numpy。掌握python基礎語法和機器學習相關的基礎框架。
數學基礎——線性代數、微積分、概率、凸優化。本部分內容理解即可,對優化模型很重要。
常用演算法——回歸、KNN、決策樹、聚類、集成學習、SVM、多分類、貝葉斯、EM、隱馬模型、深度學習。掌握常用計算器學習演算法的原理,能夠根據數據特性選擇合適的模型,訓練泛化能力強的模型。
第四階段:項目實操
雲和數據有大數據專業,可以詳細了解一下,看看這個專業的職業發展。
Ⅳ 誰有這本書 《Microsoft數據倉庫工具箱的相關推薦
數據倉庫:《資料庫系統概念》第六版 這本書比較好。 商務智能:《商業智能深入淺出:Cognos,Informatica技術與應用》 由於正式發行的商務智能cognos書目前我只發現這一本,所以買了。瀏覽了一下,不推薦,因為書里邊講的特理論。
Ⅳ 哪位親有《數據倉庫生命周期工具箱》的電子版,求!!謝謝!!
我幫你找到了,來這里抄看看,不知道是不是你需要的。如果下載需要積分,自己注冊一個用戶,就兩分鍾的時間.注冊後就有積分啦。
http://ishare.iask.sina.com.cn/search.php?key=%CA%FD%BE%DD%B2%D6%BF%E2%C9%FA%C3%FC%D6%DC%C6%DA%B9%A4%BE%DF%CF%E4&format=
Ⅵ 哪可以下載到《數據倉庫工具箱:維度建模的完全指南》中文電子版本
六維空間
Ⅶ 誰有這本書 《Microsoft數據倉庫工具箱的相關推薦
你要的郵件已經發出,請查收,有可能在垃圾箱里,如果10分鍾後沒收到,請在本問題里追問,我會再次發送,如果還有需要的朋友~
請點「贊」此條回答以後,在下面的評論里留下您的聯系方式即可!
Ⅷ 麻煩哪位高人推薦幾本數據挖掘的書
樓上來在誤人子弟了,資料庫自和數據倉庫還是區別一大把的,可能數據倉庫的很多實現上還是藉助於資料庫,但是要記住,現在已經很多成熟的東西是不基於資料庫了,或者精確一點說是不藉助於傳統的關系型資料庫了,比如Hyperion的數據倉庫產品的話,就是搭建在ESSBASE上的,這就是一種多維資料庫。
另外傳統資料庫的設計和現在OLAP數據倉庫的設計完全是不一樣的,傳統一般採用的雪花模型在OLAP中基本上不會採用的。所以還是很多不同的,不能等同對待
如果要學數據倉庫的話,我建議你看兩本書:構建數據倉庫、數據倉庫工具箱:維度建模的完全指南
把這兩本書看看就基本上具備理論基礎了。
Ⅸ 數據倉庫怎麼上手
額 我是做DW的 先說你第一個問題哈 ETL 表面意思是清洗轉換載入 這個不說了 網上自己內搜就行,我要說的容是,這個過程其實實施起來沒網上說的那麼復雜,ETL是為你的數據從業務資料庫流入到DW服務的 第二個問題 你現在有前台界面和資料庫建DW有這些東西足夠你用了,如果說還缺點什麼,最好把你們統計系統的資料庫數據字典搞一份 總結一下 你現在其實最缺的不是技術 是例子 因為我猜你還不知道DW應該長什麼樣 推薦你本書,拉爾夫的《數據倉庫工具箱》 另外補充樓上說的 數據量大小和用不用工具是沒有半毛錢關系的 新手推薦手寫