A. 搭建Hadoop集群,一个月6T的数量需要几台服务器
最好是两个做成HA
关于硬盘:
6T的数据容量,看你副本数量设置是多少,一般默认为3,那么仅这些就需要18T硬盘,稍微大一点20T吧;这仅仅是HDFS存储;(这里我说的是一个月的,你数据保存几个月,就乘几倍)
如果你集群上面要跑计算,MR计算出来的数据要保存HDFS的,所以,还是要根据你的结果数据来做判断,大小就看你计算任务了.
一般是这样计算硬盘大小
(原始数据+中间数据+结果数据)*副本数量=总硬盘大小
关于内存:
namenode不用说了,主要就是用内存保存block和node之间对应关系的,也是要根据数据大小计算的,6T/Block大小(默认为128M)=有多少block-->M个
一个block占多少内存: 保守地设置每一百万数据块需要1000MB内存
namenode总内存(兆M)=M*1000MB/100万
datanode的内存: 一般问题不大,一般都是用于mr的计算,这个东西根据你性能的需要设置
关于多少台机器?
根据Task任务的数量和你的性能指标来做决定
一个Block对应一个Mapper任务,上面算出来M个Block了,mapper任务也是那么多
实际测试一下,一定数据量在x台机器上运行时间,根据你的指标去评定要多少台机器
hadoop集群的性能和节点个数近似成正向关系
B. 一个Hadoop集群的机器数量最少要几个

节选自《hadoop下的分布式搜索引擎》(太原理工大学),由此可见,hadoop多节点部署最少可以是2个节点,即一个NameNode和一个DataNode。
C. hadoop存储容量,计算时需要多少容量
如果文件小于64MB,存储按该文件的块大小等于该文件的大小。
读取时是根据存在namenode上面的映射表来读取的。
按实际存储的大小来读取,不是从硬盘上面读取的,是从HDFS
上面读取的。
另外,在文件上传时,就会根据块的大小将各个块分布到各个
datanode节点上面的。如果文件已经上传,需要修改默认块的大小,
那么需要执行一条语句将HDFS上面的原有文件重新分块并存储。
D. hadoop集群生产中一般最少需要多少台服务器
5台
dfs系统 3台 namenode ,secondaryname,datanode
mr系统 2台 resourcemanager和一台nodemanager
一套完整的hadoop要 dfs+mr的
E. 如何架构大数据系统 hadoop
大数据数量庞大,格式多样化。大量数据由家庭、制造工厂和办公场所的各种设备、互联网事务交易、社交网络的活动、自动化传感器、移动设备以及科研仪器等生成。它的爆炸式增长已超出了传统IT基础架构的处理能力,给企业和社会带来严峻的数据管理问题。因此必须开发新的数据架构,围绕“数据收集、数据管理、数据分析、知识形成、智慧行动”的全过程,开发使用这些数据,释放出更多数据的隐藏价值。
一、大数据建设思路
1)数据的获得

四、总结
基于分布式技术构建的大数据平台能够有效降低数据存储成本,提升数据分析处理效率,并具备海量数据、高并发场景的支撑能力,可大幅缩短数据查询响应时间,满足企业各上层应用的数据需求。
F. Hadoop的搭建一般至少要多少台机器
这个要看你的需求,比如是生产环境还是测试用
如果是生产,要看你的数据量,需要的处理能力等
如果你只是学习用,条件好点的,弄3台以上的机,一个namenode,两个datanode
如果实在没有条件,就两台机,一个namenode一个datanode
实在没有条件,就用一台机,装几个虚拟机
G. 学习hadoop需要哪些准备(知识硬件软件)
1、安装:HADOOP安装在LINUX下,测试的话,安装在windows的cpywin下也可。
2、开发:HADOOP开发,也就是MAPREDUCE开发。
要有java基础,理解maprece编程理念。开发环境可以是ECLIPSE。不需要学hibernate,struts,SPRING等框架。
3、参考:http://www.hadoopor.com网站上,看看更多的内容。
希望对你有帮助
参考资料http://..com/question/357576874.html
H. 搭建一个用于科研的hadoop平台,都需要些什么样的设备
虚拟机。。。人家搞科研,这不科学吧。Hadoop特点就是可以部署在一些廉价的机器上,所以我觉得最主要是有一天强大的服务器来作为Hadoop的Namenode,DataNode的机器就随便点
I. 学习hadoop需要自己电脑什么配置
您可以尝试一下搭载了第六代智能英特尔酷睿处理器的产品,无缝融合的英特尔锐炬显卡及核芯显卡,小身材,大能量,澎湃性能的同时兼具酷冷低耗,惊人电池续航表现,3D应用及多媒体视觉体验无与伦比,硬件级加速,完美畅享超高清4K视频编码及照片,同时支持栩栩如生的1080p高清视屏聊天。
全新一代锐炬Pro及锐炬显卡,CPU内部新增图形专用高速EDRAM缓存,带来媲美中高端独显的极致游戏体验。
Dell XPS 15 轻薄 SKL-H 15" Consumer 25-Oct
HP Spectre x360 2in1 i5/i7 Skylake 13" windows10
Dell Ins13BR-1708T I7-6500U SKL-U 13" Consumer 30-Sep
J. 想要搭建hadoop集群,想问一下应该配备什么样的硬件设备,顺便给出每个硬件设备的大概价格。
可以用一台普通pc机,加虚拟机来完成小范围集群配置