随着Apache Hadoop的起步,云客户的增多面临的首要问题就是如何为他们新的的Hadoop集群选择合适的硬件。
尽管Hadoop被设计为运行在行业标准的硬件上,提出一个理想的集群配置不想提供硬件规格列表那么简单。 选择硬件,为给定的负载在性能和经济性提供最佳平衡是需要测试和验证其有效性。(比如,IO密集型工作负载的用户将会为每个核心主轴投资更多)。
在这个博客帖子中,你将会学到一些工作负载评估的原则和它在硬件选择中起着至关重要的作用。在这个过程中,你也将学到Hadoop管理员应该考虑到各种因素。
结合存储和计算
过去的十年,IT组织已经标准化了刀片服务器和存储区域网(SAN)来满足联网和处理密集型的工作负载。尽管这个模型对于一些方面的标准程序是有相当意义 的,比如网站服务器,程序服务器,小型结构化数据库,数据移动等,但随着数据数量和用户数的增长,对于基础设施的要求也已经改变。网站服务器现在有了缓存 层;数据库需要本地硬盘支持大规模地并行;数据迁移量也超过了本地可处理的数量。
IT技术资料分享网主要为你分享电脑实用技巧、实用软件、pdf文档资源、windows系统、个人网盘IT技术资料等互联网IT技术相关的文章。
异次元软件世界整合了海量优秀应用软件与互联网资源,包括网络软件、多媒体体系、系统工具、技术教程、编程开发、硬件相关等各种互联网资源下载。
我爱自然语言处理主要为广大自然语言处理爱好者提供NLP相关的文章,同时提供NLP技术交流群。
巴士下载站专业提供绿色软件下载、常用软件下载、手机游戏下载、手机软件下载、电脑游戏下载等服务,是一个值得用户放心的免费软件下载网站。
迅雷离线下载是迅雷公司于2009年开发的付费离线下载服务。以服务器高速代理下载,中转到离线空间,再以用户从迅雷离线下载服务器下载到本机的方式提供网络加速服务。是...
慕轲的博客专注于发布有关IT互联网领域知识内容平台,主要涵盖搜索引擎优化(SEO)知识、建站心得、美文美句、推广营销等各方面知识。