每天30分钟大数据2:HDFS基本概念 2019年1月20日 HDFS即Hadoop Distributed File System的简称,是一个被设计为运行在廉价机器上的分布式文件系统,是Google分布式文件系统GFS的开源实现。 数据块(Data Blocks)是HDFS存储文件的最基本单元,HDFS通过分块存储的方式提高文件的读…… 阅读全文
每天30分钟大数据:大数据平台管理组件Ambari的安装和初步使用 2019年1月13日 Apache Ambari是Apache Software Foundation的一个软件项目。 Ambari使系统管理员能够配置,管理和监控Hadoop集群,还可以将Hadoop与现有企业基础架构集成。 Ambari是Hadoop的一个子项目,但现在它本身就是一个顶级项目…… 阅读全文