学习 HDFS(一):概览

HDFS 是 Hadoop Distributed File System (Hadoop 分布式文件系统)的缩写,是 Hadoop 核心项目之一(另外两个分别是 YARN 和 MapReduce)。HDFS 提供了高容错、高吞吐、易扩展、高可用的文件系统。 架构 HDFS 是一个主从(Master/Slave) »

学习 HDFS(十):跨集群拷贝

使用 获取文件系统地址: hdfs getconf -confKey fs.defaultFS 拷贝: hadoop distcp hdfs://master1/from hdfs://master2/to 参考:http://hadoop.apache.org/docs/stable/hadoop-distcp/DistCp.html »

学习 HDFS(九):快照

简介 HDFS 快照是 HDFS 某个时间点的只读拷贝。 HDFS 快照常用于数据备份、防止用户错误和灾难恢复。 管理操作 允许一个目录创建快照: hdfs dfsadmin -allowSnapshot <path> 注意:在所有快照被删除之前,允许创建快照的目录即不可以删除也不可以重命名 反之,取消: hdfs dfsadmin -disallowSnapshot <path& »

学习 HDFS(八):归档

归档 命令格式: hadoop archive -archiveName name -p <parent> [-r <replication factor>] <src>* <dest> 以归档 /test 目录下所有文件到 /user/lizhen »