Hadoop安装准备工作
安装JDK
- 下载Oracle JDK 官网下载地址
tar -zxvf jdk-8u40-linux-x64.tar.gz
mkdir /usr/local/jdk
mv jdk-8u40-linux-x64 /usr/local/jdk -rf
vi /etc/profile
最后面加入:
source /etc/profile
java -version
查看当前Java版本是不是1.8
SSH免密码登录
集群需要把第一个的~/.ssh/authorized_keys拷贝到其他的服务器,保证互相之间可以免密码登录
.ssh目录的权限必须是700
.ssh/authorized_keys文件权限必须是600
为所有集群中的主机添加新用户
修改计算机名称
在/etc/hosts 文件中添加IP和主机名映射
通常为
关闭Selinux
修改/etc/selinux/config文件中设置SELINUX=disabled ,然后重启服务器。
关闭Iptables
Hadoop单机伪分布式安装
单机伪分布式1.*版本安装
- 修改conf/hadoop-env.sh
- 修改conf/core-site.xml
- 修改conf/hdfs-site.xml
- 修改conf/mapred-site.xml
- 常用配置参考 - Hadoop常用配置
- 格式化namenode
普通的2.*版本安装
- 按照1.的方式修改/etc/hadoop/文件的内容
如果在${hadoop_home}目录下存在conf,则会优先加载conf目录的配置(为了对1.*的兼容) http://hadoop.apache.org/docs/r2.3.0/hadoop-project-dist/hadoop-common/ClusterSetup.html
- Cloudera Manager安装 参照另一文档:<hadoop (二) - cloudera 5.0.1 安装>
Hadoop Cluster安装
- 所有服务器的Hadoop用户必须相同
- 必须开启SSH免密码登录
- Hadoop存放路径相同(将NameNode的Hadoop平行拷贝到其他服务器)
- 修改conf/slaves文件添加DataNode的hostname
- 修改conf/masters文件添加SecondaryNameNode的HostName
- 通过NameNode的bin/start-all.sh开启
- 然后在每台服务器用jps查看是否每个服务正确启动
参考资料
Hadoop官方文档 : http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html
陆嘉恒 : 《Hadoop实战》 第2版