环境
系统:CentOS Linux 7.4.1708 (Core) 客户端:putty 服务器:虚拟机1core、2G RAM 同时搭建了宝塔面板(自动配置了java8)
Hadoop下载
为了统一版本,全部使用hadoop-2.6.0-cdh5.7.0
点击可进入官方推荐配置页
解压并配置
将下载好的文件通过宝塔上传到服务器,这里选择上传到/www/hadoop
目录
解压tar包
配置
新建用户
新建hadoop用户,忽略密码强度提示
adduser hadoop
passwd hadoop
为方便远程连接和学习,同时授予root权限,输入whereis sudoers
查看权限控制文件位置
[root@fjy ~]# whereis sudoers
sudoers: /etc/sudoers /etc/sudoers.d /usr/libexec/sudoers.so /usr/share/man/man5/sudoers.5.gz
使用宝塔找到并修改/etc/sudoers文件
配置新用户免密码远程登录
切换至hadoop
用户,使用 ssh-keygen -t rsa
生成私钥信息,位置在/home/hadoop/
,并且忽略所有提示输入的信息
查看生成的文件,该SSH文件夹为隐藏文件夹,故用ls -a
查看,可见自动生成了.ssh
目录和id_rsa
,id_rsa.pub
两个文件
复制公钥到.ssh目录
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
查看JAVA目录
因为是宝塔自动配置的java8,所以要首先查看当前java环境变量位置,使用如下命令
update-alternatives --config java
此时宝塔自动将java配置到/usr/java/jdk1.8.0_121/jre/bin/java
目录
即/usr/java/jdk1.8.0_121
为java环境变量的目录
配置hadoop的java目录
使用宝塔进入hadoop目录下的etc/hadoop/hadoop-env.sh
,对应此处的绝对路径应为/www/hadoop/hadoop-2.6.0-cdh5.7.0/etc/hadoop
使用宝塔编辑文件,加入java环境变量位置
配置分布式文件参数
打开core-site.xml
,配置如下
fs.defaultFS
hdfs://192.168.79.129:8020
hadoop.tmp.dir
/www/hadoop/tmp
打开hdfs-site.xml
,配置如下
dfs.replication
1
启动
初始化
进入/www/hadoop/hadoop-2.6.0-cdh5.7.0/bin
目录,使用如下语句初始化Hadoop,该操作仅执行一次即可,以后使用无需重复执行,否则执行后会删除当前hadoop上的所有文件
hadoop namenode -format
滚动均为info
级别的日志
可看到已初始化成功
启动HDFS
切换到hadoop用户,进入/www/hadoop/hadoop-2.6.0-cdh5.7.0/sbin
目录
输入./start-dfs.sh
启动HDFS服务
【注意】,要提前在root用户下对/www/hadoop
授予hadoop用户读写权限,否则无法启动
使用jps
查看当前的java进程,若出现如下四个进程表示HDFS服务启动成功
外部访问浏览器客户端
首先使用宝塔开放50070端口
使用外部浏览器访问ip:50070可查看如下页面,则表示HDFS已成功启动
hdfs命令
配置hdfs命令
使用vi ~/.bash_profile
进入配置文件,按如下配置
export HADOOP_HOME=/www/hadoop/hadoop-2.6.0-cdh5.7.0
export PATH=$HADOOP_HOME/bin:$PATH
使配置文件生效source ~/.bash_profile
输入hdfs
回车测试命令是否生效,若出现如下画面则表示命令已经生效
命令测试
先在本地创建hello.txt
文件,使用 hadoop fs -put hello.txt /
命令将文件推送到hdfs根目录下
查看服务器根目录hadoop fs -ls /
,已经有该文件,hadoop伪分布式配置完成