环境

系统:CentOS Linux 7.4.1708 (Core)
客户端:putty
服务器:虚拟机1core、2G RAM
同时搭建了宝塔面板(自动配置了java8)

Hadoop下载

CDH版本Hadoop下载

为了统一版本,全部使用hadoop-2.6.0-cdh5.7.0
请输入图片描述

点击可进入官方推荐配置页
请输入图片描述

解压并配置

将下载好的文件通过宝塔上传到服务器,这里选择上传到/www/hadoop目录
请输入图片描述

解压tar包
请输入图片描述

配置

新建用户

新建hadoop用户,忽略密码强度提示

    adduser hadoop
    passwd hadoop

请输入图片描述

为方便远程连接和学习,同时授予root权限,输入whereis sudoers查看权限控制文件位置

    [root@fjy ~]# whereis sudoers
    sudoers: /etc/sudoers /etc/sudoers.d /usr/libexec/sudoers.so /usr/share/man/man5/sudoers.5.gz

使用宝塔找到并修改/etc/sudoers文件
请输入图片描述

请输入图片描述

配置新用户免密码远程登录

切换至hadoop用户,使用 ssh-keygen -t rsa生成私钥信息,位置在/home/hadoop/,并且忽略所有提示输入的信息
请输入图片描述

查看生成的文件,该SSH文件夹为隐藏文件夹,故用ls -a查看,可见自动生成了.ssh目录和id_rsa,id_rsa.pub两个文件
请输入图片描述

复制公钥到.ssh目录

    cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

请输入图片描述

查看JAVA目录

因为是宝塔自动配置的java8,所以要首先查看当前java环境变量位置,使用如下命令

     update-alternatives --config java

请输入图片描述

此时宝塔自动将java配置到/usr/java/jdk1.8.0_121/jre/bin/java目录
/usr/java/jdk1.8.0_121为java环境变量的目录

配置hadoop的java目录

使用宝塔进入hadoop目录下的etc/hadoop/hadoop-env.sh,对应此处的绝对路径应为/www/hadoop/hadoop-2.6.0-cdh5.7.0/etc/hadoop
使用宝塔编辑文件,加入java环境变量位置
请输入图片描述

请输入图片描述

配置分布式文件参数

打开core-site.xml,配置如下

    <configuration>
        <property>
            <name>fs.defaultFS</name>
            <!-- 配置主机IP-->
            <value>hdfs://192.168.79.129:8020</value>
        </property>
    
        <!-- 配置临时文件位置-->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/www/hadoop/tmp</value>
        </property>
    </configuration>

请输入图片描述

打开hdfs-site.xml,配置如下

    <configuration>
        <property>
            <name>dfs.replication</name>
            <!-- 配置副本数量-->
            <value>1</value>
        </property>
    </configuration>

请输入图片描述

启动

初始化

进入/www/hadoop/hadoop-2.6.0-cdh5.7.0/bin目录,使用如下语句初始化Hadoop,该操作仅执行一次即可,以后使用无需重复执行,否则执行后会删除当前hadoop上的所有文件

    hadoop namenode -format

请输入图片描述

滚动均为info级别的日志
请输入图片描述

可看到已初始化成功
请输入图片描述

启动HDFS

切换到hadoop用户,进入/www/hadoop/hadoop-2.6.0-cdh5.7.0/sbin目录
请输入图片描述

输入./start-dfs.sh启动HDFS服务
请输入图片描述

【注意】,要提前在root用户下对/www/hadoop授予hadoop用户读写权限,否则无法启动
请输入图片描述

使用jps查看当前的java进程,若出现如下四个进程表示HDFS服务启动成功

请输入图片描述

外部访问浏览器客户端

首先使用宝塔开放50070端口
请输入图片描述

使用外部浏览器访问ip:50070可查看如下页面,则表示HDFS已成功启动
请输入图片描述

hdfs命令

配置hdfs命令

使用vi ~/.bash_profile进入配置文件,按如下配置

    export HADOOP_HOME=/www/hadoop/hadoop-2.6.0-cdh5.7.0
    export PATH=$HADOOP_HOME/bin:$PATH

使配置文件生效source ~/.bash_profile
输入hdfs回车测试命令是否生效,若出现如下画面则表示命令已经生效
请输入图片描述

命令测试

先在本地创建hello.txt文件,使用 hadoop fs -put hello.txt /命令将文件推送到hdfs根目录下
请输入图片描述

查看服务器根目录hadoop fs -ls /,已经有该文件,hadoop伪分布式配置完成
请输入图片描述

Last modification:September 7th, 2023 at 02:58 pm
如果觉得我的文章对你有用,请随意赞赏