本文目录导读:
图片来源于网络,如有侵权联系删除
随着大数据时代的到来,Hadoop作为一款分布式计算框架,在数据处理和分析领域发挥着越来越重要的作用,本文将详细讲解Hadoop的安装与伪分布式集群搭建过程,帮助读者快速上手,掌握Hadoop的基本操作。
环境准备
1、操作系统:Linux系统(推荐CentOS 7)
2、JDK:Java Development Kit 1.8
3、Hadoop版本:推荐使用Hadoop 3.2.1版本
JDK安装
1、下载JDK:前往Oracle官网下载JDK 1.8版本,选择Linux版本进行下载。
2、解压JDK:将下载的JDK文件解压到指定目录,/usr/local/java
3、配置环境变量:编辑profile文件,添加以下内容:
export JAVA_HOME=/usr/local/java/jdk1.8.0_241 export PATH=$PATH:$JAVA_HOME/bin
4、使配置生效:执行以下命令使配置生效:
图片来源于网络,如有侵权联系删除
source /etc/profile
5、验证JDK安装:执行以下命令,查看JDK版本是否正确:
java -version
Hadoop安装
1、下载Hadoop:前往Apache Hadoop官网下载Hadoop 3.2.1版本,选择Linux版本进行下载。
2、解压Hadoop:将下载的Hadoop文件解压到指定目录,/usr/local/hadoop
3、配置Hadoop环境变量:编辑profile文件,添加以下内容:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
4、使配置生效:执行以下命令使配置生效:
source /etc/profile
5、配置Hadoop:进入Hadoop配置目录,执行以下命令:
cd /usr/local/hadoop/etc/hadoop
(1)修改hadoop-env.sh文件:
export JAVA_HOME=/usr/local/java/jdk1.8.0_241
(2)修改core-site.xml文件:
图片来源于网络,如有侵权联系删除
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop/tmp</value> </property> </configuration>
(3)修改hdfs-site.xml文件:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop/hdfs/datanode</value> </property> </configuration>
(4)修改slaves文件:
node1 node2
6、格式化NameNode:
hdfs namenode -format
启动Hadoop集群
1、启动NameNode:
start-dfs.sh
2、启动ResourceManager:
start-yarn.sh
3、验证集群是否启动成功:
jps
通过本文的详细讲解,读者可以快速掌握Hadoop的安装与伪分布式集群搭建过程,在实际应用中,Hadoop可以帮助我们处理海量数据,提高数据处理效率,希望本文对读者有所帮助。
标签: #hadoop安装与伪分布式集群搭建头歌
评论列表