虚拟机搭建hadoop集群的步骤，hadoop集群3台虚拟机搭建完整教程

欧气 2024年10月01日 03:16 4 0

本文目录导读：

环境准备
网络配置
安装JDK
安装Hadoop

《Hadoop集群3台虚拟机搭建完整教程》

环境准备

1、虚拟机软件选择与安装

- 这里我们选择VirtualBox作为虚拟机软件，它是一款开源的虚拟机软件，支持多种操作系统，可以从官方网站（https://www.virtualbox.org/）下载适合自己操作系统的版本并进行安装。

虚拟机搭建hadoop集群的步骤，hadoop集群3台虚拟机搭建完整教程

图片来源于网络，如有侵权联系删除

- 安装过程按照默认设置逐步进行即可，安装完成后打开VirtualBox。

2、操作系统选择与安装

- 在每台虚拟机上安装CentOS操作系统，我们可以从CentOS官方网站（https://www.centos.org/）下载CentOS的镜像文件。

- 在VirtualBox中创建新的虚拟机，设置虚拟机的名称（例如hadoop1、hadoop2、hadoop3）、内存大小（建议每台虚拟机至少分配2GB内存）、硬盘大小（根据需求分配，例如20GB）等参数。

- 在虚拟机的设置中，将下载好的CentOS镜像文件挂载到虚拟光驱，然后启动虚拟机，按照CentOS安装向导进行安装，安装过程中需要注意设置root密码、创建普通用户等操作。

网络配置

1、设置静态IP地址

- 在每台CentOS虚拟机中，编辑网络配置文件，对于CentOS 7，网络配置文件为/etc/sysconfig/network - scripts/ifcfg - enp0s3（网络接口名称可能因系统不同而有所差异）。

- 将BOOTPROTO设置为static，然后添加IP地址、子网掩码、网关和Dns服务器等信息。

```

IPADDR = 192.168.100.101

NETMASK = 255.255.255.0

GATEWAY = 192.168.100.1

DNS1 = 8.8.8.8

```

- 重启网络服务使配置生效，命令为systemctl restart network。

2、主机名配置

- 在每台虚拟机上设置不同的主机名，使用命令hostnamectl set - hostname hadoop1（在第一台虚拟机上）、hostnamectl set - hostname hadoop2（在第二台虚拟机上）、hostnamectl set - hostname hadoop3（在第三台虚拟机上）。

- 编辑每台虚拟机的/etc/hosts文件，添加如下内容：

```

192.168.100.101 hadoop1

192.168.100.102 hadoop2

192.168.100.103 hadoop3

```

安装JDK

1、下载JDK

- 从Oracle官方网站（https://www.oracle.com/java/technologies/javase - download.html）下载适合CentOS的JDK版本（例如JDK 8）。

2、安装JDK

- 在每台虚拟机上创建一个目录，例如/usr/java，将下载的JDK压缩包解压到该目录下。

- 配置环境变量，编辑/etc/profile文件，添加如下内容：

```

export JAVA_HOME = /usr/java/jdk1.8.0_XXX

export PATH = $JAVA_HOME/bin:$PATH

export CLASSPATH =.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

```

- 使环境变量生效，执行命令source /etc/profile。

安装Hadoop

1、下载Hadoop

虚拟机搭建hadoop集群的步骤，hadoop集群3台虚拟机搭建完整教程

图片来源于网络，如有侵权联系删除

- 从Hadoop官方网站（https://hadoop.apache.org/）下载稳定版本的Hadoop，例如Hadoop 3.x。

2、安装Hadoop

- 在每台虚拟机上创建一个目录，例如/usr/local/hadoop，将下载的Hadoop压缩包解压到该目录下。

- 配置Hadoop环境变量，编辑/etc/profile文件，添加如下内容：

```

export HADOOP_HOME = /usr/local/hadoop

export PATH = $HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

```

- 使环境变量生效，执行命令source /etc/profile。

3、配置Hadoop集群

- 进入$HADOOP_HOME/etc/hadoop目录，对以下文件进行配置。

core - site.xml

```xml

<name>fs.defaultFS</name>

<value>hdfs://hadoop1:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

</configuration>

```

hdfs - site.xml

```xml

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>/usr/local/hadoop/dfs/name</value>

</property>

虚拟机搭建hadoop集群的步骤，hadoop集群3台虚拟机搭建完整教程

图片来源于网络，如有侵权联系删除

<name>dfs.datanode.data.dir</name>

<value>/usr/local/hadoop/dfs/data</value>

</property>

</configuration>

```

mapred - site.xml

```xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

```

yarn - site.xml

```xml

<name>yarn.resourcemanager.hostname</name>

<value>hadoop1</value>

</property>

<name>yarn.nodemanager.aux - services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

```

- 在hadoop1上，执行hdfs namenode - format命令格式化HDFS。

4、启动Hadoop集群

- 在hadoop1上，进入$HADOOP_HOME/sbin目录，执行start - all.sh命令启动Hadoop集群。

- 使用jps命令在每台虚拟机上查看进程是否正常启动，在hadoop1上应该看到NameNode、ResourceManager等进程，在hadoop2和hadoop3上应该看到DataNode、NodeManager等进程。

通过以上步骤，我们就成功搭建了一个由3台虚拟机组成的Hadoop集群，可以在这个集群上进行大数据相关的开发和运算工作了。

标签： #虚拟机 #hadoop集群 #搭建 #步骤