本文目录导读:
图片来源于网络,如有侵权联系删除
Hadoop是一款开源的分布式计算框架,广泛应用于大数据处理和分析,本文将详细介绍如何在虚拟机上安装Hadoop,帮助读者轻松上手Hadoop环境搭建。
准备工作
1、虚拟机软件:如VirtualBox、VMware等。
2、操作系统:推荐使用Linux操作系统,如CentOS、Ubuntu等。
3、Hadoop版本:本文以Hadoop 3.3.1为例。
安装步骤
1、创建虚拟机
(1)打开虚拟机软件,点击“新建”按钮。
(2)在“新建虚拟机向导”中,选择“自定义(高级)”,点击“下一步”。
(3)选择操作系统,本文以CentOS 7为例,点击“下一步”。
(4)设置虚拟机名称和安装路径,点击“下一步”。
(5)设置内存大小,建议分配4GB以上,点击“下一步”。
(6)设置虚拟硬盘大小,建议至少50GB,点击“下一步”。
(7)选择虚拟硬盘存储类型,本文以“固定大小”为例,点击“下一步”。
(8)设置虚拟硬盘文件大小,点击“下一步”。
(9)完成虚拟机创建,点击“创建”。
图片来源于网络,如有侵权联系删除
2、安装操作系统
(1)打开虚拟机,选择“启动”选项,进入CentOS 7安装界面。
(2)根据提示,选择语言、键盘布局等,点击“下一步”。
(3)选择安装类型,本文以“自定义(高级)”为例,点击“下一步”。
(4)选择分区方式,本文以“使用所有空间”为例,点击“下一步”。
(5)设置分区,本文以根分区(/)、swap分区、home分区为例,点击“下一步”。
(6)配置网络,选择“手动配置网络”,点击“下一步”。
(7)配置IP地址、子网掩码、网关等,点击“下一步”。
(8)设置主机名,点击“下一步”。
(9)设置用户和密码,点击“下一步”。
(10)安装软件包,等待安装完成。
(11)重启虚拟机,进入系统。
3、安装Hadoop
(1)在虚拟机中,打开终端。
图片来源于网络,如有侵权联系删除
(2)使用以下命令下载Hadoop 3.3.1安装包:
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
(3)解压安装包:
tar -zxvf hadoop-3.3.1.tar.gz -C /opt/
(4)设置Hadoop环境变量:
vi /etc/profile
在文件末尾添加以下内容:
export HADOOP_HOME=/opt/hadoop-3.3.1 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
(5)使环境变量生效:
source /etc/profile
(6)创建Hadoop临时文件目录:
mkdir -p /tmp/hadoop-yarn-localşte
(7)设置Hadoop临时文件目录权限:
chown -R hadoop:hadoop /tmp/hadoop-yarn-local
(8)设置Hadoop数据目录权限:
chown -R hadoop:hadoop /opt/hadoop-3.3.1/data
测试Hadoop环境
1、格式化HDFS:
hdfs namenode -format
2、启动Hadoop服务:
start-dfs.sh start-yarn.sh
3、测试Hadoop环境:
jps
在终端中,应该可以看到以下进程:
NameNode DataNode ResourceManager NodeManager
至此,Hadoop环境搭建完成,您可以在虚拟机上使用Hadoop进行大数据处理和分析。
标签: #虚拟机安装hadoop步骤
评论列表