小工具      在线工具  汉语词典  dos游戏  css  js  c++  java

Ubuntu 20.04下搭建单机伪分布式Hadoop

大数据,hadoop 额外说明

收录于:17天前

JDK环境配置

Hadoop需要JDK环境安装和配置:

https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html官网下载Linux的版本如jdk-8u231-linux-x64.tar.gz

新建Java文件夹并解压JDK:tar -zxvf jdk-8u231-linux-x64.tar.gz
在这里插入图片描述

配置环境变量:

cd /etc
sudo vi profile

在文件末尾添加以下内容(具体路径根据环境而定):

export JAVA_HOME=/Java/jdk1.8.0_11
export JRE_HOME=/Java/jdk1.8.0_11/jre
export PATH=${
    JAVA_HOME}/bin:$PATH

在这里插入图片描述

保存退出,在终端界面使用命令: source /etc/profile使配置文件生效。输入java -version查看是否配置成功
在这里插入图片描述

也可以选择安装openjdk:

#安装命令
sudo apt-get install openjdk-8-jre openjdk-8-jdk

#卸载命令
sudo apt-get remove openjdk-8-jdk
sudo apt-get remove openjdk-8-jre-headless 

下载并配置Hadoop

新建Hadoop文件夹,解压文件tar -zxvf hadoop-2.10.1.tar.gz
在这里插入图片描述
在这里插入图片描述
hadoop需要ssh免密登陆等功能,因此先安装ssh。

 sudo apt-get install ssh

解压后修改hadoop-env.sh配置文件在这里插入图片描述修改JAVA_HOME为本机的JDK路径。在这里插入图片描述

配置Hadoop的环境变量:在/etc/profile追加Hadoop的环境变量。
在这里插入图片描述

修改core-site.xml配置文件
在这里插入图片描述


<configuration>
	<property>
        	<name>fs.defaultFS</name>
        	<value>hdfs://localhost:9000</value>
   	</property>
   	<property>
        	<name>hadoop.tmp.dir</name>
        	<value>/home/master/Hadoop/hadoop-2.10.1/etc/tmp</value>
   	</property>
   	
</configuration>

注意一定要设置hadoop.tem.dir,否则下次启动时会找不到namenode。

修改hdfs-site.xml配置文件
在这里插入图片描述

<configuration>
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
</configuration>

设置免密登陆

输入ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa出现下面内容:
在这里插入图片描述
再输入cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
接着输入chmod 0600 ~/.ssh/authorized_keys
在这里插入图片描述
检验免密登录是否成功:
使用命令:ssh localhost输入yes,出现下面情况就说明ok了。在这里插入图片描述

验证Hadoop安装

格式化文件系统,只能格式化一次。hdfs namenode -format
在这里插入图片描述
在这里插入图片描述

启动hadoop进程start-dfs.shstart-all.sh结果却出现:
在这里插入图片描述
出错的原因是脚本命令实在hadoop文件夹下的sbin目录而不是bin目录
在这里插入图片描述
修改/etc/profile的最后一个PATH的${HADOOP_HOME}/sbin将bin改为sbin即可。

修改后成功启动hadoop集群:
在这里插入图片描述
输入jps查看hadoop进程:
在这里插入图片描述

注意需要在namenode上启动集群

通过web访问hadoop
主机输入:[ip:50070]访问NameNode
在这里插入图片描述
主机输入:[ip:50090]访问DataNode

在这里插入图片描述

常见命令:
stop-all.shstop-dfs.sh停止所有进程。
start-all.shstart-dfs.sh启动所有进程。
jps查看所有进程。

上述hadoop环境采用伪分布式方式搭建,一台虚拟机同时作为主节点和从节点。搭建完整的集群请参考Linux Commune。

更多资讯访问Linux公社乌班图论坛

. . .

相关推荐

额外说明

Java进阶——垃圾收集及其算法

垃圾收集 垃圾收集 Java堆垃圾收集 方法区垃圾收集 分代收集 分代收集理论 分代收集名词 垃圾收集算法 标记-清除(Mark-Sweep)算法 标记-复制(Mark-Copy)算法 标记-整理(Mark-Compact)算法 Hotspot算法细节

额外说明

关于SMB协议

0x00 在内网利用PTH进行横向移动时常使用的atexec/smbexec/psexec等都有smb协议的身影,而笔者对smb协议理解的也比较粗浅,所以对smb协议进行一个系统的学习,并作个记录。 0x01 SMBv1 CIFS协议是SMB协议的一个特

额外说明

单元测试界的高富帅,Pytest框架(二)前后方法及fixture机制

前言 上一篇文章入门篇咱们介绍了pytest的基本使用,这一篇文章专门给大家讲解pytest中关于用例执行的前后置步骤处理,pytest中用例执行的前后置处理既可以通过测试夹具(fixtrue)来实现,也可以通过xunit 风格的前后置方法来实现。接下来

额外说明

RabbitMQ-其他知识

文章目录 一.其他知识点 1.1 幂等性 1.2 优先级队列 1.3 惰性队列 二.镜像队列 三.实现负载高可用 四.联邦交换机(Federation Exchange) 五.联邦队列(Federation Queue) 六.Shovel 提示:以下是本

额外说明

C语言之指针

首先我们要知道指针有以下几个重点内容 第一种就是字符指针  它存放的时候是将第一个字符的地址存入指针变量即可,而非全部字符地址! 如此处ch取地址仅仅取了第一个字母w的地址存入pc指针中! 此处还有一种写法如下。  直接写字符串,存入p指针变量的也是首字

额外说明

Eclipse主题安装

Eclipse主题安装 ## 一、打开Eclipse插件下载 二、输入theme进行搜索,选择主题下载并安装 1/3 2/3 3/3 三、重启并选择深浅模式 1/2 2/2

额外说明

【RocketMQ系列五】消息示例-顺序消息&延迟消息&广播消息的实现

1. 前言 上一篇文章我们介绍了简单消息的实现,本文将主要来介绍顺序消息的实现,顺序消息分为局部顺序消息和全局顺序消息。 顺序消息指的是消费者在消费消息时,按照生产者发送消息的顺序进行消费。即先发送的先消费【FIFO】。 顺序消息分为 全局顺序消息和局部

额外说明

基于SpringBoot+Vue的漫画之家系统【源码+论文+演示视频+包运行成功】

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。 -- 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通 ❤️ 2.网上优质的Python题库很少,这里给大家推荐一款非常棒

额外说明

【软考 系统架构设计师】知识产权与标准化① 知识产权

>>回到总目录<< 为了不辜负已经订阅了专栏的同学们的信任,所以本专栏不会有任何的优惠活动。 另外,当订阅人数每次达到 2 n ( n > 2 ) 2^n(n>2) 2

额外说明

Windows系统目录ieproxy.dll文件出现错误的解决办法

其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题,如果是新手第一时间会认为是软件或游戏出错了,其实并不是这样,其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库,这时你可以下载这个ieproxy.dll文件(

ads via 小工具