Docker搭建Spark集群，你学会了吗？|当前通讯

docker搭建spark集群

有个小技巧：先配置好一个，在（宿主机上）复制scp -r拷贝Spark到其他Slaves。

(资料图片)

1.安装配置基础Spark

【在test-cluster-hap-master-01虚拟主机上】

将已下载好的Spark压缩包（spark-3.1.1-bin-hadoop-3.2.2-lbx-jszt.tgz）通过工具【XFtp】拷贝到虚拟主机的opt目录下：

2.通过脚本挂起镜像

cd   /opt/script/setup/spark

test-cluster-spk-master-01

#!/bin/bash #编写作者：千羽的编程时光cname="test-cluster-spk-master-01"#port1="8080"#port2="7077"log="/opt/data/"${cname}images="10.249.0.137:80/base/jdk-1.8:20210202"mkdir -p ${log}mkdir ${log}/logsmkdir ${log}/workmkdir ${log}/datamkdir ${log}/jars# docker run -d --net=overlay-net --ip ${ip} -p ${port1}:${port1} -p ${port2}:${port2} --name ${cname} --hostname ${cname} --privileged=true --restart=always docker run -d --net=host --name ${cname} --hostname ${cname} --privileged=true --restart=always \-v ${log}/logs:/usr/local/spark-3.1.1/logs \-v ${log}/work:/usr/local/spark-3.1.1/work \-v ${log}/jars:/usr/local/spark-3.1.1/jars \-v ${log}/data:/opt/data \${images} \/usr/sbin/init

test-cluster-spk-master-02

#!/bin/bash cname="test-cluster-spk-master-02"#port1="8080"#port2="7077"log="/opt/data/"${cname}images="10.249.0.137:80/base/jdk-1.8:20210202"mkdir -p ${log}mkdir ${log}/logsmkdir ${log}/workmkdir ${log}/datamkdir ${log}/jars#docker run -d --net=overlay-net --ip ${ip} -p ${port1}:${port1} -p ${port2}:${port2} --name ${cname} --hostname ${cname} --privileged=true --restart=always docker run -d --net=host --name ${cname} --hostname ${cname} --privileged=true --restart=always \-v ${log}/logs:/usr/local/spark-3.1.1/logs \-v ${log}/work:/usr/local/spark-3.1.1/work \-v ${log}/jars:/usr/local/spark-3.1.1/jars \-v ${log}/data:/opt/data \${images} \/usr/sbin/init

test-cluster-spk-slave-01

#!/bin/bash cname="test-cluster-spk-slave-01"#port1="8080"#port2="7077"log="/opt/data/"${cname}images="10.249.0.137:80/base/jdk-1.8:20210202"mkdir -p ${log}mkdir ${log}/logsmkdir ${log}/workmkdir ${log}/datamkdir ${log}/jars#docker run -d --net=overlay-net --ip ${ip} -p ${port1}:${port1} -p ${port2}:${port2} --name ${cname} --hostname ${cname} --privileged=true --restart=always docker run -d --net=host --name ${cname} --hostname ${cname} --privileged=true --restart=always \-v ${log}/logs:/usr/local/spark-3.1.1/logs \-v ${log}/work:/usr/local/spark-3.1.1/work \-v ${log}/jars:/usr/local/spark-3.1.1/jars \-v ${log}/data:/opt/data \${images} \/usr/sbin/init

[root@zookeeper-03-test spark]# ll总用量 4-rw-r--r--. 1 root root 1166 7月  28 17:44 install.sh[root@zookeeper-03-test spark]# chmod +x install.sh [root@zookeeper-03-test spark]# ll总用量 4-rwxr-xr-x. 1 root root 1166 7月  28 17:44 install.sh[root@zookeeper-03-test spark]#

3.上传spark安装包

在容器映射目录下：/opt/data/test-cluster-spk-slave-01/data

[root@hadoop-01 data]# pwd/opt/data

用Xftp上传包

这里需要上传两个，使用的是spark-3.1.1-bin-without-hadoop.tgz

但是需要将spark-3.1.1-bin-hadoop-3.2.2-lbx-jszt下的jars包移到/usr/local/spark-3.1.1/jars下

4.解压安装包

mkdir -p /usr/local/spark-3.1.1cd /opt/datatar -zxvf spark-3.1.1-bin-without-hadoop.tgz -C /usr/local/spark-3.1.1

编辑全局变量

vim /etc/profile

增加以下全局变量

export SPARK_HOME=/usr/local/spark-3.1.1   export PATH=$PATH:$SPARK_HOME/bin

即时生效

source /etc/profile

5.配置spark-env.sh

cd /usr/local/spark-3.1.1/confcp spark-env.sh.template spark-env.shvim spark-env.sh

export SPARK_MASTER_IP=test-cluster-spk-master-01export SPARK_WORKER_CORES=1export SPARK_WORKER_MEMORY=800m#export SPARK_DRIVER_MEMORY=4gexport SPARK_EXECUTOR_INSTANCES=2export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoopexport SPARK_LOCAL_DIRS=/home/hadoop/tmp/spark/tmp#定时清理worker文件 一天一次export SPARK_WORKER_OPTS="  -Dspark.worker.cleanup.enabled=true  -Dspark.worker.cleanup.interval=86400 -Dspark.worker.cleanup.appDataTtl=86400"export JAVA_HOME=/usr/local/jdk1.8export HADOOP_HOME=/usr/local/hadoopexport HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexport SCALA_HOME=/usr/local/scalaexport PATH=${SCALA_HOME}/bin:$PATHexport SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=zookeeper-01-test:2181,zookeeper-02-test:2181,zookeeper-03-test:2181 -Dspark.deploy.zookeeper.dir=/usr/local/spark"

（4）配置workers

cp workers.template workersvim workers# 添加test-cluster-spk-slave-001

6.配置log4j.properties

cp log4j.properties.template log4j.propertiesvim log4j.propertieslog4j.rootCategory=WARN, console

7.复制到其他slave

（宿主机上）复制scp -r拷贝Spark到其他Slaves节点：

scp -r /usr/local/spark/spark-2.1.0-bin-hadoop2.7 root@slave-001-spark-dev:/usr/local/spark/scp -r /usr/local/spark/spark-2.1.0-bin-hadoop2.7 root@slave-002-spark-dev:/usr/local/spark/scp -r /usr/local/spark/spark-2.1.0-bin-hadoop2.7 root@slave-003-spark-dev:/usr/local/spark/

如执行命令出现出现问题时，请现在相应的Slave节点执行mkdir -p /usr/local/spark

复制到master-02时，使用start-mater.sh启动master-02

8.启动spark先启动两个master，然后启动slave节点

[root@test-cluster-spk-master-01 sbin]# ./start-master.sh starting org.apache.spark.deploy.master.Master, logging to /usr/local/spark-3.1.1/logs/spark-root-org.apache.spark.deploy.master.Master-1-test-cluster-spk-master-01.out[root@test-cluster-spk-master-01 sbin]# jps548 Jps492 Master[root@test-cluster-spk-master-01 sbin]# pwd/usr/local/spark-3.1.1/sbin[root@test-cluster-spk-master-01 sbin]#

主节点2启动完成

[root@test-cluster-spk-master-02 sbin]# ./start-master.sh starting org.apache.spark.deploy.master.Master, logging to /usr/local/spark-3.1.1/logs/spark-root-org.apache.spark.deploy.master.Master-1-test-cluster-spk-master-02.out[root@test-cluster-spk-master-02 sbin]# pwd/usr/local/spark-3.1.1/sbin[root@test-cluster-spk-master-02 sbin]# jps274 Jps218 Master[root@test-cluster-spk-master-02 sbin]#

从节点启动完成

/usr/local/spark-3.1.1/sbin/start-slave.sh test-cluster-hap-slave-001 test-cluster-hap-master-02:7077,test-cluster-hap-master-02:7077

主节点1启动完成9.验证

原本是访问http://10.8.46.35:8080 就可，但是我这里在配置镜像的时候，多了8080，导致这里访问不了。看日志可以知道，已经走向8081

所以http://10.8.46.35:8081/即可

主节点1	停掉主节点

主节点2	从节点成为ALIVE

从节点1	从节点1

10.遇到的坑包不兼容

这里遇到了许多问题，第一个是包不兼容，导致搭建两次失败

然后换了官方的包spark-3.1.1-bin-without-hadoop，启动还是有问题。

最后通过替换jars才成功。（使用spark-3.1.1-bin-hadoop-3.2.2-lbx-jszt下的jars）

ctrl + p + q 从容器退出到宿主机

done~

推荐内容

Docker搭建Spark集群，你学会了吗？|当前通讯

环球热资讯！直击近400家上市公司股东大会 透视独立董事履职行权“百态”

当前通讯！【机构调研记录】益民基金调研海泰新光

古诗风李峤带拼音和音乐_古诗风李峤带拼音 环球观点

离婚案件开庭审理需要什么材料

453公交车路线图_453_天天新消息

中国网球协会发来贺信！ 时快讯

美记：乌度卡想为火箭灌输防守心态 但老板还没享受到重建的好处 世界观速讯

Java变量的命名规范

全球今头条！陈力红楼梦歌曲14首mp3（陈力红楼梦歌曲14首）

房产证可能会被“淘汰”？70年后的房子到底归谁？现在有答案了！ 世界最资讯

环球新资讯：b2增驾a1需要什么条件多长时间（b2增驾a1需要什么条件）

广州发现两例！

【世界热闻】韩国水产业界：福岛核污染水排放致使消费心理萎缩

孩子王拟收购乐友65%股权 进一步拓展北方市场-每日热点

郑和下西洋路线图课件（郑和下西洋路线图） 热头条

红酒和杏仁能同食吗? 全球报道

每日精选：阿尔卡拉斯：只有百分之一的机会也不想留遗憾

国产最大盾构主轴承“破壁者”面世

家乡的风景作文400字（家乡的风景作文）-世界观热点

乌苏京东代运营_专业代理京东店铺运营服务

网络营销人员应具备哪些能力（作为一名网络营销人员应该掌握哪些知识与技能）

中科院软件所学子斩获ACM学生研究竞赛研究生组全球总决赛冠军 天天观察

设计师资格证查询网站（设计师资格证）

全球观速讯丨济南海关查获禁止进口固体废物23吨

动态焦点:许嵩官方论坛账号_许嵩官方论坛

时讯：j502焊条（j5）

权志龙经纪合约正式到期， YG称计划协商单独合作|世界热头条

【焦点热闻】临床医学研究生报考条件知乎（临床医学研究生报考条件）

途家网怎么样（途家网）

赛尔号怀旧服普尼在哪_赛尔号普尼打法|世界速看

世界上最美丽的离别在线观看_世界上最美丽的离别 环球视点

每日热文：保时捷发布最有科技感纯电超跑Mission X

巫师2打不开launcher（巫师2打不开）

各地税务部门不断优化服务 前5个月新办涉税经营主体643.5万户_环球今日讯

【夏收现场】 知识落“地”助丰收 耕地质量提升示范田小麦增产53.6% 环球快资讯

儋州召开年轻干部和女干部、少数民族干部、党外干部座谈会

今日报丨物料提升机型号s100（物料提升机型号）

当前热议!rrna寡核苷酸编目（Oligo DNA RNA 是什么 寡聚核苷酸）

三星正开发自有AI大语言模型 已投入全部GPU资源 动态焦点

阿尔卡拉斯：只有百分之一的机会也不想留遗憾

当前时讯：“十年一遇”！数万人被疏散，加拿大山林野火为何失控？

每日时讯!买二手房后发现房屋漏水怎么办（房屋漏水怎么办）

【世界聚看点】随想曲是什么意思_随想

极米科技: 关于实施2022年年度权益分派后调整回购股份价格上限的公告 天天日报

焦点热门:26个字母按音素归类怎么归（按音素给26个字母分类）

lost one的号哭画师是谁（lost one的号哭）

病毒性结膜炎的症状（病毒性结膜炎）|全球滚动

乐平京东代运营_提升电商销售的有效途径

最美童星长大后惊艳全网！16岁时因“不够性感”被导演刷掉，她霸气怒怼：恶心的猪！-短讯

AMD超威卓越平台全面登陆国内式机市场：为游戏玩家和创作者提供卓越解决方案

美债野蛮生长 国防开支节节攀升

孝感市举行2023年“安全生产月”启动仪式_全球微动态

ie11 for xp（ie11 xp） 天天播资讯

丝瓜不宜与什么一起吃呢

快看：矢量图是什么格式的呢 矢量图是什么格式

世界即时看！《最终幻想16》IGN新实机：玩法“暴徒狩猎”大展示

今日热议：三星即将发布全新折叠手机和Galaxy Tab S9系列平板电脑，Galaxy Tab S9 Ultra通过FCC认证

商圈＋公园！预计10月，内江这里将添新地标

中国商飞：加快形成独立自主的研制能力、生产能力

世界最资讯丨惩治网暴，公检法三部门公开征求意见！维权难度能降低吗？

员工优秀称号大全（优秀员工称号有哪些）

新突破、国际首次 中国科学技术领域成果频出

2023年6月9日黄金现在一克多少钱-热点在线

【热闻】道家马步站桩视频（马步站桩功治疗早泄）

各地税务部门不断优化服务 前5个月新办涉税经营主体643.5万户

每日短讯：第53届亚太桥牌锦标赛开赛

华硕BIOS修复蓝屏解决方法需要哪些步骤

写意牡丹画法王宝钦_写意牡丹画法

写意牡丹画法王宝钦_写意牡丹画法|微资讯

环球看点！蔚领油箱开关位置在哪（蔚领油箱多少升？）

每日热门：前5个月我国完成水利建设投资逾4100亿元 同比增长32.1%

手机充电很慢是怎么回事呢_手机充电很慢_当前速看

全球最资讯丨ai文件怎么转换为jpg文件（ai文件在线转成jpg）

追光 | 明晨，看18年后的伊斯坦布尔续写欧冠决赛传奇-头条焦点

家门口的养老院——徐家汇街道敬老院的养老新模式 每日快报

世界快消息！《浪姐4》吴倩退赛不意外，两个事件成导火索，三个方面得不偿失

大括号与小括号中括号的意义（什么叫大括号 中括号 小括号）

央妈狂买620亿黄金，背后是大智慧！

环球热资讯！直击近400家上市公司股东大会透视独立董事履职行权“百态”

古诗风李峤带拼音和音乐_古诗风李峤带拼音环球观点

中国网球协会发来贺信！时快讯

美记：乌度卡想为火箭灌输防守心态但老板还没享受到重建的好处世界观速讯

房产证可能会被“淘汰”？70年后的房子到底归谁？现在有答案了！世界最资讯

孩子王拟收购乐友65%股权进一步拓展北方市场-每日热点

郑和下西洋路线图课件（郑和下西洋路线图）热头条

中科院软件所学子斩获ACM学生研究竞赛研究生组全球总决赛冠军天天观察

世界上最美丽的离别在线观看_世界上最美丽的离别环球视点

各地税务部门不断优化服务前5个月新办涉税经营主体643.5万户_环球今日讯

【夏收现场】知识落“地”助丰收耕地质量提升示范田小麦增产53.6% 环球快资讯

当前热议!rrna寡核苷酸编目（Oligo DNA RNA 是什么寡聚核苷酸）

三星正开发自有AI大语言模型已投入全部GPU资源动态焦点

极米科技: 关于实施2022年年度权益分派后调整回购股份价格上限的公告天天日报

美债野蛮生长国防开支节节攀升

ie11 for xp（ie11 xp）天天播资讯

快看：矢量图是什么格式的呢矢量图是什么格式

新突破、国际首次中国科学技术领域成果频出

各地税务部门不断优化服务前5个月新办涉税经营主体643.5万户

每日热门：前5个月我国完成水利建设投资逾4100亿元同比增长32.1%

家门口的养老院——徐家汇街道敬老院的养老新模式每日快报

大括号与小括号中括号的意义（什么叫大括号中括号小括号）

学制苗族银饰传承非遗之美

嗜血猎手沃里克皮肤（嗜血狂暴沃里克典藏皮肤多少钱）

远古遗愿和深渊之鳞光剑哪个好_dnf远古深渊全球热头条