一、HADOOP集群启动
1. 格式化zk
在zk的leader节点服务器上,Hadoop的bin目录中执行如下命令:
改为在 nn的active节点上
sh hdfs zkfc -formatZK
2. 启动journalnode集群
hadoop任意节点服务器执行
hadoop-daemons.sh start journalnode
3. 格式化namenode
在nn节点执行
hadoop namenode -format
4. 启动NameNode
在hdaoop01节点上执行如下命令,启动NameNode节点:
hadoop-daemon.sh start namenode
首先把hdaoop02服务器的 namenode节点变为standby namenode节点。
执行命令如下:
hdfs namenode -bootstrapStandby
启动hadoop02服务器的namenode节点,执行命令如下:
hadoop-daemon.sh start namenode
5. 启动DataNode
在hadoop01,hadoop02,hadoop03服务器上分别启动datanode节点,在这三台服务器上分别执行如下命令:
hadoop-daemon.sh start datanode
6. 启动zkfc
FalioverControllerActive是失败恢复线程。这个线程需要在NameNode节点所在的服务器上启动,在hadoop01,hadoop02服务器上执行如下命令:
hadoop-daemon.sh start zkfc
7. 启动Resourcemanager
在hdaoop01服务器上启动主Resourcemanager节点,执行如下命令:
启动成功后,hadoop01,hadoop02,hadoop03服务器上的nodemanager 也会跟随启动
start-yarn.sh
在hadoop02服务器上启动副 Resoucemanager节点,执行如下命令:
yarn-daemon.sh start resourcemanager
二、YARN运维命令
1. yarn application
1、-list 列出所有 application 信息
yarn application -list
2、-appStates
yarn application -list -appStates RUNNING
3、-appTypes
yarn application -list -appTypes MAPREDUCE
4、-kill
yarn application -kill application_1526100291229_206393
5、-status
yarn application -status application_1526100291229_206393
6、-movetoqueue
7、-queue
yarn application -movetoqueue application_1526100291229_206393 -queue other
2. yarn node
查看各个node上的任务数
yarn node --list
3. yarn logs
yarn logs -applicationId application_1583405966138_0013