检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看 。
1.问题现象
Hadoop集群HDFS、YARN、Hive等服务出现异常告警
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
重启集群异常告警任然存在大量告警
Cluster 1
HDFS
可用空间抑制…
NameNode 运行状况抑制…
HDFS 金丝雀抑制…
DataNode (ip-172-31-10-118) 日志文件
NameNode 连接抑制…
DataNode (ip-172-31-5-190) 日志文件
NameNode 连接抑制…
DataNode (ip-172-31-9-33) 日志文件
NameNode 连接抑制…
Hive Metastore Server (ip-172-31-6-148) 日志文件
Hive Metastore Canary 抑制…
Impala Daemon (ip-172-31-10-118) 日志文件
进程状态抑制…
Impala Daemon (ip-172-31-5-190) 日志文件
进程状态抑制…
Impala Daemon (ip-172-31-9-33) 日志文件
进程状态抑制…
NameNode (ip-172-31-6-148) 日志文件
安全模式状态抑制…
Server (ip-172-31-5-190) 日志文件
【检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响】Quorum 成员资格抑制…
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
Zookeeper服务“Quorum 成员资格”告警
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
CM节点上的所有服务的角色日志不能正常通过ClouderaManager控制台查看 , 显示如下错误:
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
2.问题复现
集群环境:
  • CDH5.12.0
  • 集群服务(HDFS/Hive/YARN/Zookeeper/Hue/Impala/Kudu/Oozie)
1.还原现场配置,所有服务器hosts配置文件配置
127.0.0.1 ip-172-31-10-156.ap-southeast-1.compute.internal127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6172.31.8.141 ip-172-31-8-141.ap-southeast-1.compute.internal172.31.1.175 ip-172-31-1-175.ap-southeast-1.compute.internal172.31.9.186 ip-172-31-9-186.ap-southeast-1.compute.internal172.31.10.156 ip-172-31-10-156.ap-southeast-1.compute.internal配置中的第一行配置为多出的异常配置 。
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
在主机上ping自己的hostname显示
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
2.重启集群服务
CM出现如下大量告警
Cluster 1HDFS可用空间抑制... NameNode 运行状况抑制... HDFS 金丝雀抑制...DataNode (ip-172-31-10-118) 日志文件NameNode 连接抑制...DataNode (ip-172-31-5-190) 日志文件NameNode 连接抑制...DataNode (ip-172-31-9-33) 日志文件NameNode 连接抑制... Hive Metastore Server (ip-172-31-6-148) 日志文件Hive Metastore Canary 抑制...HiveServer2 (ip-172-31-6-148) 日志文件进程状态抑制... Impala Daemon (ip-172-31-10-118) 日志文件进程状态抑制... Impala Daemon (ip-172-31-5-190) 日志文件进程状态抑制... Impala Daemon (ip-172-31-9-33) 日志文件进程状态抑制...NameNode (ip-172-31-6-148) 日志文件安全模式状态抑制...Server (ip-172-31-5-190) 日志文件Quorum 成员资格抑制... ip-172-31-10-118代理状态抑制... ip-172-31-5-190代理状态抑制... ip-172-31-9-33代理状态抑制...
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
Zookeeper与现场告警一致,且Zookeeper服务如下状态
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图

检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
在查看CM节点的日志出现如下异常“Connection refused”
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
Host列表监控状态
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
3.问题原因
集群在运行正常的情况下,所有节点的hosts文件被修改为127.0.0.1导致
4.解决方法
修改所有节点的hosts文件,将127.0.0.1行配置注释
检测到hosts配置存在异常的原因 hosts文件配置异常有什么影响

文章插图
重启集群服务恢复正常;
醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!


    以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

    「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: