数据库运维
记录DBA学习成长历程

GBase 8a集群常见故障

文章目录

1  集群安装成功后,在管理节点执行 gcadmin,系统提示找不到命令

原因:环境变量没有生效
解决方法:切换操作系统账户
$ exit
$ su gbase

2 在管理节点执行 gcadmin,系统提示 Could not initialize CRM instance error: [122]->[can not connect to any server]

原因:所有节点的集群服务都没有启动
解决方法:
[10.0.0.11]$ gcluster_services all start
[10.0.0.12]$ gcluster_services all start
[10.0.0.13]$ gcluster_services all start

3 SSH 服务确认22端口被禁止,能安装8a集群吗?

解决方法:
1 修改 SSH 配置文件。
[10.0.0.11]# cd /etc/ssh
[10.0.0.11]# vi ssh_config
假设,修改配置文件中“Port”的值为 10022
2 重启 SSH 服务:
[10.0.0.11]#service sshd restart
3 查看 SSH 监听端口是否修改为 10022
[10.0.0.11]# netstat -tunlp | grep ssh
4 关闭所有管理节点集群服务
[10.0.0.11]$ gcluster_services all stop
[10.0.0.12]$ gcluster_services all stop
[10.0.0.13]$ gcluster_services all stop
5 修改所有管理节点$GCWARE_BASE/config/gcware.conf 中的
gcware 配置文件的 node_ssh_port: 22
6 重启所有管理节点集群服务
[10.0.0.11]$ gcluster_services all start
[10.0.0.12]$ gcluster_services all start
[10.0.0.13]$ gcluster_services all start

4 查看安装8a集群的依赖包列表

$ cat /opt/gcinstall/dependRpms

pcre
krb5-libs
libdb
glibc
keyutils-libs
libidn
libuuid
ncurses-libs
libgpg-error
libgomp
libstdc++
libcom_err
libgcc
python-libs
libselinux
libgcrypt
nss-softokn-freebl

在安装脚本执行过程中,如果系统提示缺少rpm依赖包,需要按照以上rpm列表名,在各节点安装缺少的包。

5 安装Gbase8a时出现以下错误Cgconfig

Environmental Checking on gcluster nodes.
Cgconfig service is not exist on host [‘10.0.0.11’, ‘10.0.0.12’, ‘10.0.0.13’], resource manangement can not be used, continue ([Y,y]/[N,n])?

检查以下安装包是否安装,如缺少请安装

yum list installed | grep libcgroup
yum list installed | grep libcgroup-tools
缺少则安装

yum -y install libcgroup
yum -y install libcgroup-tools
安装后设置cgroup服务开机启动

systemctl enable cgconfig.service
启动cgconfig服务

systemctl start cgconfig.service
这里如果执行报错:

Job for cgconfig.service failed because the control process exited with error code. See “systemctl status cgconfig.service” and “journalctl -xe” for details.

则使用命令查看报错原因

systemctl status cgconfig.service
如果原因如下:

Error: cannot mount cpu to /cgroup/cpu: Device or resource busy

Failed to start Control Group configuration service.

则执行
cgclear - unload the cgroup filesystem
systemctl start cgconfig.service
之后重新启动安装程序就可以了。

6 GBase 8a集群常见故障V95版本gcadmin命令卡住

原因:当前能连接的gcware服务节点,不足一半节点在线,所有节点的集群服务都没有启动
解决方法:
[10.0.0.11]$ gcluster_services all start
[10.0.0.12]$ gcluster_services all start
[10.0.0.13]$ gcluster_services all start

 

赞(0)
MySQL学习笔记 » GBase 8a集群常见故障