一、 Windows环境出现CMS/Tomcat服务异常
1. Java进程残留
问题现象:
Tomcat起来自己又停止或者点stop/start没有反应,按钮变灰。
排查思路:
查看任务管理器发现存在多个在运行的java进程包括当前tomcat对应的进程,前一次点击stop的时候java进程还在处理中没有停掉,导致当前Apache上服务状态都是灰色。
解决措施:
打开任务管理器手动停止java服务,选中结束运行即可
注意:存在多个java进程的情况下需要判断哪个java进程是在使用的
1)查看安装目录C:\hikrobot\hikcms\conf路径下的server配置文件里,tomcat的端口是多少
2)默认是8181端口,通过cmd终端,输入命令查8181端口的进程号,即PID是多少。输入命令 netstat –ano | findstr 8181,如下PID是6800的java进程就是tomcat的
2. Java版本和环境变量问题
问题现象:
Tomcat起不来
排查思路:
查看Apache下有没有java路径以及显示路径信息是否正确
解决措施:
1)有路径则查看java版本和目前安装的版本对不对应
目前3.1版本包括3.1版本之后的版本,JDK版本都是11;
3.0.1的JDK版本是1.8的版本;
3.0.1之前的版本,JDK版本都是1.7;
如果不对,需要则需要在控制面板中卸载现在版本的JDK。然后安装修复,会提示安装正确版本的JDK。
2)没有路径则按照如下修复
1. 输入regedit,然后回车,打开注册表编辑器;
2.删除注册表信息HKEY_LOCAL_MACHINE\SOFTWARE\JavaSoft;
3.安装修复时,若自动未安装jdk,则需要在控制面板中卸载JDK;
4. 若JDK安装成功,但tomcat JAVA路径下 JAVA Virtual Machine无路径,则需
在C:\hikvision\hikrcs目录下运行uninstall.bat,卸载注册信息,再点击ins.bat重新注册。
3)有路径但是不显示版本类似如下,管理员权限运行C:\hikrobot\hikcms这个路径下的ins脚本,看报错,根据对应报错排查,基本上是环境变量的问题。可根据报错重点看是不是本机有报错显示的环境变量,如果有,去掉或改名字。
3. JAVA_HOME环境变量问题
问题现象:
3.1.2版本tomcat是start状态,但没有打印rcms.cms.debug日志或者目录下没有rcms目录导致cms界面访问不了
排查思路:
参考下图查看电脑中的JAVA_HOME的环境变量值是否存在或者地址正确
解决措施:
增加或修改“JAVA_HOME”环境变量,右击电脑图标选择属性----高级系统设置----环境变量,新增环境变量“JAVA_HOME” 路径参考Apache的java路径填写。
二、 Linux环境出现CMS服务异常
1. 虚拟机环境下安装CMS异常问题现象:
在Linux虚拟机上安装RCS,安装完成后RCMS一直起不来,查看rcms 绑定的tomcat报错信息。在安装目录下/opt/opsmgr/web/components/tomcat85linux64.X 一直生成崩溃日志 hs_err_pid***.log。
排查思路:
查看 hs_err_pid***.log ,定位到是调用 libVerifyJniWrap.so 文件导致的崩
溃。该文件是用于检测 license 的库文件。
解决措施:
屏蔽检测 license 的代码,cd到/opt/opsmgr/web/components/tomcat85linux64.1/webapps/rcms/WEB-INF/classes/spring/ 目录下使用vi修改spring-task.xml文件。
参考截图注释掉如下的<!---initLicenseTaskTrigger-->部分,保存退出编辑模式后重启对应的tomcat服务。
问题现象:
物理服务器安装RCS,运行过程中出现CMS已停止,重启tomcat和CMS都无法拉起服务。
排查思路:
1) 进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl restrat hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200 rcms.cms.debug.log查看最新打印的rcms的debug日志;
2) 查看日志报错,如下截图一直打印“zookeeper not connected”;
3) 通过报错可知是因为zookeeper连接超时导致cms起不来。
解决措施:
cd进入/opt/opsmgr/web/components/tomcat85linux64.x/webapps/rcms/WEB-INF/classes/spring目录下找到spring-dubbo.xml
在spring-dubbo.xml的基础配置<dubbo:registry>里面添加 timeout="100000"
然后重启CMS绑定的tomcat服务
或者后台重启tomcat服务 systemctl restart hik.tomcat85linux64.x.service
3. CMS绑定错误的Tomcat服务
问题现象:
之前运行一直正常,卸载过RCMS再重新安装CMS后发现服务运行正常,但是8181端口无法登录
排查思路:
1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl restrat hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200 rcms.cms.debug.log查看最新打印的rcms的debug日志;
2)查看日志未发现异常报错,只有未上传授权的提示
3)查看8181端口对应的tomcat和当前的cms绑定的tomcat是否一致,如截图发现8181对应的是tomcat1,而当前绑定的是tomcat2。所以导致使用8181端口无法访问CMS。
解决措施:
1)卸载rcms服务
到运管--系统维--安装部署--软件包管理 卸载已安装的RCMS
2)重新安装RCMS并绑定8181端口对应的tomcat1
选择自定义安装
选择Tomcat1绑定,然后重新配置一下迅捷
问题现象:
升级或者卸载重新安装CMS后发现CMS服务存于正在启动一直无法运行
排查思路:
1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl restrat hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200 rcms.cms.debug.log查看最新打印的rcms的debug日志;
2)查看日志报错信息提示“[0x3a800101] - [数据库连接超时]:10秒钟后重连”并提示“password authentication failed for user "cms_web"”;
3)通过报错可知是连接cms_web数据库失败,判断是CMS升级或者卸载重装后没有重新配置迅捷关联数据库。
解决措施:
将迅捷部署全部重新配置
问题现象:
升级或者卸载重新安装CMS后发现CMS服务存于正在启动一直无法运行
排查思路:
1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl restrat hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200 rcms.cms.debug.log查看最新打印的rcms的debug日志;
2)查看日志报错信息提示“[0x3a800101] - [数据库连接超时]:10秒钟后重连”并提示“Connection to 192.168.4.200:2345 refused. Check that the hostname and port are correct and that the postmaster is accepting TCP/IP connections.”;
3)通过报错可知是连接数据库用户名或者密码错误导致,判断是CMS升级或者卸载重装后没有重新配置迅捷关联数据库。
解决措施:
将迅捷部署全部重新配置
问题现象:
按照业务流程安装好服务器,rose热备环境,迅捷配置完成后RCMS服务无法启动。
排查思路:
1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl restrat hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200 rcms.cms.debug.log查看最新打印的rcms的debug日志;
2)查看日志报错信息提示“[0x3a800301] - [ZK初始化失败]:10秒钟后重连”并提示“No route to host”;
3)通过报错可知是zk配置有问题,检查迅捷部署zk的配置和rosezk的配置发现虚拟ip不一致。
解决措施:
将迅捷部署的ZK(zookeeoer)的虚拟IP修改为rose中部署的IP,重新配置迅捷。