CMS和Tomcat服务异常排查手册
快速解决常见cms和tomcat异常问题


一、  Windows环境出现CMS/Tomcat服务异常

1. Java进程残留

问题现象:

Tomcat起来自己又停止或者点stop/start没有反应,按钮变灰。

 

排查思路:

查看任务管理器发现存在多个在运行的java进程包括当前tomcat对应的进程,前一次点击stop的时候java进程还在处理中没有停掉,导致当前Apache上服务状态都是灰色。

解决措施:

打开任务管理器手动停止java服务,选中结束运行即可

注意:存在多个java进程的情况下需要判断哪个java进程是在使用的

1)查看安装目录C:\hikrobot\hikcms\conf路径下的server配置文件里,tomcat的端口是多少


2)默认是8181端口,通过cmd终端,输入命令查8181端口的进程号,即PID是多少。输入命令 netstat –ano | findstr 8181,如下PID是6800的java进程就是tomcat的

2. Java版本和环境变量问题

问题现象:

Tomcat起不来

排查思路:

查看Apache下有没有java路径以及显示路径信息是否正确

解决措施:

1)有路径则查看java版本和目前安装的版本对不对应

目前3.1版本包括3.1版本之后的版本,JDK版本都是11;

3.0.1的JDK版本是1.8的版本;

3.0.1之前的版本,JDK版本都是1.7;

如果不对,需要则需要在控制面板中卸载现在版本的JDK。然后安装修复,会提示安装正确版本的JDK。

2)没有路径则按照如下修复

1. 输入regedit,然后回车,打开注册表编辑器;

2.删除注册表信息HKEY_LOCAL_MACHINE\SOFTWARE\JavaSoft;

3.安装修复时,若自动未安装jdk,则需要在控制面板中卸载JDK;

4. 若JDK安装成功,但tomcat JAVA路径下 JAVA Virtual Machine无路径,则需

在C:\hikvision\hikrcs目录下运行uninstall.bat,卸载注册信息,再点击ins.bat重新注册。

3)有路径但是不显示版本类似如下,管理员权限运行C:\hikrobot\hikcms这个路径下的ins脚本,看报错,根据对应报错排查,基本上是环境变量的问题。可根据报错重点看是不是本机有报错显示的环境变量,如果有,去掉或改名字。


3. JAVA_HOME环境变量问题

问题现象:

3.1.2版本tomcat是start状态,但没有打印rcms.cms.debug日志或者目录下没有rcms目录导致cms界面访问不了

排查思路:

参考下图查看电脑中的JAVA_HOME的环境变量值是否存在或者地址正确

解决措施:

增加或修改“JAVA_HOME”环境变量,右击电脑图标选择属性----高级系统设置----环境变量,新增环境变量“JAVA_HOME” 路径参考Apache的java路径填写。



二、  Linux环境出现CMS服务异常

1. 虚拟机环境下安装CMS异常

问题现象:

在Linux虚拟机上安装RCS,安装完成后RCMS一直起不来,查看rcms 绑定的tomcat报错信息。在安装目录下/opt/opsmgr/web/components/tomcat85linux64.X 一直生成崩溃日志 hs_err_pid***.log。

排查思路:

查看 hs_err_pid***.log ,定位到是调用 libVerifyJniWrap.so 文件导致的崩

溃。该文件是用于检测 license 的库文件。

解决措施:

屏蔽检测 license 的代码,cd到/opt/opsmgr/web/components/tomcat85linux64.1/webapps/rcms/WEB-INF/classes/spring/ 目录下使用vi修改spring-task.xml文件。

参考截图注释掉如下的<!---initLicenseTaskTrigger-->部分,保存退出编辑模式后重启对应的tomcat服务。

2. zookeeper not connected

问题现象:

物理服务器安装RCS,运行过程中出现CMS已停止,重启tomcat和CMS都无法拉起服务。

排查思路:

1) 进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl  restrat  hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200  rcms.cms.debug.log查看最新打印的rcms的debug日志;

2) 查看日志报错,如下截图一直打印“zookeeper not connected”;

3) 通过报错可知是因为zookeeper连接超时导致cms起不来。

解决措施:

cd进入/opt/opsmgr/web/components/tomcat85linux64.x/webapps/rcms/WEB-INF/classes/spring目录下找到spring-dubbo.xml


在spring-dubbo.xml的基础配置<dubbo:registry>里面添加 timeout="100000"

然后重启CMS绑定的tomcat服务

或者后台重启tomcat服务   systemctl  restart  hik.tomcat85linux64.x.service

3. CMS绑定错误的Tomcat服务

问题现象:

之前运行一直正常,卸载过RCMS再重新安装CMS后发现服务运行正常,但是8181端口无法登录

排查思路:

1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl  restrat  hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200  rcms.cms.debug.log查看最新打印的rcms的debug日志;

2)查看日志未发现异常报错,只有未上传授权的提示

3)查看8181端口对应的tomcat和当前的cms绑定的tomcat是否一致,如截图发现8181对应的是tomcat1,而当前绑定的是tomcat2。所以导致使用8181端口无法访问CMS。


解决措施:

1)卸载rcms服务

到运管--系统维--安装部署--软件包管理 卸载已安装的RCMS

2)重新安装RCMS并绑定8181端口对应的tomcat1

选择自定义安装

选择Tomcat1绑定,然后重新配置一下迅捷

4. 【0x3a800101】数据库连接超时-1

问题现象:

升级或者卸载重新安装CMS后发现CMS服务存于正在启动一直无法运行

排查思路:

1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl  restrat  hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200  rcms.cms.debug.log查看最新打印的rcms的debug日志;

2)查看日志报错信息提示“[0x3a800101] - [数据库连接超时]:10秒钟后重连”并提示“password authentication failed for user "cms_web"”;

3)通过报错可知是连接cms_web数据库失败,判断是CMS升级或者卸载重装后没有重新配置迅捷关联数据库。

解决措施:

将迅捷部署全部重新配置

5. 【0x3a800101】数据库连接超时-2

问题现象:

升级或者卸载重新安装CMS后发现CMS服务存于正在启动一直无法运行

排查思路:

1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl  restrat  hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200  rcms.cms.debug.log查看最新打印的rcms的debug日志;

2)查看日志报错信息提示“[0x3a800101] - [数据库连接超时]:10秒钟后重连”并提示“Connection to 192.168.4.200:2345 refused. Check that the hostname and port are correct and that the postmaster is accepting TCP/IP connections.”;

3)通过报错可知是连接数据库用户名或者密码错误导致,判断是CMS升级或者卸载重装后没有重新配置迅捷关联数据库。

解决措施:

将迅捷部署全部重新配置

6. 【0x3a800301】ZK初始化失败

问题现象:

按照业务流程安装好服务器,rose热备环境,迅捷配置完成后RCMS服务无法启动。

排查思路:

1)cd进入/opt/opsmgr/web/components/tomcat85linux64.x/logs/rcms目录下systemctl  restrat  hik.tomcat85linux64.x重启tomcat进程,然后tail -f -n 200  rcms.cms.debug.log查看最新打印的rcms的debug日志;

2)查看日志报错信息提示“[0x3a800301] - [ZK初始化失败]:10秒钟后重连”并提示“No route to host”;

3)通过报错可知是zk配置有问题,检查迅捷部署zk的配置和rosezk的配置发现虚拟ip不一致。

解决措施:

将迅捷部署的ZK(zookeeoer)的虚拟IP修改为rose中部署的IP,重新配置迅捷。

附件:
版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇
已经是第一篇啦~
下一篇
已经是最后一篇啦~
评论请先登录 登录
全部评论 1

👍

2022-12-03 14:23:50 未知地区
回复
  • 1
Lv.0
0
关注
4
粉丝
5
创作
13
获赞
相关阅读
  • 海康移动机器人技术资料目录
    2024-09-21 浏览 0
  • VM算法平台-PLCS7通讯-二维码字符串接收及发送至S7的string类型相关问题-二维码命名存图
    2024-09-13 浏览 0
  • usb共享网络更改路由
    2024-09-24 浏览 0
  • 【MVS4.0新功能一览】第三篇采集卡相关功能
    2024-08-29 浏览 0

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器