JavaMelody是一款能够监测Java或Java EE应用程序的服务,JavaMelody能够很好的反映我们系统的各种性能指标,并提供很好的图形界面,其指标还能反应Java内存和Java CPU使用情况、用户Session数量、JDBC连接数、http请求、sql请求、jsp页面与业务接口方法(EJB3、Spring、 Guice)的执行数量,平均执行时间,错误百分比等。
使用certbot续费letsencrypt证书触发告警问题
我们是使用cerbot来申请letsencrypt证书的,letsencrypt证书有效期只有3个月,过期前需要续期,通过certbot命令去定时续期,但是每次续期都会触发阿里云的AK告警。
k8s部署Debezium及kafka
Debezium 是一组分布式服务,用于捕获数据库中的更改(通过读取数据库日志的方式来完成数据增删改的记录),以便您的应用程序可以看到这些更改并做出响应。Debezium 将每个数据库表中的所有行级更改记录在更改事件流中,应用程序只需读取这些流,即可按更改事件发生的顺序查看更改事件。
Linux机器压测脚本
工作中我们可能会遇到需要模拟高并发的情况,就是我们说的压测,以下通过一些shell脚本用于模拟 OOM(内存耗尽)、CPU 高负载、网络高吞吐 和 磁盘高 IO 压力。
RocketMQ使用教程
之前一直用的是kafka,新公司使用的是RocketMQ,之前没接触过RocketMQ,导致告警出现消息积压,不知怎么去排查问题,趁着这次排查问题,顺便熟悉了下RocketMQ的操作。
k8s-pod重启时生成dump文件
k8s环境,有个服务频繁重启,经过排查日志和事件,确认时由于OOM导致服务重启,为了方便研发定位OOM的具体原因,需要在OOM发生时自动生成内存快照(Heap Dump),以供后续研发分析。
Linux系统中负载、磁盘IO问题排查
CPU利用率:显示的是程序在运行期间实时占用的CPU百分比
CPU负载:显示的是一段时间内正在使用和等待使用CPU的平均任务数。CPU利用率高,并不意味着负载就一定大。举例来说:如果我有一个程序它需要一直使用CPU的运算功能,那么此时CPU的使用率可能达到100%,但是CPU的工作负载则是趋近于“1”,因为CPU仅负责一个工作嘛!如果同时执行这样的程序两个呢?CPU的使用率还是100%,但是工作负载则变成2了。所以也就是说,当CPU的工作负载越大,代表CPU必须要在不同的工作之间进行频繁的工作切换。
k8s-pod生命周期钩子函数
pod从开始创建到终止退出的时间范围称为Pod生命周期