逸贤 | Blog

  • 首页

  • 标签

  • 分类

  • 归档

  • 关于

  • 互动

  • 搜索

Grafana-oncall企微告警问题

发表于 2025-04-30 | 分类于 技术 , Oncall
本文字数: 601 | 阅读时长 ≈ 1 分钟

oncall平台部署完之后,我们一般会接入各个平台的告警信息,比如我接入了Skywalking,Graylog和Prometheus的告警。

阅读全文 »

oncall平台部署及使用

发表于 2025-04-10 | 更新于 2025-04-30 | 分类于 技术 , Oncall
本文字数: 42k | 阅读时长 ≈ 38 分钟

Grafana OnCall 是 Grafana Labs 推出的一款开源事件响应与排班调度工具,可以帮助团队管理和跟踪故障处理情况,提高 SRE 团队的工作效率,更快地解决事件。可以自动路由警报到指定的值班团队和 ChatOps 频道,根据预定义的升级策略、时间表和通知偏好进行处理。

阅读全文 »

javamelody监控图表中文乱码

发表于 2025-03-26 | 分类于 技术 , Java
本文字数: 514 | 阅读时长 ≈ 1 分钟

JavaMelody是一款能够监测Java或Java EE应用程序的服务,JavaMelody能够很好的反映我们系统的各种性能指标,并提供很好的图形界面,其指标还能反应Java内存和Java CPU使用情况、用户Session数量、JDBC连接数、http请求、sql请求、jsp页面与业务接口方法(EJB3、Spring、 Guice)的执行数量,平均执行时间,错误百分比等。

阅读全文 »

使用certbot续费letsencrypt证书触发告警问题

发表于 2025-03-18 | 更新于 2025-03-26 | 分类于 技术 , 域名证书
本文字数: 2k | 阅读时长 ≈ 2 分钟

我们是使用cerbot来申请letsencrypt证书的,letsencrypt证书有效期只有3个月,过期前需要续期,通过certbot命令去定时续期,但是每次续期都会触发阿里云的AK告警。

阅读全文 »

k8s部署Debezium及kafka

发表于 2025-03-10 | 更新于 2025-03-26 | 分类于 技术 , K8S
本文字数: 11k | 阅读时长 ≈ 10 分钟

Debezium 是一组分布式服务,用于捕获数据库中的更改(通过读取数据库日志的方式来完成数据增删改的记录),以便您的应用程序可以看到这些更改并做出响应。Debezium 将每个数据库表中的所有行级更改记录在更改事件流中,应用程序只需读取这些流,即可按更改事件发生的顺序查看更改事件。

阅读全文 »

Linux机器压测脚本

发表于 2025-03-06 | 分类于 Linux
本文字数: 1.9k | 阅读时长 ≈ 2 分钟

工作中我们可能会遇到需要模拟高并发的情况,就是我们说的压测,以下通过一些shell脚本用于模拟 OOM(内存耗尽)、CPU 高负载、网络高吞吐 和 磁盘高 IO 压力。

阅读全文 »

RocketMQ使用教程

发表于 2025-03-06 | 分类于 技术 , RocketMQ
本文字数: 929 | 阅读时长 ≈ 1 分钟

之前一直用的是kafka,新公司使用的是RocketMQ,之前没接触过RocketMQ,导致告警出现消息积压,不知怎么去排查问题,趁着这次排查问题,顺便熟悉了下RocketMQ的操作。

阅读全文 »

k8s-pod重启时生成dump文件

发表于 2025-03-04 | 更新于 2025-03-05 | 分类于 技术 , K8S
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

k8s环境,有个服务频繁重启,经过排查日志和事件,确认时由于OOM导致服务重启,为了方便研发定位OOM的具体原因,需要在OOM发生时自动生成内存快照(Heap Dump),以供后续研发分析。

阅读全文 »

Linux系统中负载、磁盘IO问题排查

发表于 2025-02-28 | 更新于 2025-03-13 | 分类于 Linux
本文字数: 15k | 阅读时长 ≈ 14 分钟

CPU利用率:显示的是程序在运行期间实时占用的CPU百分比

CPU负载:显示的是一段时间内正在使用和等待使用CPU的平均任务数。CPU利用率高,并不意味着负载就一定大。举例来说:如果我有一个程序它需要一直使用CPU的运算功能,那么此时CPU的使用率可能达到100%,但是CPU的工作负载则是趋近于“1”,因为CPU仅负责一个工作嘛!如果同时执行这样的程序两个呢?CPU的使用率还是100%,但是工作负载则变成2了。所以也就是说,当CPU的工作负载越大,代表CPU必须要在不同的工作之间进行频繁的工作切换。

阅读全文 »

k8s-pod生命周期钩子函数

发表于 2025-02-27 | 分类于 技术 , K8S
本文字数: 9.6k | 阅读时长 ≈ 9 分钟

pod从开始创建到终止退出的时间范围称为Pod生命周期

阅读全文 »
12…13
丨逸贤丨

丨逸贤丨

三十年众生牛马,搏十年丰功伟绩。
130 日志
43 分类
107 标签
RSS
GitHub E-Mail Weibo QQ
推荐阅读
  • 运维生存时间
  • 爱运维
  • Nginxconfig
  • Linux命令手册
  • echarts可视化库
  • 博客管理
0%
© 2022 – 2025 逸贤 | 站点字数合计: 775k
载入天数...载入时分秒...
人 | 次