我给自己的服务器配了一套监控告警,几个关键节点说清楚
VPS 突然挂了没人知道?给个人服务器配一套 Prometheus + Node Exporter + Grafana 监控告警,CPU、磁盘、内存异常自动推送到钉钉。从安装到告警规则到踩坑实录,照着配就行。
VPS 突然挂了没人知道?给个人服务器配一套 Prometheus + Node Exporter + Grafana 监控告警,CPU、磁盘、内存异常自动推送到钉钉。从安装到告警规则到踩坑实录,照着配就行。
还在手动 FTP 拖文件部署?给个人项目配一套 GitHub Actions 自动部署,push 完代码就不用管了。含完整 workflow 配置、SSH 私钥设置、rsync 同步和三个踩坑实录。
一个人做项目到底怎么管理 Git 分支?从 main 一条线走到踩坑经历,再到三条分支+规范 commit 的顺手方案,不搞 Git Flow 那套复杂的,够用就好。
关于WebSocket 连接断开和重连:从心跳检测到断线重连策略的工程化实践的一次经验整理,偏实操,偏排错,尽量把话说得直接一点。
从真实场景里整理出来的Linux 磁盘空间爆满排查:从 du 和 lsof 到已删除文件仍占空间的处理经验文章,适合先看问题,再看做法。
从真实场景里整理出来的HTTPS 证书过期和配置排查:从 openssl 命令到 Nginx 证书链验证的实操指南文章,适合先看问题,再看做法。
从真实场景里整理出来的Kafka 消费者组 rebalance 频繁触发:从现象到调优和参数设置的经验总结文章,适合先看问题,再看做法。
关于线上内存泄漏排查:从 top 和 jmap 到 MAT 分析 dump 文件的实战流程的一次经验整理,偏实操,偏排错,尽量把话说得直接一点。
从真实场景里整理出来的Docker Compose 部署实战:从单机服务编排到生产环境踩坑记录文章,适合先看问题,再看做法。
关于MySQL 慢查询排查:从 show processlist 到 EXPLAIN 和索引优化的完整路径的一次经验整理,偏实操,偏排错,尽量把话说得直接一点。