职业摘要
具备 5 年系统运维经验,熟悉 Linux、Nginx、MySQL、Redis、监控告警和故障排查。擅长保障核心业务稳定运行并逐步推动自动化工具建设,适合强调稳定性和应急响应能力的运维工程师岗位投递。
工作经历
2021.01 - 至今
启航互联 · 高级运维工程师
可用性提升
- 负责支付与订单相关服务器集群维护,全年系统可用性保持在 99.95% 以上。
- 搭建磁盘、CPU 和慢查询预警机制,季度故障预警提前发现率提升到 68%。
- 编写日常巡检和备份脚本后,重复巡检工时每周减少约 14 小时。
2017.07 - 2020.12
云河科技 · 系统运维工程师
故障响应提速
- 负责 Web 服务、数据库和缓存的日常维护,累计支撑 50 余次业务大促平稳运行。
- 优化备份与恢复流程,数据库恢复时间从 2 小时缩短到 35 分钟。
- 参与 IDC 迁移和容灾演练,关键业务切换成功率达到 100%。
项目经历
2022.06 - 2022.11
数据库备份恢复优化项目
独立负责
围绕数据库恢复时间长和恢复步骤依赖人工的问题,重构备份校验、恢复脚本和演练流程,最终恢复时间缩短 71%,恢复成功率稳定在 100%。
2019.08 - 2020.02
监控指标统一接入项目
核心执行
整理主机、服务、数据库和业务层指标,并建设统一告警阈值和值班看板,告警排查路径明显缩短,值班响应效率提升 34%。