工作总结

2026-04-13 工作总结试用期工作总结

(优质)程序员试用期工作总结。

接手订单中台这三个多月，手上过了47个工单，P1级别故障3次。实话讲，头一个月差点没撑住。不是因为技术难，是没想到生产环境能埋这么多坑。

数字背后藏着什么

47个工单里，按时关掉46个，剩下那个拖了三天——原因是第三方支付网关的证书过期，对方没有自动续期，我这边监控没覆盖到。这事后来专门补了一条告警。MTTR从公司定的30分钟目标，我实际做到了24分钟。但说实话，这个平均值没太大意义。最长那次故障修了2小时10分，最短的5分钟就搞定了（只是重启一个僵死的worker）。真正让我觉得进步的是第二次P1故障：从收到电话到定位到问题，只用了7分钟。因为上个月刚吃过类似的亏，脑子里有根弦。

接口响应P99从380ms降到210ms。怎么降的？不是上了什么高深架构，就是把一个慢SQL从订单主库挪到了从库，再加了一层本地缓存。就这两步，砍掉一半响应时间。

一个没写进周报的翻车现场

入职第二周，周三下午两点多，监控突然炸了。订单服务超时，钉钉群里@了我三遍。我第一反应是流量高峰，看了一眼曲线，平稳。第二反应是数据库连接池，登录数据库一看，237个活跃会话，全是同一个查询。kill掉会话，服务恢复，前后15分钟。

但真正的翻车在晚上。我为了彻底解决，写了个定时任务把报表结果缓存到Redis。上线前在测试环境跑得好好的，结果一上生产，Redis连接数暴涨，把哨兵节点都拖慢了。排查发现，测试环境的Redis最大连接数设的是5000，生产只有1000。我代码里没用连接池，每次请求新建连接。大半夜的，主管没睡，跟我一起看日志。最后加了个lettuce连接池，压测通过。这件事让我记住：环境差异能要命。后来我写了个脚本，每次上线前自动比对测试和生产的关键配置。

凌晨两点半的电话

那是第三周的周六凌晨，我被电话吵醒。报警说批处理任务挂了。爬起来开电脑，翻日志，只看到“连接超时”，没有更多信息。登录系统日志，看到一堆tcp_tw_recycle相关的内核警告。搜了一下，这参数在负载均衡器后面会导致时间戳混乱。改完参数，重启服务，观察半小时，恢复正常。从接到电话到解决，用了50分钟。第二天我补了一个监控项：内核参数的漂移检测。

和人打交道比修bug累

有一次产品经理跑过来说要紧急上线一个功能，“就改一行代码”。我说行，但得给测试报告。他说没有，上线出了问题他负责。我说你负不了责，最后背锅的是我。僵了十分钟，拉上技术主管。主管打了个圆场，定了规矩：任何上线必须有单元测试和冒烟结果。产品经理脸拉得很长，但最后还是签了字。这事之后，我主动找产品和测试开了一次短会，把从需求到上线的完整流程过了一遍——需求评审、技术方案、代码review、测试用例、灰度、全量。流程不花哨，每一步都有检查项。试用期内再没出过“改一行代码”引发的故障。

三个笨办法保命

监控要够吵。我把告警分成三级：P0直接打电话，哪怕半夜三点；P1发钉钉+短信；P2只记日志。试用期内电话响了4次，都是真问题，没有误报。

作文5000网编辑部传承文档精选:

初级程序员试用期总结 | 程序员的试用期总结 | 程序员试用期总结怎么写 | 程序员试用期总结与反思 | 程序员试用期 | 程序员试用期

变更前必须准备好回滚命令。有一次改Nginx配置，我在执行nginx -s reload之前，先跑了一遍nginx -t，通过了。结果上线后静态资源404，原来正则写错了。我两秒钟执行了mv nginx.conf.bak nginx.conf && nginx -s reload，影响控制在30个请求内。如果没有那条备份，至少要花10分钟重写配置。

每周五下午花一小时整理“脆弱点清单”。目前列了7项：一块磁盘smart值到了78、单点Redis、一个接口没有限流、依赖的外部天气API没有熔断、SSL证书还有两个月到期、某个核心表没有索引、日志磁盘快满了。每条后面都写了预案，比如磁盘坏了怎么切、Redis挂了怎么降级。

试用期最后一天

主管问我愿不愿意留下。我说愿意，但提了三个条件：代码review不能流于形式、故障复盘不准追责只准找根因、给我权限优化那个单点Redis。主管都答应了。其实公司考核我的三个月，我也在考核公司。技术底线能不能守、故障响应是不是只看数字不看人、团队愿不愿意为稳定性投入资源。这三条都过了，我才签的转正单。

到今天为止，订单系统的可用性从99.91%到了99.97%。不是我的功劳，是那些故障和翻车教会我的。（zfW152.COm 趣祝福）

推荐阅读:

需要更多的工作总结网内容，请访问至：工作总结

热门标签: