標籤文章
維運
這個主題下有 2 篇筆記。
概念介紹 中文
你們缺的不是 DevOps,是先分清更怕慢還是更怕壞
很多團隊以為自己缺 CI/CD、監控或平台工程,其實更底層的問題是沒有分清瓶頸在等待,還是風險在失控。
一句判斷 DevOps 不是工具清單,而是一套排序系統:怕慢,就先補交付速度;怕壞,就先補穩定性、可觀測性和可追溯性。
生產筆記 中文
Kubernetes 探針誤判:一次把服務打進重啟循環的 liveness probe 事故
有些事故不是程式壞掉,而是 liveness probe 把本來還能活下來的服務誤判成該重啟。這篇記一個很典型的生產坑。
一句判斷 健康檢查不是越兇越好;錯把慢服務殺掉,常比等它恢復更糟。