對 Oplog 不熟的朋友,建議先閱讀之前的內容
- 2021 iThome 鐵人賽 - DAY19 MongoDB Oplog 到底是什麼?
- 2021 iThome 鐵人賽 - DAY20 MongoDB Oplog 玩壞它
- 2021 iThome 鐵人賽 - DAY28 MongoDB Atlas 付費監控內容
四年一度的大型盛事終於結束,來回顧一下這個我們都知道,卻隱藏得很好的 MongoDB 殺手 - Oplog。
在流量真正進入之前,我們進行了多次的功能驗證、壓力測試,確保在各個環節都沒有問題,對於各個服務的狀態也甚是滿意。展開了 MongoDB Atlas 監控,正式迎接挑戰!
剛開始我們很明顯感受到流量帶來的壓力,各項數據都還是穩定、可預期的,這時候是第一個錯誤。
等到第二天、第三天,我們開始發現 Oplog 的 headroom 開始有降低趨勢,這部分根 Oplog GB/Per hour 是呈現相反的,畢竟量多了,自然餘裕就開始減少。
第一個錯誤是沒有仔細評估合理性,對於流量的增長,到底多少是合理的呢?這個在事情必須要充足的測試才有辦法進行推斷。
這個問題也衍伸出另一件事,就是全服務的壓力測試非常重要,在 pre-production 環境應該事先給予充足的壓力測試。