需要熟悉docker,最好熟悉k8s,懂互聯網云產品,像騰訊云、阿里云、百度云等(本科以上)
崗位職責:
1、建立和完善公司的技術監控體系和事件處理機制,確保業務的穩定運行;
2、配合產品研發組進行應用和服務的發布、部署、調優、運營等工作;
3、參與容量規劃、架構優化、容災優化、性能優化等運維級別項目;
4、通過各類監控工具及相關報警信息,按分級及時處理故障,判斷故障類型、嚴重程度并執行故障問題處理流程;
5、負責各類故障問題的跟蹤、記錄、總結及合理化建議;
6、建立和完善規范化的運維監控體系,保障業務運行質量;
7、不斷研發與探索運維自動化及各類創新途徑,縮短運維響應時間,減低運維成本;
8、負責線上服務的監控響應,解決運營中遇到的各種問題;
9、接收各部門故障匯報,?并及時跟蹤故障處理流程;
職位要求
1、互聯網公司3年以上運維經驗;
2、精通Linux系統管理,熟練使用shell、perl、python等至少一門腳本語言;
3、熟練掌握常見監控軟件zabbix、cattic、Nagios、Open-Falcon等監控軟件的使用;
4、具有分析大型應用系統架構并進行改進的能力,擁有快速排查系統瓶頸的能力;
5、熟悉監控系統、自動化系統的原理及建設、維護和優化者優先;
6、具有較強的責任心、安全意識和文檔意識,具有良好的溝通能力及團隊精神;