IT運維工程師
1.2-1.8萬元/月一、崗位職責
1.基礎(chǔ)設(shè)施全生命周期管理
負責數(shù)據(jù)中心IT設(shè)備(服務(wù)器/網(wǎng)絡(luò)/存儲)的規(guī)劃部署、運行監(jiān)控、性能優(yōu)化及全周期運維管理。
主導(dǎo)AI與高性能計算場景下的算力服務(wù)器集群(如GPU/NPU架構(gòu))運維工作,開展性能調(diào)優(yōu)與資源適配。
2.算力網(wǎng)絡(luò)與組網(wǎng)技術(shù)
參與設(shè)計并持續(xù)優(yōu)化算力網(wǎng)絡(luò)架構(gòu),掌握高速互聯(lián)協(xié)議(如InfiniBand/RoCE)及主流分布式計算框架(如Hadoop/Spark/Kubernetes)。
保障算力資源的靈活調(diào)度與低時延通信,支撐業(yè)務(wù)規(guī)模動態(tài)擴展需求。
3.運維體系與安全保障
依據(jù)ITIL標準構(gòu)建運維管理體系(涵蓋事件、變更與問題處理流程),確保系統(tǒng)可用性不低于99.9%。
制定災(zāi)備方案與應(yīng)急響應(yīng)機制,牽頭落實信息安全合規(guī)要求(如ISO27001/等保規(guī)范)。
4.團隊與技術(shù)管理
帶領(lǐng)5-10人運維團隊,組織實施技術(shù)培訓(xùn)與人才發(fā)展計劃。
推進自動化工具(如Ansible/Prometheus)和智能監(jiān)控系統(tǒng)的應(yīng)用落地,提升運維效率并控制運營成本。
二、任職要求
1.學歷與經(jīng)驗
統(tǒng)招本科及以上學歷,計算機、通信、自動化等相關(guān)專業(yè)背景。
具備5年以上數(shù)據(jù)中心IT基礎(chǔ)設(shè)施運維經(jīng)歷,其中至少2年團隊管理經(jīng)驗。
2.技術(shù)能力
2.1 硬件與系統(tǒng)
熟悉主流品牌服務(wù)器(如Dell/HP/Huawei)、網(wǎng)絡(luò)設(shè)備(Cisco/H3C)及存儲平臺的技術(shù)特性。
熟練操作Linux/Windows操作系統(tǒng),具備內(nèi)核級調(diào)優(yōu)與復(fù)雜故障排查能力。
2.2 算力專項
了解AI算力服務(wù)器架構(gòu)(如NVIDIA DGX/國產(chǎn)AI服務(wù)器)及其集群調(diào)度工具(如Kubernetes/Slurm)。
具有高速網(wǎng)絡(luò)部署經(jīng)驗(InfiniBand/RoCEv2),能優(yōu)化多節(jié)點間通信性能。
2.3 云與虛擬化
掌握VMware/KVM虛擬化技術(shù)及容器化方案(Docker/K8s),具有一類主流云平臺(AWS/Azure/阿里云)實際運維經(jīng)驗。
2.4 認證與標準
持有ITIL V3/V4、PMP、CCNP或RHCE認證者優(yōu)先考慮。
了解ISO20000、ISO27001等國際管理體系標準。