月薪5K50K运维工程师,都有什么区别

做运维感觉像网管怎么办?新工作运维3个多月,天天就是维护重启服务器,更新代码……感觉这样下去几年后就没有什么竞争力了……

有很多刚进入运维工作的同学感同身受以上的场景。

「运维」可能是分水岭最明显的职位之一:有的人毕业6年,月薪从3K涨到到50K;有的人工作4年,依然做着重启服务器、检查机房的机械工作,这都是身边的真实事例。

我们就通过招聘网站上,薪资5K到K的运维招聘要求,来看看运维自我成长,实现逆袭。

阶段一:月薪3K-5K

本阶段工作描述:

“昨天又搬了65台服务器……”

一张图概括:

1、负责公司内、外网络平台的搭建、实施及网络(含无线网络技术、设备)的具体维护工作;

2、针对公司开展的网络技术方案的定型与实施工作提出建议;

3、网络及安全技术实施方案中安装、调试、维护工作;

4、负责公司办公网络及IDC网络日常维护工作;

5、负责集团网络设备及广域线路的统计工作。

1、应届毕业生,专科及以上学历、计算机相关专业;

2、诚实守信,性格开朗,无不良历史记录;

3、善于学习,善于沟通,文档功底好,勇于面对挑战,敢于承担工作压力;

4、学生干部或有相关网络工程师认证者优先考虑;

5、熟悉Linux操作系统和虚拟化技术的优先。

技术关键词:

Linux、服务器、环境部署

运维工程师(OperationsEngineer),字面意思可理解为管理系统、服务器的工程师。初级运维最常见的工作就是熟悉和维护服务器——所以检查机房、搬服务器才那么常见……

对服务器了解后,就要开始学习搭建服务器、搭建网络、配置环境等工作。绝大多数服务器都使用Linux系统,所以熟练使用Linux是硬性要求;

服务器需要配置网络,所以对路由协议、网络协议等网络原理也必须掌握;产品开发完成后,需要运维部署环境,安装相应的软件,如Apache、Nginx、tomcat、JDK、PHP、MySQL等;安装完成后就可以上线吗?不,有时你还需要部署一套测试环境……

在这个阶段中,运维的大部分工作都是简单和机械性的,对技术水平的要求很少,以至于薪资也较低。所以刚毕业的程序员往往有一个错觉:运维岗不如开发岗。他们会感到「迷茫」,甚至「焦虑」……

但其实,运维是一场真正的马拉松。同样是第一个阶段,你只跑了1%,开发的同学已经跑了20%,你的提升空间远远超过他们。

阶段二:月薪6K-15K

本阶段工作描述:

“从删库到跑路……”

一张图概括:

1,负责服务器的配置、维护、监控、调优,故障排除等;2,运维自动化及运维脚本开发;3,大用户量下高性能服务器系统部署方案的制定及实施与监控;4,及时响应并处理线上故障。:1,计算机相关专业大学本科以上学历,具有扎实的计算机基础理论知识;2,熟悉mysql、mongodb、redis、mq、elk、nginx、tomcat的安装部署及优化;3,具有良好的故障排查能力,良好的逻辑分析能力及技术敏感度;4,熟悉掌握使用shell、python脚本语言,能熟练进行脚本/工具开发,对自动化运维有较深入的理解或者经验者优先;5,高度的责任感,较强的故障分析及排查能力,善于在工作中学习,能承受工作压力。

技术关键词:

故障排查、优化、Shell、Python、监控

随着自身技术的积累,运维的薪资在突飞猛涨。这时,你已经可以在公司或某项目里独当一面。要达到这个阶段的要求,你需要掌握这些技能:

一、排错和调优

上线没多久,服务就了,还不被老板骂死。尽管你有一肚子的委屈,我只是个运维,代码不是我写的,为什么要我来背这锅?!委屈归委屈,服务访问不了了,就是运维的事。尽快定位问题,解决问题才是王道。怎么来定位问题呢?最简单直接的办法就是看日志,看系统日志,看软件相关的日志,结合故障现象和经验,快速的进行定位和恢复。然后就是总结经验,吸取教训,写事故报告。OK,现在你知道,需要对系统环境需要进行一定的调优操作,不再做背锅侠。

相关技术:top,vmstat,iftop,awk,sed,sar,iostat,strace,...

二、备份

之前的Gitlab删库事件的教训犹在眼前,丢失了几小时的数据,虽然大部分的备份策略都失效了,但还是挽救了几小时前的一个备份,才没有造成更大的数据丢失和公司损失。我们需要对设备进行备份冗余,需要对数据库进行备份及离线备份,需要对网站静态进行备份冗余,需要对机房进行备用,能做到双活,那是更好的啦。

相关技术:rsync,crontab,lvm快照,mysqldump,extrabackup,完全备份,差异备份,增量备份,离线异地备份,...

三、高可用集群

没有永垂不朽,我们不能保证硬件24小时在线,但需要保障服务24小时在线。

出现故障后,如果做好高可用和冗余,故障自动切换,移除故障节点,那样也就保障了服务的实时在线。在老板和用户不知情的情况下,悄么的把故障处理好的,KPI算是保住了,奖金也许就会有的吧。

相关技术:F5,Nginx,LVS,HA-proxy,MHA,Zookeeper,各种其他分布式集群方案,...

四、监控和警报

时刻担心网站挂掉,一年天、每周7天、每天24小时,时刻保持精神高度紧张,就算你是神仙都会撑不住的。我们需要一个机器来监督其他的机器工作,我们需要解放我们自己。当有故障发生的时候,通过短信、


转载请注明:http://www.shhjfk.com/zytd/zytd/13948.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了