珠海运维工程师要做什么?运维工程师主要做什么?总结两句话:
1、保障业务长期稳定运行(如网站服务器、游戏服务器等)。
2、保障数据安全可靠(如用户名密码、游戏数据、博客文章、交易数据等)。
由这两句话推演运维工程师要学些什么?
一、保障业务长期稳定运行
出一点点差错,用户就要投诉了。
1、业务跑在什么上面?
网站服务器一般是apache,nginx,tomcat等。但是真正跑通流程还需要Mysql数据库来存储用户密码及其它。很多程序都要php的解析,所以LNMP、LAMP(即nginx、apache、mysql、php)环境部署是必须掌握的技能。
2、业务出了问题怎么及时知道?
这就需要监控软件来邮件或短信来通知你,常用的有zabbix,nagios等。报警发邮件,也得一个邮件程序呀,sendmail或postfix。
3、在家里收到报警,但服务器是内网IP,怎么也得解决问题吧?
在公司搭建openvpn或pptp或openswan,在家里通过VPN拨入内网,24小时解决问题…唉,半夜爬起来解决问题也没工资。
运维到底是干什么的?估计连运维工程师本身都不清楚,在百度上搜索也基本得不到答案,找了很多的运维老员工,终于总结出了运维工程师的工作内容:
一般来说,运维工程师都是说的互联网企业的运维师,通常属于技术部门,是支持互联网产品技术以及研发,测试和系统管理的四个主要部门。国内外公司以及大型和小型公司之间的划分将有所不同,主要的工作内容有下面几种:
1、保障业务系统长期稳定运行
毕竟业务系统要是出现一点差错,用户就要投诉,所以运维工程师最核心的工作就是保证业务系统能够稳定运行。
首先要知道业务跑在什么上,一般来说网站服务器都是nginx、apache等,依赖mysql数据库进行数据储存,依靠PHP进行解析,所以运维工程师必须掌握LNMP、LAMP等环境部署的知识。
2、保障数据安全可靠
数据安全是公司领导最看重的部分,运维工程师也要保证数据的安全性和可靠性,要是出了一点点错误,领导就要找运维喝茶了。
有时候需要手动改数据库的内容,就要学会掌握mysql数据库的增删查改知识;
有时候需要应对数据库的服务器硬件坏了,就需要Mysql主从复制以备不时之需;
有时候需要还原数据库,就需要学会mysql增量备份和恢复,以还原到指定的时间点;
有时候定时备份还不够,就需要使用rsync+inotify来实时备份;
有时候为了增加服务器安全性,就要通过iptables来控制公司的IP或者跳板机IP访问权限;
3、构建监控报警体系
运维工程师常用的是zabbix、nagios来进行报警监控,如果没有监控运维就是瞎子,所以要先构建报警监控体系,此后就要解决系统故障。
一般来说,常见的故障有应用故障、数据库故障、网线故障等等,有的是软件故障,有时候是硬件故障,而一个有经验的运维工程师能在第一时间定位故障原因。
4、技术与业务问题处理
这里有两个核心的问题,分别是技术问题和业务问题,技术问题主要需要网络抓包分析、tcpdump抓包分析和代理机制等等内容;
而业务问题就比技术要复杂一些了,比如业务层面的数据分析,不光要统计出业务的各种指标数据,还要对数据进行分析解剖,找出业务问题的所在。
5、版本测试与上线
这也是运维工程师的常见工作内容,负责版本的测试与上线,开发人员发布版本之前,运维工程师需要进行性能和功能测试;此外在版本上线的时候,最好也在晚间业务量较小的时候上线,可以避免上线压力过大。
总结
运维和开发是两个截然不同的方向。如果做运维的话,有开发的底子那么转岗位也不是不可以。
运维负责具体的产品线运维工作,同时也需要掌握开发的能力,深入业务,最了解业务的痛点和问题,同时研发/优化针对产品业务需求的平台、工具和手段,能够接触到各类优秀的系统架构并有能力做出优劣对比,同时对业务的掌控决定了相应运维工程师在业务发展中的作用。