首页

来自Wiki-运维之路
跳转至: 导航搜索

说明

网上有个说法: System administrator 是根据手册做事的 System engineer 是根据自身经验独立解决故障的 不过一般的小公司,不会这么区分的,而我待过公司最多的运维团队也就40多人,区分系统运维、应用运维、数据库运维、安全运维这四项。所以我整理的内容也只适合小公司的需求。很多时候运维其实需要的面比较广泛,因为你的工作性质决定了你必须面对各种问题,然后去解决掉这些问题。我最初是做系统运维的,之后兼做应用运维,安全运维,数据库和大数据运维这块没这么涉及过,是我的弱项。

Ps.作为穷屌运维人员,买不起用不惯MAC,习惯性使用Ubuntu系统办公,所以建议也建议大家使用Linux系统,什么发行版本随意,我身边的同事有用Mint、Arch、debian、深度linux等。简单的介绍下系统的相关配置:

ubuntu18

系统运维

系统运维狭义上,就是是用root权限进行的相关工作。当然硬件肯定也是这个范围内了。 实际上,我连续在2家公司参与IDC机房建设工作,挺耗精力的,特别是刚入职到新公司,CTO告知要搬迁机房,然后再扩容预计100台服务器,做个方案,那个时候对公司业务不熟悉,真心头大。

那么,我们从这个机房建设案例开始,讲讲运维要干些什么把。

硬件相关

IDC相关知识点

首先,我们需要了解公司业务需求,根据业务需求核算机器配置及成本(包括是否需要网络设备堆叠高可用、是否需要CDN等、阿里云成本对比、是否电商业务、并发量、防火墙...),假设现在公司要求并发量600W,HDFS大数据集群,需要做堆叠、需要内部网络1000Mbps可靠传输,外部BDP带宽500Mbps,非电商,使用IDC提供免费DDos带宽即可。 那么,你可以直接拨打阿里云客服电话,他们会安排工程师上门服务了,而你,只需要看他们提供的方案以及价格即可——阿里云维护起来真心比机房方便,但是还是有特定情况需要走IDC的,比如为了财务报表好看,需要固定资产,比如投资人有IDC背景,要求你们进哪家IDC等情况。那么你就可以苦逼的进入IDC选型,然后进入服务器选型,最后进入机房上架,接下来进入下一章。

系统安装配置

配置跳板机 配置PXE 配置管理卡

系统初始化配置

Puppet Ansible CentOS7系统调优

系统监控配置

常用的监控工具有 nagios Zabbix cacti Ntop cat 一般项目监控主要指标包括

  • CPU、内存、磁盘、网络监控
  • 项目进程、端口监控
  • 项目关键指标如线程数占用、访问量、数据库
  • 其他项目监控如错误日志

应用运维

包括web容器、中间件等

Web容器

Nginx


中间件

Redis

自动化运维

Gitlab

运维安全

包括安全扫描,各类防护等

安全扫描

Openvas

安全防护

Fail2ban

开源项目

owncloud

常见问题处理

日志大量Start_Session

Tomcat应用CPU占用100%

TPLINK路由器带宽统计

Linux文件及文件名编码转换

Mediawise入门