运维日常常用命令

禾急稳 2021-02-21 PM 63℃ 0条

使用w查看系统负载
第一行从左到右依次表示当前时间、系统已运行时间、登录用户数(终端登录显示为ttyx,远程登录显示为pts/x)、平均负载(每1分钟、每5分钟、每15分钟)主要是注意第一个负载值,值越大说明服务器压力越大。一般情况下,这个值不要超过服务器的逻辑cpu数量就没有关系![。][1

top
第一行:
10:01:23 — 当前系统时间
126 days, 14:29 — 系统已经运行了126天14小时29分钟(在这期间没有重启过)
2 users — 当前有2个用户登录系统
load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。

load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。

第二行:
Tasks — 任务(进程),系统现在共有183个进程,其中处于运行中的有1个,182个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。

第三行:cpu状态
6.7% us — 用户空间占用CPU的百分比。
0.4% sy — 内核空间占用CPU的百分比。
0.0% ni — 改变过优先级的进程占用CPU的百分比
92.9% id — 空闲CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比
0.0% si — 软中断(Software Interrupts)占用CPU的百分比

在这里CPU的使用比率和windows概念不同,如果你不理解用户空间和内核空间,需要充充电了。

第四行:内存状态
8306544k total — 物理内存总量(8GB)
7775876k used — 使用中的内存总量(7.7GB)
530668k free — 空闲内存总量(530M)
79236k buffers — 缓存的内存量 (79M)

第五行:swap交换分区
2031608k total — 交换区总量(2GB)
2556k used — 使用的交换区总量(2.5M)
2029052k free — 空闲交换区总量(2GB)
4231276k cached — 缓冲的交换区总量(4GB)

这里要说明的是不能用windows的内存概念理解这些数据,如果按windows的方式此台服务器“危矣”:8G的内存总量只剩下530M的可用内存。Linux的内存管理有其特殊性,复杂点需要一本书来说明,这里只是简单说点和我们传统概念(windows)的不同。

第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。

如果出于习惯去计算可用内存数,这里有个近似的计算公式:第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存:530668+79236+4231276 = 4.7GB。

对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。

第六行是空hang
第七行以下:各进程(任务)的状态监控
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)


vmstat
(1)r(run):表示运行或等待cpu时间片的进程数。等待cpu时间片不是说这个进程没有运行,实际上某一时刻1个cpu只能有一个进程占用,其他进程只能处于等待状态,这些等待cpu资源的进程依然是运行状态。如果该数值长期大于逻辑cpu的个数,那么就说明cpu资源不够用 了
(2)b(block):表示等待资源的进程数,这个资源指的是I/O、内存、网速等资源。这个数值长期大于1,那么也是需要关注的

(3)swpd :表示切换到交换分区中的内存数量。当内存不够的时间,才会将数据临时放到交换分区中。如果该数值在频换的变化,那么内存与交换分区在进行频繁的读写,那么也就说明内存不够了。如果这个数值在变化,那么si与so肯定也是有变化的。

swap显示内存的交换情况
(4)si :表示由交换分区写去到内存的数据量。单位为KB
(5)so:表示由内存写入到交换分区的数据量

io显示磁盘的使用情况
(6)bi :表示从磁盘读取数据量的多少(读磁盘)。单位KB
(7)bo:表示从磁盘写入数据量的多少(写磁盘)
如果这2个数值在频换的变化,表示磁盘在频换的读写。磁盘的读写速度比较慢,肯定会影响b列数值的变化。

(8)us:表示用户级别(如:网站、mysql)占用cpu资源的时间百分比。如数值长期大于50,也说明cpu资源不够了。
(9)sy:表示系统本身占用cpu资源的时间百分比
(10)id:表示cpu处于空闲状态的时间百分比
us+sy+id=100%
(11)wa:表示I/O等待所占用的cpu的时间百分比。数值也很大,说明cpu不够用
(12)st:表示被偷走的cpu资源(进行过虚拟化后,一些子机会占用cpu资源)

https://www.jianshu.com/p/a3aa6b01b2e1 Linux 命令神器:lsof

标签: none

非特殊说明,本博所有文章均为博主原创。

上一篇 事实证明VM迁移会影响服务
下一篇 没有了

评论啦~