|
Linux在具有高稳定性、可靠性的同时,具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整,优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进行系统调优时,了解系统性能分析工具是至关重要的。在Linux下有很多系统性能分析工具,比较常见的有top、free、ps、time、timex、uptime等。下文将介绍几个较为重要的性能分析工具vmstat、iostat和sar及其使用。
vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的内核进程,虚拟内存、进程、CPU活动进行监视。它是对系统的整体情况进行统计,不足之处是无法对某个进程进行深入分析。
vmstat的语法如下:
|
vmstat [-V] [-n] [delay [count]]
|
其中,-V表示打印出版本信息;-n表示在周期性循环输出时,输出的头部信息仅显示一次;delay是两次输出之间的延迟时间;count是指按照这个时间间隔统计的次数。对于vmstat输出各字段的含义,可运行man vmstat查看。
|
#vmstat 1 3(间隔 测试数量)
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
1 0 40972 268412 44192 283472 0 0 0 4 1 0 2 2 94 0
1 0 40972 268412 44192 283472 0 0 0 0 881 29 3 10 81 0
1 0 40972 268404 44196 283472 0 0 0 52 935 46 3 10 84 0
|
vmstat命令输出分成六个部分:
procs
r 列表示运行中等待cpu时间片的进程数,如果长期大于1,说明cpu不足,需要增加cpu,在一个稳定的工作量下,应该少于5(r<5)。
b 列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等,通常情况下是接近0的(b=0)。
memory
swpd 虚拟内存使用情况,即切换到内存交换区的内存数量(k表示)。如果swpd的值不为0,或者比较大,比如超过了100m,只要si、so的值长期为0,系统性能还是正常
free 当前的空闲页面列表中内存数量(k表示),一般不少于120,当free少于120时,系统开始自动的kill进程去释放
buff 作为buffer cache的内存数量,一般对块设备的读写才需要缓冲。
cache: 作为page cache的内存数量,一般作为文件系统的cache,如果cache较大,说明用到cache的文件较多,如果此时IO中bi比较小,说明文件系统效率比较好。
swap
si 从磁盘交换到内存的交换页数量,单位:KB/秒。
so 从内存交换到磁盘的交换页数量,单位:KB/秒
io
bi 从块设备读入数据的总量,即发送到块设备的块数,单位:块/秒(读磁盘)
bo 从块设备写入数据的总量,即从块设备接收到的块数,单位:块/秒(写磁盘)
这里我们设置的bi+bo参考值为1000,如果超过1000,而且wa值较大应该考虑均衡磁盘负载,可以结合iostat输出来分析。
system 显示采集间隔内发生的中断数
in 列表示在某一时间间隔中(每秒)观测到的每秒设备中断数,包括时钟中断。
cs 列表示每秒产生的上下文切换次数,如当 cs 比磁盘 I/O 和网络信息包速率高得多,都应进行进一步调查。
cpu 表示cpu的使用状态,按CPU的总使用百分比来显示
us 列显示了用户方式下所花费 CPU 时间的百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,需要考虑优化用户的程序。
sy 列显示了内核进程所花费的cpu时间的百分比。这里us + sy的参考值为80%,如果us+sy 大于 80%说明可能存在CPU不足。
wa 列显示了IO等待所占用的CPU时间的百分比。这里wa的参考值为30%,如果wa超过30%,说明IO等待严重,这可能是磁盘大量随机访问造成的,也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。
id 列显示了cpu处在空闲状态的时间百分比
目标:
r,b≈0
1:如果r经常大于4,且id经常少于40,表示cpu的负荷很重;
2:如果si,so 长期不等于0,表示内存不足;但如果系统正在读一个大批的永久页面,你也许可以看到si和so列会出现不一致的增长,这种情景并不一定表明系统负载过重,但是有必要对应用程序的数据访问模式进行见检查。在稳定的情况下,扫描率和重置率几乎相等,在多个进程处理使用不同的页面的情况下,页面会更加不稳定和杂乱,这时扫描率可能会比重置率高出。
3:如果io经常不等于0,且在b中的队列大于3,表示io性能不好;
4:一般us+sy在单用户系统中<=90 ,在多用户系统中<=80,如果在多用户环境中us+sys>80,进程就会在运行队列中花费等待时间,响应时间和吞吐量就会下降。
5:wa>40表明磁盘io没有也许存在不合理的平衡,或者对磁盘操作比较频繁;
6:cpu列,us,sys,id和wa也是不确定的,最理想的状态是使cpu处于100%工作状态,wa时间一般不大于40。 |
vmstat输出时间标识:
# vmstat 1 3 | awk '{print system("date +%H:%M:%S"),$0}'
01:41:41
0 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
01:41:41
0 r b swpd free buff cache si so bi bo in cs us sy id wa
01:41:41
0 3 0 40712 204196 52580 340116 0 0 0 4 1 0 2 2 94 0
01:41:42
0 1 0 40712 204036 52580 340160 0 0 0 0 1208 99 4 12 76 0
01:41:43
0 1 0 40712 204084 52584 340156 0 0 0 124 1084 108 3 7 84 0 |
(责任编辑:OracleTT) |