常用Linux 系统监控命令

Linux系统提供了很多小工具,让我们能方便地查看系统的性能,下面介绍日常工作中经常用到的这些命令。

vmstat命令

vmstat 可以定时显示系统的KPI指标,包括:进程、内存、交换文件、IO、系统、CPU 等。
它可以通过跟一个参数设定显示间隔。

例如下面的命令每2秒显示一次系统的信息

vmsta 2
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 138148 180708 1127556    0    0     5    15    3    8  0  0 99  0  0
 0  0      0 138140 180708 1127592    0    0     0     2   22  294  0  0 100  0  0
 0  0      0 138140 180708 1127592    0    0     0    18   27  344  1  0 99  0  0
 0  0      0 137888 180708 1127592    0    0     0     0   35  320  1  0 99  0  0
 0  0      0 137888 180708 1127592    0    0     0    18   30  323  0  0 99  0  0
 0  0      0 137888 180708 1127592    0    0     0    18   36  347  1  0 99  0  0
 0  0      0 137880 180708 1127592    0    0     0     0   20  288  0  0 100  0  0
 0  0      0 137880 180708 1127592    0    0     0    18  296  885  0  1 99  0  0
 0  0      0 137880 180708 1127592    0    0     0    18   36  338  0  1 99  0  0

procs 进程相关指标

  • r:处于运行状态或者正在等待运行时间的进程数量。
  • b:处于睡眠状态的进数量。

memory 内存相关指标,缺省单位是KB

  • swpd:已经使用的交换区。
  • free:未分配的内存。
  • buff:用于缓冲区的内存,
  • cache:用于缓存的内存,

swap 交换文件相关指标,缺省单位是KB

  • si: 从内存交换到磁盘的总量
  • so:从磁盘交换到内存的总量

io 相关指标

  • bi: 每秒输入的block的数量
  • bo:每秒输出的block的数量

系统相关指标

  • in:每秒发生的系统中断次数
  • cs:每秒发生的上下文切换次数

cpu 处理器相关指标

  • us(user time):处理用户级任务的时间占比
  • sy(system time):处理内核任务的时间占比
  • id(idle):空闲时间占比
  • wa(wait I/O):等待处理任务的时间占比
  • st(steal time):虚拟化环境下

top命令

top 命令显示Linux系统各运行的进程性能数据,缺省按使用的CPU时间排序,并且每5秒更新一次。在界面的顶部,会显示系统系统运行时间,CPU,内存 等指标,管理员能对系统情况一目了然。

例如执行下面的命令

top

系统输出的信息样例如下:

top - 11:27:00 up 28 days, 21:37,  1 user,  load average: 0.01, 0.03, 0.00
Tasks: 141 total,   1 running,  89 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.7 us,  0.2 sy,  0.0 ni, 99.2 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  3993892 total,   139468 free,  2545968 used,  1308456 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  1119228 avail Mem

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                              10 root      20   0       0      0      0 I   0.3  0.0  31:57.85 rcu_sched
  1446 redis     20   0   51660   8340   2328 S   0.3  0.2  39:18.12 redis-server
  1603 root      20   0  241736  29608   7792 S   0.3  0.7 291:20.98 python3
115338 yonglun   20   0   44540   3920   3280 R   0.3  0.1   0:00.01 top                                              241258 tomcat    20   0 3657844 318112  11884 S   0.3  8.0  20:02.73 java
     1 root      20   0  225660   6608   3888 S   0.0  0.2   0:35.64 systemd
     2 root      20   0       0      0      0 S   0.0  0.0   0:00.34 kthreadd
     3 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 rcu_gp
     4 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 rcu_par_gp
     6 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/0:0H-kb
     8 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 mm_percpu_wq
     9 root      20   0       0      0      0 S   0.0  0.0   0:35.88 ksoftirqd/0
    11 root      rt   0       0      0      0 S   0.0  0.0   0:06.03 migration/0
    13 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/0
    14 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/1
    15 root      rt   0       0      0      0 S   0.0  0.0   0:06.76 migration/1
    16 root      20   0       0      0      0 S   0.0  0.0   0:36.99 ksoftirqd/1
    18 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/1:0H-kb
    19 root      20   0       0      0      0 S   0.0  0.0   0:00.00 kdevtmpfs
    20 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 netns

ps命令

ps 命令能够查看系统当前运行的进程信息。

例如执行下面命令

$ ps -ef

将会列出系统当前正在运行的进程的详细信息,

UID         PID   PPID  C STIME TTY          TIME CMD
root          1      0  0 Feb06 ?        00:00:35 /sbin/init
root          2      0  0 Feb06 ?        00:00:00 [kthreadd]
root          3      2  0 Feb06 ?        00:00:00 [rcu_gp]
root          4      2  0 Feb06 ?        00:00:00 [rcu_par_gp]
root          6      2  0 Feb06 ?        00:00:00 [kworker/0:0H-kb]
root          8      2  0 Feb06 ?        00:00:00 [mm_percpu_wq]
root          9      2  0 Feb06 ?        00:00:35 [ksoftirqd/0]
root         10      2  0 Feb06 ?        00:31:56 [rcu_sched]
root         11      2  0 Feb06 ?        00:00:06 [migration/0]
root         13      2  0 Feb06 ?        00:00:00 [cpuhp/0]
root         14      2  0 Feb06 ?        00:00:00 [cpuhp/1]
root         15      2  0 Feb06 ?        00:00:06 [migration/1]
root         16      2  0 Feb06 ?        00:00:36 [ksoftirqd/1]
root         18      2  0 Feb06 ?        00:00:00 [kworker/1:0H-kb]
root         19      2  0 Feb06 ?        00:00:00 [kdevtmpfs]
root         20      2  0 Feb06 ?        00:00:00 [netns]

还可以配合grep 命令 过滤你需要查看的进程。
比如想查看系统中nginx 进程的信息,可执行下面的命令

$ ps -ef|grep nginx

会过滤ps-ef 输出的信息中包含nginx关键字的信息行

root      99324      1  0 07:04 ?        00:00:00 nginx: master process /usr/sbin/nginx -g daemon on; master_process on;
www-data  99328  99324  0 07:04 ?        00:00:00 nginx: worker process
www-data  99329  99324  0 07:04 ?        00:00:00 nginx: worker process
yonglun  113181 111407  0 10:50 pts/0    00:00:00 grep --color=auto nginx

iostat命令

该命令可以显示Linux 系统的输入/输出统计信息。

例如执行命令

$ iostat

输出的信息样例如下:

Linux 5.0.0-1029-azure (VT-PD-03)       03/06/20        _x86_64_        (2 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.43    0.00    0.35    0.13    0.00   99.09

Device             tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
loop0             0.00         0.00         0.00          4          0
sda               1.97         9.58        29.38   23900366   73302156
sdb               0.00         0.01         0.08      13577     201264

该命令还有两个参数可以控制定时显示间隔以及显示次数。例如下面命令将每秒输出一次统计信息,共执行10次。

$ iostat 1 10

netstat命令

netstat; 用于显示网络连接状态及其相关信息。

下面命令显示所有的网络连接信息

$ netstat -a

输出的信息样例如下:

Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:http            0.0.0.0:*               LISTEN
tcp        0      0 localhost:domain        0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:ssh             0.0.0.0:*               LISTEN
tcp        0      0 localhost:postgresql    0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:https           0.0.0.0:*               LISTEN
tcp        0      0 localhost:2368          0.0.0.0:*               LISTEN
Active UNIX domain sockets (servers and established)
Proto RefCnt Flags       Type       State         I-Node   Path
unix  2      [ ]         DGRAM                    29150351 /run/user/1000/systemd/notify
unix  2      [ ACC ]     SEQPACKET  LISTENING     31327    /run/udev/control
unix  2      [ ACC ]     STREAM     LISTENING     29150354 /run/user/1000/systemd/private
unix  2      [ ACC ]     STREAM     LISTENING     29150358 /run/user/1000/gnupg/S.gpg-agent.browser
unix  2      [ ACC ]     STREAM     LISTENING     29150359 /run/user/1000/gnupg/S.gpg-agent.extra

下面命令显示所有的监听中的连接以及对应进程

$ netstat -l -p

输出的信息样例如下:

(Not all processes could be identified, non-owned process info
 will not be shown, you would have to be root to see it all.)
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name
tcp        0      0 0.0.0.0:http            0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:domain        0.0.0.0:*               LISTEN      -
tcp        0      0 0.0.0.0:ssh             0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:postgresql    0.0.0.0:*               LISTEN      -
tcp        0      0 0.0.0.0:https           0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2368          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2369          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2370          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2371          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2372          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:2373          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:8101          0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:mysql         0.0.0.0:*               LISTEN      -
tcp        0      0 localhost:6379          0.0.0.0:*               LISTEN      -
tcp6       0      0 [::]:http               [::]:*                  LISTEN      -
tcp6       0      0 [::]:http-alt           [::]:*                  LISTEN      -
tcp6       0      0 [::]:ssh                [::]:*                  LISTEN      -
tcp6       0      0 [::]:https              [::]:*                  LISTEN      -
tcp6       0      0 [::]:9090               [::]:*                  LISTEN      -
tcp6       0      0 localhost:8005          [::]:*                  LISTEN      -
tcp6       0      0 ip6-localhost:6379      [::]:*                  LISTEN      -
udp        0      0 localhost:domain        0.0.0.0:*                           -
udp        0      0 VT-PD-03:bootpc         0.0.0.0:*                           -
raw6       0      0 [::]:ipv6-icmp          [::]:*                  7           -
Active UNIX domain sockets (only servers)
Proto RefCnt Flags       Type       State         I-Node   PID/Program name     Path
unix  2      [ ACC ]     SEQPACKET  LISTENING     31327    -                    /run/udev/control
unix  2      [ ACC ]     STREAM     LISTENING     29150354 124792/systemd       /run/user/1000/systemd/private
unix  2      [ ACC ]     STREAM     LISTENING     29150358 124792/systemd       /run/user/1000/gnupg/S.gpg-agent.browser
unix  2      [ ACC ]     STREAM     LISTENING     29150359 124792/systemd       /run/user/1000/gnupg/S.gpg-agent.extra
unix  2      [ ACC ]     STREAM     LISTENING     29150360 124792/systemd       /run/user/1000/gnupg/S.gpg-agent
unix  2      [ ACC ]     STREAM     LISTENING     29150361 124792/systemd       /run/user/1000/gnupg/S.gpg-agent.ssh
unix  2      [ ACC ]     STREAM     LISTENING     29150362 124792/systemd       /run/user/1000/gnupg/S.dirmngr
unix  2      [ ACC ]     STREAM     LISTENING     29150363 124792/systemd       /run/user/1000/snapd-session-agent.socket
unix  2      [ ACC ]     STREAM     LISTENING     37228    -                    /run/uuidd/request
unix  2      [ ACC ]     STREAM     LISTENING     37231    -                    /run/acpid.socket
unix  2      [ ACC ]     STREAM     LISTENING     37234    -                    /var/run/dbus/system_bus_socket
unix  2      [ ACC ]     STREAM     LISTENING     44024    -                    /var/run/mysqld/mysqld.sock
unix  2      [ ACC ]     STREAM     LISTENING     38903    -                    @irqbalance1312.sock
unix  2      [ ACC ]     STREAM     LISTENING     31314    -                    /run/systemd/private
unix  2      [ ACC ]     STREAM     LISTENING     31325    -                    /run/lvm/lvmpolld.socket
unix  2      [ ACC ]     STREAM     LISTENING     31329    -                    /run/systemd/journal/stdout
unix  2      [ ACC ]     STREAM     LISTENING     37194    -                    /run/snapd.socket
unix  2      [ ACC ]     STREAM     LISTENING     32069    -                    /run/systemd/fsck.progress
unix  2      [ ACC ]     STREAM     LISTENING     32074    -                    /run/lvm/lvmetad.socket
unix  2      [ ACC ]     STREAM     LISTENING     37186    -                    /var/lib/lxd/unix.socket
unix  2      [ ACC ]     STREAM     LISTENING     14808098 -                    /var/run/postgresql/.s.PGSQL.5432
unix  2      [ ACC ]     STREAM     LISTENING     37233    -                    @ISCSIADM_ABSTRACT_NAMESPACE
unix  2      [ ACC ]     STREAM     LISTENING     37196    -                    /run/snapd-snap.socket

ss命令

ss 命令用于获取socket统计信息
在终端上执行下面命令

$ ss

输出的信息样例如下:

Netid   State     Recv-Q    Send-Q                          Local Address:Port               Peer Address:Port                     
u_str   ESTAB     0         0             /var/run/dbus/system_bus_socket 37464                         * 37421                    
u_str   ESTAB     0         0                                           * 41134                         * 41135                    
udp     ESTAB     0         0                                   127.0.0.1:41188                 127.0.0.1:41188
tcp     ESTAB     0         0                                   127.0.0.1:33980                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:33980
tcp     ESTAB     0         0                                   127.0.0.1:43956                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:32796
tcp     ESTAB     0         0                                   127.0.0.1:57016                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:32796                 127.0.0.1:mysql
tcp     ESTAB     0         36                                   10.0.0.5:ssh              119.130.230.74:13568
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:56432
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:57016
tcp     ESTAB     0         0                                   127.0.0.1:42076                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:42928                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:56432                 127.0.0.1:mysql
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:42076
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:42928
tcp     ESTAB     0         0                                   127.0.0.1:mysql                 127.0.0.1:43956

uptime命令

uptime命令显示系统已经运行的时间。
在终端上执行下面命令

$ uptime

输出的信息样例如下:

11:05:01 up 28 days, 21:15,  1 user,  load average: 0.00, 0.01, 0.00

free命令

free 命令显示系统的内存及交换文件的使用情况
在终端上执行下面命令

$ free

输出的信息样例如下:

              total        used        free      shared  buff/cache   available
Mem:        3993892     2543260      142376       38644     1308256     1121936
Swap:             0           0           0

w命令

w命令可以显示当前登陆系统的用户的信息
在终端上执行下面命令

$ w

输出的信息样例如下:

11:19:52 up 28 days, 21:30,  1 user,  load average: 0.06, 0.06, 0.02
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
yonglun  pts/0    119.130.230.74   10:21    0.00s  0.05s  0.00s w

---The End ---