Shell 命令实战：轻松查看服务器内存与 CPU 使用情况-连界优站

内容目录

在日常的服务器管理中，掌握系统的资源使用情况对于确保服务稳定性和性能至关重要。本文将详细介绍如何使用 Shell 命令来监控服务器的内存和 CPU 状态，并提供一些常见问题的解决方案。

📚 引言

📝 为什么需要监控？

通过定期检查服务器的内存和 CPU 使用情况，可以提前发现潜在的问题，如内存泄漏或 CPU 过载，从而采取预防措施避免系统崩溃。

📄 主要工具

top 和 htop：实时显示进程信息。
free 和 vmstat：报告内存使用状况。
mpstat 和 sar：分析 CPU 性能指标。

🔍 内存使用情况

📂 使用 `free` 命令

📄 查看总览

free 是一个简单易用的命令，它能够快速展示系统的内存总量、已用空间和可用空间。

free -h

图注：-h 参数让输出更加人性化，单位自动转换为 KB/MB/GB

📊 示例输出

              total        used        free      shared  buff/cache   available
Mem:           7.7G        2.3G        1.4G        256M        4.0G        4.9G
Swap:          2.0G          0B        2.0G

📂 使用 `vmstat` 命令

📄 深入分析

vmstat 可以提供更多关于虚拟内存交换的信息，帮助理解页面错误频率及 I/O 活动。

vmstat 1 5

图注：每秒刷新一次，共打印五次

📊 示例输出

procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 1468744  34404 4175728    0    0     0     1   24   31  1  0 99  0  0
...

🔍 CPU 使用情况

📂 使用 `top` 命令

📄 实时监控

top 是最常用的进程监视工具之一，它可以动态地显示每个进程占用的 CPU 和内存资源。

top

图注：按 Shift + M 根据内存排序，按 Shift + P 根据 CPU 排序

📊 示例输出

top - 14:32:23 up 2 days,  3:45,  1 user,  load average: 0.15, 0.07, 0.02
Tasks: 189 total,   1 running, 188 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.7 us,  0.3 sy,  0.0 ni, 98.7 id,  0.3 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem :   7976.0 total,   1468.7 free,   2387.5 used,   4120.8 buff/cache
MiB Swap:   2048.0 total,   2048.0 free,      0.0 used.   4976.6 avail Mem

📂 使用 `htop` 命令

📄 更加直观

如果你觉得 top 的界面不够友好，那么 htop 将是一个更好的选择。它提供了更丰富的交互功能，例如鼠标支持和颜色编码。

htop

图注：需预先安装 htop，通常可通过包管理器获取

📂 使用 `mpstat` 和 `sar` 命令

📄 高级统计

对于那些需要深入了解 CPU 调度细节的人来说，mpstat 和 sar 提供了更为专业的统计数据。

mpstat -P ALL 1 5

图注：每秒刷新一次，共打印五次，显示所有 CPU 核心的状态

sar -u 1 5

图注：同样每秒刷新一次，共打印五次，专注于整体 CPU 利用率

🔍 常见问题及解决方案

📄 问题 1：为什么我的内存总是不足？

Q: 即使关闭了很多应用程序，仍然感觉内存不够用。
A: 可能是因为存在后台进程占用了大量资源，或者是开启了过多的服务。
解决方案：
- 使用 ps aux | sort -rk 4 找出占用内存最多的程序并考虑优化或终止它们。
- 审查启动项和服务列表，禁用不必要的守护进程。

📄 问题 2：遇到 CPU 使用率过高怎么办？

Q: 发现某个时刻 CPU 负载飙升，影响了其他任务的正常运行。
A: 这可能是由于某些批处理作业或者恶意脚本导致的。
解决方案：
- 结合 top 或 htop 查找异常进程，并根据实际情况进行调整（如降低优先级或直接杀死）。
- 检查是否有定时任务（cron jobs）在该时间段执行，适当调整时间间隔。

📄 问题 3：怎样提高响应速度？

Q: 在高负载情况下，服务器的响应变得非常慢。
A: 需要优化瓶颈所在，比如数据库查询、磁盘读写等。
解决方案：
- 对于数据库密集型应用，添加索引、优化 SQL 语句，减少不必要的表连接操作。
- 如果是 I/O 密集型场景，则考虑升级硬件配置，如 SSD 替换 HDD。

📄 问题 4：能否实现自动化监控？

Q: 手动频繁检查系统状态不仅耗时而且容易遗漏重要信息。
A: 绝对可以！借助 Nagios、Zabbix 等开源监控平台，可以轻松构建自动化报警机制。
解决方案：
- 设置阈值触发条件，当超过预设范围时发送通知邮件或短信提醒管理员。
- 编写简单的 Shell 脚本结合 cron 计划任务，定期记录关键指标变化趋势。