查询 linux 中是否出现OOM

服务器每天备份mysql过程中经常出现mysql服务挂掉重启情况,考虑到可能是内存不足导致的OOM问题。

在 Linux 中,如果系统的内存或交换空间耗尽,内核的 OOM (Out-Of-Memory) 杀手会触发,将杀掉一些高内存使用的进程以释放内存。这种情况可以在系统日志中查看。以下是具体的查看步骤:

1. 检查系统日志 /var/log/messages/var/log/syslog

在多数 Linux 系统中,内核和系统的日志记录在 /var/log/messages/var/log/syslog 文件中。在这些文件中可以查找是否有 OOM 相关的记录。

使用 grep 搜索 OOM 日志
grep -i "killed process" /var/log/messages

grep -i "killed process" /var/log/syslog

2. 查看 dmesg 输出

内核日志中也会记录 OOM 事件,通常可以用 dmesg 来查看。查找与 OOM 相关的记录:

dmesg | grep -i "killed process"

日志示例
OOM 日志通常包含类似以下的记录:

[ pid ] Out of memory: Kill process 12345 (process_name) score 550 or sacrifice child
Killed process 12345 (process_name) total-vm: 2048000kB, anon-rss: 1024000kB, file-rss: 10240kB

  • pid:被杀掉进程的 ID。
  • process_name:被杀掉进程的名称。
  • score:OOM 评分,数值越高的进程越有可能被杀。
  • total-vm、anon-rss、file-rss:内存的详细信息。

3. 检查 /var/log/kern.log

部分系统中,内核相关日志也会记录在 /var/log/kern.log 文件中。在这里也可以找到被 OOM 杀手终止的进程记录。

示例
grep -i "Out of memory" /var/log/kern.log

4. 使用 journalctl 查看 OOM 日志(systemd 系统)

如果系统使用 systemd,日志记录通过 journalctl 命令可以查看。可以过滤 kernel 日志查找 OOM 记录:

journalctl -k | grep -i "Out of memory"
或直接过滤内存被杀事件:
journalctl | grep -i "killed process"

5. 检查 oom_scoreoom_score_adj

可以在 /proc/<PID>/oom_score/proc/<PID>/oom_score_adj 中查看进程的 OOM 评分。这些评分越高的进程越有可能被杀死。
其中:

  • oom_score:系统自动根据进程内存占用和系统负载计算的分数。
  • oom_score_adj:可以手动调节进程的 OOM 分数,范围是 -1000(最不可能被杀)到 1000(最可能被杀)。

Tags: none

添加新评论