7个Linux 命令轻松搞定线上Java日志管理难题

2025-07-15 09:38 运维作者：程序员岳彬

引言

在线上Java应用的运维工作中，日志管理是至关重要的一环。日志不仅能帮助我们排查故障、分析性能问题，还能为业务优化提供数据支持。然而，线上Java日志常常会遇到各种难题，如日志文件过大、需要实时监控、按条件过滤等。本文将针对这些常见难题，介绍7个实用的linux命令，帮助你轻松搞定线上Java日志管理。

一、解决日志文件过大问题

线上Java应用经过长时间运行后，日志文件可能会变得非常庞大，动辄几GB甚至几十GB。这不仅会占用大量的存储空间，还会给日志的传输、备份和分析带来极大的不便。此时，我们可以借助split命令来解决这一问题。

split命令能够将一个大文件按照指定的大小或行数分割成多个小文件，而且在分割过程中不会影响原日志文件的写入，保证日志记录不中断。

其基本语法为：split [选项] 要分割的文件分割后文件的前缀

常用选项：

-b：指定分割后每个文件的大小，单位可以是字节（默认）、KB（k）、MB（m）、GB（g）等。
-l：指定分割后每个文件的行数。

实例1：按大小分割日志文件

如果我们有一个名为app.log的Java日志文件，大小为500MB，我们想将其按100MB大小进行分割，可执行以下命令：

split -b 100M app.log app_split_

上述命令中，-b 100M表示按100MB大小分割；app.log是要分割的日志文件；app_split_是分割后文件的前缀。

执行该命令后，会生成一系列以app_split_开头的文件，分别为app_split_aa、app_split_ab、app_split_ac、app_split_ad、app_split_ae，每个文件的大小不超过100MB（最后一个文件可能小于100MB）。

实例2：按行数分割日志文件

若我们希望按行数分割，比如每个文件包含1000行日志，命令如下：

split -l 1000 app.log app_line_split_

这里-l 1000表示每个分割后的文件包含1000行日志，分割后生成app_line_split_aa、app_line_split_ab等文件。

通过split命令分割后的小文件，更便于我们进行存储、传输和分析。比如，我们可以只传输或分析其中某个时间段的日志片段，大大提高工作效率。同时，在进行日志备份时，也可以针对分割后的小文件进行操作，避免因单个大文件备份失败而导致全部日志备份失败的情况。

二、实时监控日志输出

在Java应用运行过程中，我们常常需要实时监控日志输出，以便及时发现应用运行中的错误、警告等信息。tail命令的-f参数能够实时跟踪文件内容的变化，非常适合用于实时监控日志输出。

tail命令的基本语法为：tail [选项] 文件名

常用选项：

-f：实时跟踪文件内容的更新，当文件有新内容写入时，会立即显示在终端上。
-n：指定显示文件末尾的行数，默认显示最后10行。

实例1：实时监控日志文件

要实时监控app.log日志文件的输出，执行以下命令：

tail -f app.log

执行该命令后，终端会显示app.log文件末尾的内容，并且会一直处于监听状态。当应用有新的日志信息写入app.log时，这些新信息会立即显示在终端上，让我们能够实时了解应用的运行状态。

实例2：实时监控并只显示错误信息

在实际应用中，我们可能更关注日志中的错误信息。此时，可以结合grep命令进行过滤，只显示包含“ERROR”的日志行，命令如下：

tail -f app.log | grep "ERROR"

其中，grep "ERROR"用于从tail命令的输出中过滤出包含“ERROR”的行。这样，终端只会实时显示app.log中新增的错误信息，方便我们及时发现和处理应用中的错误。

实例3：先显示近期日志再实时监控

如果我们想先查看日志文件末尾的100行内容，了解近期的应用运行情况，然后再进行实时监控，可以使用-n参数，命令如下：

tail -n 100 -f app.log

该命令会先显示app.log文件末尾的100行日志，然后进入实时监控状态，当有新的日志写入时，继续实时显示。

通过tail命令的实时监控功能，我们能够及时掌握应用的运行动态，快速响应和处理各种异常情况，保障应用的稳定运行。

三、按条件过滤日志

在分析Java日志时，我们往往需要根据特定的条件过滤出有用的信息，比如根据关键词、时间戳、错误类型等。grep命令是一个强大的文本搜索工具，能够满足我们按条件过滤日志的需求。

grep命令的基本语法为：grep [选项] 模式文件名

常用选项：

-i：忽略模式中的大小写，进行不区分大小写的匹配。
-v：显示不包含匹配模式的行。
-E：支持扩展的正则表达式。
-o：只显示匹配模式的部分。
-r：递归搜索目录下的所有文件。

实例1：过滤包含特定用户ID的日志

假设我们要从app.log中过滤出包含用户ID为“123456”的日志行，命令如下：

grep "123456" app.log

该命令会在app.log中搜索所有包含“123456”的行，并将这些行显示在终端上。

实例2：过滤不包含“INFO”的日志行

如果我们想排除日志中的信息级别的日志，只查看其他级别的日志（如警告、错误等），可以使用-v选项，命令如下：

grep -v "INFO" app.log

此命令会显示app.log中所有不包含“INFO”的日志行。

实例3：过滤符合正则表达式的日志

若要过滤出日志中符合特定正则表达式的内容，比如匹配邮箱地址的日志行，可以使用-E选项，命令如下：

grep -E "[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}" app.log

该命令会从app.log中过滤出所有包含邮箱地址格式的日志行。

实例4：在多个日志文件中过滤

如果我们要在多个日志文件中过滤包含“Exception”的日志行，可以指定多个文件名，命令如下：

grep "Exception" app.log app_error.log

此命令会在app.log和app_error.log两个文件中搜索包含“Exception”的行，并将结果显示出来。

通过grep命令的灵活使用，我们可以快速从海量的日志信息中过滤出符合条件的内容，大大提高日志分析的效率，帮助我们更快地定位问题。

四、统计日志事件频率

统计日志中各类事件的发生频率，能够帮助我们了解应用的运行状况，比如某个错误出现的次数、某个接口被调用的频率等。awk命令是一个强大的文本处理工具，非常适合用于日志事件频率的统计。

awk命令的基本语法为：awk '脚本' 文件名

awk脚本的基本结构为：模式 {动作}php，其中模式用于指定要处理的行，动作用于指定对匹配行执行的操作。

实例1：统计不同错误类型的出现次数

假设app.log中记录了各种错误类型，如“NullPointerException”、“IndexOutOfBoundsException”等，我们要统计每种错误类型出现的次数，可执行以下命令：

awk '/Exception/ {count[$0]++} END {for (error in count) print error, count[error]}' app.log

脚本解释：python

/Exception/：模式，表示只处理包含“Exception”的行。
{count[$0]++}：动作，定义一个关联数组count，以整行内容（$0表示整行）为键，每遇到一行包含“Exception”的行，就将对应键的值加1。
END {for (error in count) print error, count[error]}：END模式表示在处理完所有文件内容后执行后面的动作，这里通过循环遍历关联数组count，打印出每种错误类型及其出现的次数。

实例2：统计某个接口被调用的次数

如果日志中记录了接口调用信息，格式为“[时间] 接口名: /api/user/get”，我们要统计/api/user/get接口被调用的次数，命令如下：

awk '/\/api\/user\/get/ {count++} END {print "调用次数:", count}' app.log

脚本解释：

/\/api\/user\/get/：模式，由于“/”在正则表达式中有特殊意义，所以需要用“\”转义，该模式表示只处理包含“/api/user/get”的行。
{count++}：动作，定义一个变量count，每遇到一行匹配的行，就将count的值加1。
END {print "调用次数:", count}：处理完所有内容后，打印出/api/user/get接口的调用次数。

实例3：按小时统计日志中错误的发生次数

若日志中的时间格式为“2025-07-14 10:30:22”，我们要按小时统计错误（包含“ERROR”）的发生次数，命令如下：

awk '/ERROR/ {hour = substr($1, 1, 13)" "substr($2, 1, 2); count[hour]++} END {for (h in count) print h, count[h]}' app.log | sort

脚本解释：

/ERROR/：模式，只处理包含“ERROR”的行。
{hour = swww.devze.comubstr($1, 1, 13)" "substr($2, 1, 2); count[hour]++}：动作，substr函数用于截取字符串，substr($1, 1, 13)截取日期部分的前13个字符（即“2025-07-14”），substr($2, 1, 2)截取时间部分的前2个字符（即小时），将它们拼接成“2025-07-14 10”这样的小时格式，作为关联数组count的键，每遇到一行匹配的行，就将对应键的值加1。
END {for (h in count) print h, count[h]}' app.log | sort：处理完所有内容后，打印出每个小时及其对应的错误发生次数，并通过sort命令进行排序，使结果按时间顺序显示。

通过awk命令的统计功能，我们可以从日志中提取出有价值的统计信息，为应用的性能优化、故障排查和业务分析提供有力的数据支持。

五、追踪日志上下文

在分析日志中的错误或异常时，仅仅查看错误所在的行往往不够，我们还需要了解该错误发生前后的日志信息，即日志的上下文。grep命令的-C、-A、-B参数可以帮助我们实现这一需求。

-C n：显示匹配行及其前后各n行的内容。
-A n：显示匹配行及其后n行的内容。
-B n：显示匹配行及其前n行的内容。

实例1：查看包含“Exception”的行及其前后5行

要查看app.log中包含“Exception”的行及其前后5行的内容，执行以下命令：

grep -C 5 "Exception" app.log

执行该命令后，终端会显示所有包含“Exception”的行，以及每个匹配行前面5行和后面5行的日志内容，帮助我们全面了解错误发生的上下文环境。

实例2：查看包含“ERROR”的行及其后10行

如果我们想了解某个错误发生后的后续日志情况，查看包含“ERROR”的行及其后10行的内容，命令如下：

grep -A 10 "ERROR" app.log

此命令会显示包含“ERROR”的行，以及每个匹配行后面10行的日志内容，便于我们追踪错误发生后的应用行为。

实例3：查看包含“Warning”的行及其前8行

若要了解某个警告发生前的日志信息，查看包含“Warning”的行及其前8行的内容，命令如下：

grep -B 8 "Warning" app.log

该命令会显示包含“Warning”的行，以及每个匹配行前面8行的日志内容，帮助我们分析警告发生的原因。

通过追踪日志上下文，我们能够更全面地了解错误或异常发生的背景和过程，从而更快速、准确地定位问题的根源。

六、恢复误删日志

在操作过程中，误删日志文件是一件很棘手的事情，但如果删除后应用进程还在继续运行（即文件描述符未被释放），我们可以借助lsof命令来恢复误删的日志文件。

lsof命令用于列出当前系统中打开的文件，其基本语法为：lsof [选项]

常用选项：

-p：指定进程ID，只显示该进程打开的文件。
-c：指定进程名，只显示该进程打开的文件。

实例：恢复误删的app.log日志文件

首先，确定正在写入app.log日志文件的Java进程ID。可以使用jps命令查看Java进程，或者使用ps -ef | grep java命令，假设进程ID为12345。
执行lsof -p 12345命令，查看该进程打开的文件，在输出结果中找到被删除的app.log文件，其状态会显示为“deleted”，同时会有一个文件描述符（如fd 3）。
执行以下命令恢复文件：

cp /proc/12345/fd/3 app.log

其中，/proc/12345/fd/3是被删除文件的文件描述符路径，通过将其复制到原文件名app.log，即可恢复误删的日志文件。

需要注意的是，这种恢复方法仅适用于文件被删除后，进程仍然在运行且未释放文件描述符的情况。如果进程已经停止或文件描述符已被释放，那么通过lsof命令可能无法恢复误删的日志文件。因此，在日常操作中，我们要谨慎删除日志文件，最好先进行备份。

七、日志脱敏处理

日志中可能包含大量的敏感信息，如用户手机号、身份证号、银行卡号等。为了保护用户隐私和数据安全，我们需要对这些敏感信息进行脱敏处理。sed命令是一个强大的文本替换工具，可以用于日志的脱敏处理。

sed命令的基本语法为：sed [选项] '脚本' 文件名

常用选项：

-i：直接修改文件内容，而不是输出到终端。
-e：指定要执行的脚本。

实例1：对手机号进行脱敏

如果日志中包含手机号（格式为11位数字），我们将其替换为“***”，命令如下：

sed -i 's/1[3-9][0-9]\{9\}/*** /g' app.log

脚本解释：

s/原内容/替换内容/g：sed的替换命令，s表示替换，g表示全局替换，即一行中所有匹配的内容都会被替换。
1[3-9][0-9]\{9\}：正则表达式，匹配11位手机号，其中“1”表示手机号开头为1，“[3-9]”表示第二位为3-9中的任意一个数字，“[0-9]{9}”表示后面跟9位数字。
***：替换后的内容。

执行该命令后，app.log中所有的手机号都会被替换为“***”。

实例2：对身份证号进行脱敏

身份证号为18位数字或17位数字加一个大写字母X，我们将其替换为“******************”，命令如下：

sed -i 's/[1-9][0-9]\{16\}[0-9X]/******************/g' app.log

脚本解释：

[1-9][0-9]\{16\}[0-9X]：正则表达式，匹配18位身份证号，“[1-9]”表示第一位为1-9中的任意一个数字，“[0-9]{16}”表示中间16位为数字，“[0-9X]”表示最后一位为数字或X。
******************：替换后的内容，共18个星号，与身份证号长度一致。

实例3：对银行卡号进行脱敏（保留前4位和后4位）

银行卡号通常为16-19位数字，我们将中间的数字替换为“****”，命令如下：

sed -i 's/\([0-9]\{4\}\)[0-9]\{8,11\}\([0-9]\{4\}\)/\1****\2/g' app.log

脚本解释：

$[0-9]\{4\}$：捕获组1，匹配前4位数字。
[0-9]\{8,11\}：匹配中间的8-11位数字（因为16-4-4=8，19-4-4=11）。
$[0-9]\{4\}$：捕获组2，匹配后4位数字。
\1****\2：替换后的内容，\1表示引用捕获组1的内容，\2表示引用捕获组2的内容，中间用“****”替换。

通过sed命令的脱敏处理，我们可以有效地保护日志中的敏感信息，防止信息泄露，符合数据安全和隐私保护的相关规www.devze.com定。

总结

线上Java日志管理虽然面临着诸编程多难题，但借助split、tail、grep、awk、lsof、sed等Linux命令，我们可以轻松应对。这些命令功能强大、使用灵活，能够帮助我们解决日志文件过大、实时监控、按条件过滤、统计事件频率、追踪上下文、恢复误删日志和脱敏处理等问题。

以上就是7个Linux 命令轻松搞定线上Java日志管理难题的详细内容，更多关于Linux日志管理的资料请关注编程客栈(www.devze.com)其它相关文章！

继续阅读：Linux日志管理 Linux日志管理命令 Linux管理java日志

目录

引言

一、解决日志文件过大问题

实例1：按大小分割日志文件

实例2：按行数分割日志文件

二、实时监控日志输出

实例1：实时监控日志文件

实例2：实时监控并只显示错误信息

实例3：先显示近期日志再实时监控

三、按条件过滤日志

实例1：过滤包含特定用户ID的日志

实例2：过滤不包含“INFO”的日志行

实例3：过滤符合正则表达式的日志

实例4：在多个日志文件中过滤

四、统计日志事件频率

实例1：统计不同错误类型的出现次数

实例2：统计某个接口被调用的次数

实例3：按小时统计日志中错误的发生次数

五、追踪日志上下文

实例1：查看包含“Exception”的行及其前后5行

实例2：查看包含“ERROR”的行及其后10行

实例3：查看包含“Warning”的行及其前8行

六、恢复误删日志

七、日志脱敏处理

实例1：对手机号进行脱敏

实例2：对身份证号进行脱敏

实例3：对银行卡号进行脱敏（保留前4位和后4位）

总结

更多精彩内容

精彩评论

最新运维

linux系统的文件句柄数详解

Ubuntu18.04VirtualBox安装中文输入法实现方式

Linux查看系统的上次重启时间的几种方法小结

Linux中服务器磁盘空间管理与大文件清理的实践指南

Linux如何查询正在运行的进程对应的可执行文件所在目录

运维排行榜

6款自己搭建开源VPN的工具

UiPath Orchestrator 平台搭建全过程（Windows环境）

常见以太网端口协商不成功或不匹配问题总结

df空间占用已满，但du查看home目录空间占用却很少

Windows Server 2016 Standard Key激活密钥序列号