日志
每个 SeaTunnel Engine 进程都会创建一个日志文件,其中包含该进程中发生的各种事件的消息。这些日志提供了对 SeaTunnel Engine 内部工作原理的深入了解,可用于检测问题(以 WARN/ERROR 消息的形式)并有助于调试问题。
SeaTunnel Engine 中的日志记录使用 SLF4J 日志记录接口。这允许您使用任何支持 SLF4J 的日志记录框架,而无需修改 SeaTunnel Engine 源代码。
默认情况下,Log4j2 用作底层日志记录框架。
结构化信息
SeaTunnel Engine 向大多数相关日志消息的 MDC 添加了以下字段(实验性功能):
- Job ID
- key: ST-JID
- format: string
这在具有结构化日志记录的环境中最为有用,允许您快速过滤相关日志。
MDC 由 slf4j 传播到日志后端,后者通常会自动将其添加到日志记录中(例如,在 log4j json 布局中)。或者,也可以明确配置 - log4j 模式布局可能如下所示:
[%X{ST-JID}] %c{0} %m%n.
配置 Log4j2
Log4j2 使用属性文件进行控制。
SeaTunnel Engine 发行版在 config
目录中附带以下 log4j 属性文件,如果启用了 Log4j2,则会自动使用这些文件:
log4j2_client.properties
: 由命令行客户端使用 (例如,seatunnel.sh
)log4j2.properties
: 由 SeaTunnel 引擎服务使用 (例如,seatunnel-cluster.sh
)
默认情况下,日志文件输出到 logs
目录。
Log4j 会定期扫描上述文件以查找更改,并根据需要调整日志记录行为。默认情况下,此检查每 60 秒进行一次,由 Log4j 属性文件中的 monitorInterval 设置控制。
配置作业生成单独的日志文件
要为每个作业输出单独的日志文件,您可以更新 log4j2.properties
文件中的以下配置:
...
rootLogger.appenderRef.file.ref = routingAppender
...
appender.file.layout.pattern = %d{yyyy-MM-dd HH:mm:ss,SSS} %-5p [%-30.30c{1.}] [%t] - %m%n
...
此配置为每个作业生成单独的日志文件,例如:
job-xxx1.log
job-xxx2.log
job-xxx3.log
...
配置混合日志文件
默认已采用此配置模式。
要将所有作业日志输出到 SeaTunnel Engine 系统日志文件中,您可以在 log4j2.properties
文件中更新以下配置:
...
rootLogger.appenderRef.file.ref = fileAppender
...
appender.file.layout.pattern = [%X{ST-JID}] %d{yyyy-MM-dd HH:mm:ss,SSS} %-5p [%-30.30c{1.}] [%t] - %m%n
...
兼容 Log4j1/Logback
SeaTunnel Engine 自动集成了大多数 Log 桥接器,允许针对 Log4j1/Logback 类工作的现有应用程序继续工作。
REST-API方式查询日志
SeaTunnel 提供了一个 API,用于查询日志。
使用样例:
- 获取所有节点jobId为
733584788375666689
的日志信息:http://localhost:8080/logs/733584788375666689
- 获取所有节点日志列表:
http://localhost:8080/logs
- 获取所有节点日志列表以JSON格式返回:
http://localhost:8080/logs?format=json
- 获取日志文件内容:
http://localhost:8080/logs/job-898380162133917698.log
有关详细信息,请参阅 REST-API。
SeaTunnel 日志配置
定时删除旧日志
SeaTunnel 支持定时删除旧日志文件,以避免磁盘空间不足。您可以在 seatunnel.yml
文件中添加以下配置:
seatunnel:
engine:
history-job-expire-minutes: 1440
telemetry:
logs:
scheduled-deletion-enable: true
history-job-expire-minutes
: 设置历史作业和日志的保留时间(单位:分钟)。系统将在指定的时间后自动清除过期的作业信息和日志文件。scheduled-deletion-enable
: 启用定时清理功能,默认为true
。系统将在作业达到history-job-expire-minutes
设置的过期时间后自动删除相关日志文件。关闭该功能后,日志将永久保留在磁盘上,需要用户自行管理,否则可能影响磁盘占用。建议根据需求合理配置。
开发人员最佳实践
您可以通过调用 org.slf4j.LoggerFactory#LoggerFactory.getLogger
并以您的类的类作为参数来创建 SLF4J 记录器。
当然您也可以使用 lombok 注解 @Slf4j
来实现同样的效果
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
public class TestConnector {
private static final Logger LOG = LoggerFactory.getLogger(TestConnector.class);
public static void main(String[] args) {
LOG.info("Hello world!");
}
}
为了最大限度地利用 SLF4J,建议使用其占位符机制。使用占位符可以避免不必要的字符串构造,以防日志级别设置得太高而导致消息无法记录。
占位符的语法如下:
LOG.info("This message contains {} placeholders. {}", 1, "key1");
占位符还可以与需要记录的异常结合使用
try {
// some code
} catch (Exception e) {
LOG.error("An {} occurred", "error", e);
}