Testing the performance of log streaming to HDFS with syslog-ng

But what if syslog-ng writes to multiple files on the same HDFS data node?

HDFS
 
@version: 6.0
 @module "mod-java"
 options {
 keep_hostname(yes);
 keep_timestamp(no);
 stats_level(2);
 use_dns(no);
 };
 source s_network_15c0fe6c0365441f9882b20d237f9114 {
 network(ip(0.0.0.0)
 log_fetch_limit(1000)
 log_iw_size(100000)
 max_connections(100)
 port(514));
 };
 destination d_java_eb43d63566364dfb9256007d0587efab {
 java(class_name(org.syslog_ng.hdfs.HdfsDestination)
 class_path('/opt/syslog-ng/lib/syslog-ng/java-modules/*.jar:/var/testdb_working_dir/dab1bb99-bfc1-4394-ac6a-507562967c9c/build/distributions/hdfs-libs/lib/*.jar')
 log_fifo_size(200000)
 option("hdfs_uri", "hdfs://hdp2.syslog-ng.balabit:8020")
 option("hdfs_file", "/var/testdb_working_dir/e0f5aa2a-19bc-4c45-b08f-631173b96031.txt")
 );
 };
 log {
 source(s_network_15c0fe6c0365441f9882b20d237f9114);
 destination(d_java_eb43d63566364dfb9256007d0587efab);
 
flags(flow-control);
 };

Testing the performance of log streaming to HDFS with syslog-ng

Our test environment

Hadoop performance

But what if syslog-ng writes to multiple files on the same HDFS data node?

What if HDFS is configured to use several data nodes?

syslog-ng PE test configuration