`

Flume OG 与 Flume NG 的对比

 
阅读更多

引自:http://blog.csdn.net/rzhzhz/article/details/8778266

 

很久没接触flume 了,刚掀开官网一看,发现flume已然不是以前的那个flume了,其实早在flume技术群就听到NG这个字眼,以前没特注意,今天做了些对比,发现 flume确实有了投胎换骨般的改变。首先介绍下Flume OG & Flume NG这两个概念

Flume OG:Flume original generation 即Flume 0.9.x版本

Flume NG:Flume next generation ,即Flume 1.x版本

 

对于Flume OG ,可以说他是一个分布式日志收集系统,有Mater概念,依赖于zookeeper,以下是其架构图

Agent用于采集数据,agent是flume中产生数据流的地方,同时,agent会将产生的数据流传输到collector。对应的,collector用于对数据进行聚合,往往会产生一个更大的流。

而对于Flume NG, 它摒弃了Master和zookeeper,collector也没有了,web配置台也没有了,只剩下source,sink和channel,此时一 个Agent的概念包括source,channel和sink,完全由一个分布式系统变成了传输工具。不同机器之间的数据传输不再是OG那样由 agent->collector,而是由一个Agent端的sink流向另一个agent的source。其新的架构如下




 



 
以下是官网资料

Flume NG is a huge departure from Flume OG (original generation, or "original gangsta," if you prefer) in its implementation although many of the original concepts are the same. If you're already familiar with Flume, here's what you need to know.

  • You still have sources and sinks and they still do the same thing. They are now connected by channels.
  • Channels are pluggable and dictate durability. Flume NG ships with an in-memory channel for fast, but non-durable event delivery and a JDBC-based channel for durable event delivery. We have recently added a file-based durable channel too.
  • There's no more logical or physical nodes. We call all physical nodes agents and agents can run zero or more sources and sinks.
  • There's no master and no ZooKeeper dependency anymore. At this time, Flume runs with a simple file-based configuration system.
  • Just about everything is a plugin, some end user facing, some for tool and system developers. (Specifically, sources, sinks, channels, configuration providers, lifecycle management policies, input and output formats, compression, source and sink channel adapters, and the kitchen sink.)
  • Tons of things are not yet implemented. Please file JIRAs and / or vote for features you deem important.
分享到:
评论

相关推荐

    Flume-ng资料合集

    由原来的Flume OG到现在的Flume NG,进行了架构重构,并且现在NG版本完全不兼容原来的OG版本。经过架构重构后,Flume NG更像是一个轻量的小工具,非常简单,容易适应各种方式日志收集,并支持failover和负载均衡。

    flume-ng-1.6.0-cdh5.13.2

    CDH版本的flume Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据...由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。

    Flume构建高可用、可扩展的海量日志采集系统

    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集...由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。

    flume自学文档.pdf

    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集...由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。

    Apache_Flume安装与配置

    Flume-0.9.4中文安装手册,目前看来Flume-0.9.4比Flume-NG靠谱啊

    Flume部署和使用

    Flume OG主要是0.9及以前的版本,Flume NG主要是1.X的版本。类似的框架还有Logstash。对应广义的Hadoop而言,Flume是比较常用的。Logstash更轻量级,主要配合ELK使用 我们使用Flume,真要需要开发的代码不多,从使用...

    集群flume实战

    Flume集群测试 假设:现有两台机子,命名为:agent,collect。 agent IP地址为:192.168.26.65 collect为192.168.26.61 要求:实现agent到collect...两台电脑上分别装上 jdk,flume-ng(不是flume-og),配置好profile。

    sourcesink

    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集...由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。

    lanjieqisource

    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集...由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。

    大数据中台架构栈.doc

    目前有两个版本,OG和NG,特点主要是: 1. 侧重数据传输,有内部机制确保不会丢数据,用于重要日志场景 2. 由java开发,没有丰富的插件,主要靠二次开发 3. 配置繁琐,对外暴露监控端口有数据 Logstash 是 Elastic....

Global site tag (gtag.js) - Google Analytics