当前位置: 首页 > news >正文

西宁做网站seo爱互融网站开发合同

西宁做网站seo,爱互融网站开发合同,做阿里巴巴网站的电话号码,网站建设与案例管理的心得体会1.Flume简介 Apache Flume 是一个分布式#xff0c;高可用的数据收集系统。它可以从不同的数据源收集数据#xff0c;经过聚合后发送到存储系统中#xff0c;通常用于日志数据的收集。Flume 分为 NG 和 OG (1.0 之前) 两个版本#xff0c;NG 在 OG 的基础上进行了完全的重构… 1.Flume简介 Apache Flume 是一个分布式高可用的数据收集系统。它可以从不同的数据源收集数据经过聚合后发送到存储系统中通常用于日志数据的收集。Flume 分为 NG 和 OG (1.0 之前) 两个版本NG 在 OG 的基础上进行了完全的重构是目前使用最为广泛的版本。下面的介绍均以 NG 为基础。 2. Flume架构和基本概念 下图为 Flume 的基本架构图 2.1 基本架构 外部数据源以特定格式向 Flume 发送 events (事件)当 source 接收到 events 时它将其存储到一个或多个 channelchanne 会一直保存 events 直到它被 sink 所消费。sink 的主要功能从 channel 中读取 events并将其存入外部存储系统或转发到下一个 source成功后再从 channel 中移除 events。 2.2 基本概念 1. Event Event 是 Flume NG 数据传输的基本单元。类似于 JMS 和消息系统中的消息。一个 Event 由标题和正文组成前者是键/值映射后者是任意字节数组。 2. Source  数据收集组件从外部数据源收集数据并存储到 Channel 中。 3. Channel Channel 是源和接收器之间的管道用于临时存储数据。可以是内存或持久化的文件系统  Memory Channel : 使用内存优点是速度快但数据可能会丢失 (如突然宕机)  File Channel : 使用持久化的文件系统优点是能保证数据不丢失但是速度慢。 4. Sink Sink 的主要功能从 Channel 中读取 Event并将其存入外部存储系统或将其转发到下一个 Source成功后再从 Channel 中移除 Event。 5. Agent 是一个独立的 (JVM) 进程包含 Source、 Channel、 Sink 等组件。 2.3 组件种类 Flume 中的每一个组件都提供了丰富的类型适用于不同场景 - Source 类型 内置了几十种类型如 Avro SourceThrift SourceKafka SourceJMS Source - Sink 类型 HDFS SinkHive SinkHBaseSinksAvro Sink 等 - Channel 类型 Memory ChannelJDBC ChannelKafka ChannelFile Channel 等。 对于 Flume 的使用除非有特别的需求否则通过组合内置的各种类型的 SourceSink 和 Channel 就能满足大多数的需求。 3. Flume架构模式 Flume 支持多种架构模式分别介绍如下 3.1 multi-agent flow Flume 支持跨越多个 Agent 的数据传递这要求前一个 Agent 的 Sink 和下一个 Agent 的 Source 都必须是 Avro 类型Sink 指向 Source 所在主机名 (或 IP 地址) 和端口详细配置见下文案例三。 3.2 Consolidation 日志收集中常常存在大量的客户端比如分布式 web 服务Flume 支持使用多个 Agent 分别收集日志然后通过一个或者多个 Agent 聚合后再存储到文件系统中。 3.3 Multiplexing the flow Flume 支持从一个 Source 向多个 Channel也就是向多个 Sink 传递事件这个操作称之为 Fan Out(扇出)。默认情况下 Fan Out 是向所有的 Channel 复制 Event即所有 Channel 收到的数据都是相同的。同时 Flume 也支持在 Source 上自定义一个复用选择器 (multiplexing selector) 来实现自定义的路由规则。 4.Flume配置格式 Flume 配置通常需要以下两个步骤 1. 分别定义好 Agent 的 SourcesSinksChannels然后将 Sources 和 Sinks 与通道进行绑定。需要注意的是一个 Source 可以配置多个 Channel但一个 Sink 只能配置一个 Channel。基本格式如下 Agent.sources Source Agent.sinks Sink Agent.channels Channel1 Channel2# set channel for source Agent.sources.Source.channels Channel1 Channel2 ...# set channel for sink Agent.sinks.Sink.channel Channel12. 分别定义 SourceSinkChannel 的具体属性。基本格式如下 Agent.sources.Source.someProperty someValue# properties for channels Agent.channel.Channel.someProperty someValue# properties for sinks Agent.sources.Sink.someProperty someValue 5. Flume使用案例 介绍几个 Flume 的使用案例  案例一使用 Flume 监听文件内容变动将新增加的内容输出到控制台。  案例二使用 Flume 监听指定目录将目录下新增加的文件存储到 HDFS。  案例三使用 Avro 将本服务器收集到的日志数据发送到另外一台服务器。 5.1 案例一 需求 监听文件内容变动将新增加的内容输出到控制台。 实现 主要使用 Exec Source 配合 tail 命令实现。 1. 配置 新建配置文件 exec-memory-logger.properties,其内容如下 #指定agent的sources,sinks,channels a1.sources s1 a1.sinks k1 a1.channels c1 #配置sources属性 a1.sources.s1.type exec a1.sources.s1.command tail -F /tmp/log.txt a1.sources.s1.shell /bin/bash -c#将sources与channels进行绑定 a1.sources.s1.channels c1#配置sink a1.sinks.k1.type logger#将sinks与channels进行绑定   a1.sinks.k1.channel c1 #配置channel类型 a1.channels.c1.type memory 2. 启动 flume-ng agent \ --conf conf \ --conf-file /usr/app/apache-flume-1.6.0-cdh5.15.2-bin/examples/exec-memory-logger.properties \ --name a1 \ -Dflume.root.loggerINFO,console3. 测试 向文件中追加数据 控制台的显示 5.2 案例二 需求 监听指定目录将目录下新增加的文件存储到 HDFS。 实现使用 Spooling Directory Source 和 HDFS Sink。 1. 配置 #指定agent的sources,sinks,channels a1.sources s1 a1.sinks k1 a1.channels c1 #配置sources属性 a1.sources.s1.type spooldir a1.sources.s1.spoolDir /tmp/logs a1.sources.s1.basenameHeader true a1.sources.s1.basenameHeaderKey fileName #将sources与channels进行绑定   a1.sources.s1.channels c1 #配置sink a1.sinks.k1.type hdfs a1.sinks.k1.hdfs.path /flume/events/%y-%m-%d/%H/ a1.sinks.k1.hdfs.filePrefix %{fileName} #生成的文件类型默认是Sequencefile可用DataStream则为普通文本 a1.sinks.k1.hdfs.fileType DataStream a1.sinks.k1.hdfs.useLocalTimeStamp true #将sinks与channels进行绑定   a1.sinks.k1.channel c1#配置channel类型 a1.channels.c1.type memory2. 启动 flume-ng agent \ --conf conf \ --conf-file /usr/app/apache-flume-1.6.0-cdh5.15.2-bin/examples/spooling-memory-hdfs.properties \ --name a1 -Dflume.root.loggerINFO,console 3. 测试 拷贝任意文件到监听目录下可以从日志看到文件上传到 HDFS 的路径 # cp log.txt logs/ 查看上传到 HDFS 上的文件内容与本地是否一致 # hdfs dfs -cat /flume/events/19-04-09/13/log.txt.1554788567801 5.3 案例三 需求 将本服务器收集到的数据发送到另外一台服务器。 实现使用 avro sources 和 avro Sink 实现。 1. 配置日志收集Flume 新建配置 netcat-memory-avro.properties监听文件内容变化然后将新的文件内容通过 avro sink 发送到 hadoop001 这台服务器的 8888 端口 #指定agent的sources,sinks,channels a1.sources s1 a1.sinks k1 a1.channels c1#配置sources属性 a1.sources.s1.type exec a1.sources.s1.command tail -F /tmp/log.txt a1.sources.s1.shell /bin/bash -c a1.sources.s1.channels c1#配置sink a1.sinks.k1.type avro a1.sinks.k1.hostname hadoop001 a1.sinks.k1.port 8888 a1.sinks.k1.batch-size 1 a1.sinks.k1.channel c1#配置channel类型 a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100 2. 配置日志聚合Flume 使用 avro source 监听 hadoop001 服务器的 8888 端口将获取到内容输出到控制台 #指定agent的sources,sinks,channels a2.sources s2 a2.sinks k2 a2.channels c2#配置sources属性 a2.sources.s2.type avro a2.sources.s2.bind hadoop001 a2.sources.s2.port 8888#将sources与channels进行绑定 a2.sources.s2.channels c2#配置sink a2.sinks.k2.type logger#将sinks与channels进行绑定 a2.sinks.k2.channel c2#配置channel类型 a2.channels.c2.type memory a2.channels.c2.capacity 1000 a2.channels.c2.transactionCapacity 100 3. 启动 启动日志聚集 Flume flume-ng agent \ --conf conf \ --conf-file /usr/app/apache-flume-1.6.0-cdh5.15.2-bin/examples/avro-memory-logger.properties \ --name a2 -Dflume.root.loggerINFO,console 在启动日志收集 Flume: flume-ng agent \ --conf conf \ --conf-file /usr/app/apache-flume-1.6.0-cdh5.15.2-bin/examples/netcat-memory-avro.properties \ --name a1 -Dflume.root.loggerINFO,console这里建议按以上顺序启动原因是 avro.source 会先与端口进行绑定这样 avro sink 连接时才不会报无法连接的异常。但是即使不按顺序启动也是没关系的sink 会一直重试直至建立好连接。 4.测试 向文件 tmp/log.txt 中追加内容 可以看到已经从 8888 端口监听到内容并成功输出到控制台
http://www.yingshimen.cn/news/114747/

相关文章:

  • 提供免费服务器的网站可以写程序的软件
  • 能自己做的ppt网站墓园网站建设价格
  • 济宁网站网站建设本地丹阳网站建设
  • 柳州公司网站制作公司网站后台如何更换在线qq咨询代码
  • 青岛建设集团招聘信息网站桂林
  • 小米路由器做网站服务器吗企业建站设计
  • 在pc端网站基础上做移动端合肥网站建设制作
  • 贵阳网站建设策划方案浙江临海市建设局网站
  • 最专业的房地产网站建设wordpress 上传图片 500
  • 给企业做网站怎么收钱郴州在哪里
  • name域名的网站域名是什么样子
  • 四川seo整站优化吧浙江大学陈越做的刷题网站
  • 网页制作免费网站无锡网站推广公司排名
  • 做一个网站APP价格企业网站建设话术
  • 泉州微信网站开发人才招聘网站开发背景
  • window7用jsp做的网站要什么工具《水利建设与管理》杂志社网站
  • 做文案的人看什么网站wordpress去除作者归档
  • 一个网站开发的意义阿里首个网站开发人员
  • 浏览器网站大全网络营销的认识与理解
  • 做的比较好的小众网站流媒体网站建设规划 所需设备
  • 套模板网站微商城系统源码
  • 南安住房与城乡建设部网站合肥蜀山网站开发
  • 书籍网站开发多少钱怎么创建域名
  • 宿迁哪家做网站好小程序开发公司
  • 网站建设客户常见问题集锦dw网页制作模板成品免费
  • 网站建设那个好吴桥网站建设公司
  • 如今流行的网站建设怎么下载网站源码
  • 怎样上传自己做的网站网页设计实验报告分析与体会
  • 东莞网站制作有名 乐云践新网站网页设计公司
  • 哪个网站做视频收益高小程序制作推广