kafka offsetmonitor:监控消费者和延迟的队列 -pg电子游戏网站

一个小应用程序来监视kafka消费者的进度和它们的延迟的队列。 kafkaoffsetmonitor是用来实时监控kafka集群中的consumer以及在队列中的位置(偏移量)。 你可以查看当前的消费者组,每个topic队列的所有partition的消费情况。可以很快地知道每个partition中的消息是否 很快被消费以及相应的队列消息增长速度等信息。这些可以debug kafka的producer和consumer,你完全知道你的系统将 会发生什么。 这个web管理平台保留的partition offset和consumer滞后的历史数据(具体数据保存多少天我们可以在启动的时候配 置),所以你可以很轻易了解这几天consumer消费情况。 kafkaoffsetmonitor这款软件是用scala代码编写的,消息等历史数据是保存在名为offsetapp.db数据库文件中,该数据 库是sqllite文件,非常的轻量级。虽然我们可以在启动kafkaoffsetmonitor程序的时候指定数据更新的频率和数据保存 的时间,但是不建议更新很频繁,或者保存大量的数据,因为在kafkaoffsetmonitor图形展示的时候会出现图像展示过 慢,或者是直接导致内存溢出了。 所有的关于消息的偏移量、kafka集群的数量等信息都是从zookeeper中获取到的,日志大小是通过计算得到的。 消费者组列表

screenshot 消费组的topic列表

screenshot 图中参数含义解释如下: topic:创建时topic名称 partition:分区编号 offset:表示该parition已经消费了多少条message logsize:表示该partition已经写了多少条message lag:表示有多少条message没有被消费。 owner:表示消费者 created:该partition创建时间 last seen:消费状态刷新最新时间。 topic的历史位置

screenshot offset存储位置 kafka能灵活地管理offset,可以选择任意存储和格式来保存offset。kafkaoffsetmonitor目前支持以下流行的存储格 式。 kafka0.8版本以前,offset默认存储在zookeeper中(基于zookeeper) kafka0.9版本以后,offset默认存储在内部的topic中(基于kafka内部的topic) storm kafka spout(默认情况下基于zookeeper) kafkaoffsetmonitor每个运行的实例只能支持单一类型的存储格式。 下载 可以到github下载kafkaoffsetmonitor源码。 编译kafkaoffsetmonitor命令: sbt/sbt assembly 不过不建议你自己去下载,因为编译的jar包里引入的都是外部的css和js,所以打开必须联网,都是国外的地址,你编 译的时候还要修改js路径,我已经搞定了,你直接下载就好了。

 

启动 编译完之后,将会在kafkaoffsetmonitor根目录下生成一个类似kafkaoffsetmonitor-assembly-0.3.0- snapshot.jar的jar文件。这个文件包含了所有的依赖,我们可以直接启动它: java -cp kafkaoffsetmonitor-assembly-0.3.0-snapshot.jar \ com.quantifind.kafka.offsetapp.offsetgetterweb \ --offsetstorage kafka \ --zk zk-server1,zk-server2 \ --port 8080 \ --refresh 10.seconds \ --retain 2.days 启动方式2,创建脚本,因为您可能不是一个kafka集群。用脚本可以启动多个。 vim mobile_start_en.sh nohup java -xms512m -xmx512m -xss1024k -xx:permsize=256m - xx:maxpermsize=512m -cp kafkaoffsetmonitor-assembly-0.3.0-snapshot.jar com.quantifind.kafka.offsetapp.offsetgetterweb --offsetstorage kafka --zk 127.0.0.1:2181 --port 8080 --refresh 10.seconds --retain 2.days 1>mobile-logs/stdout.log 2>mobile-logs/stderr.log & 各个参数的含义: offsetstorage:有效的选项是"zookeeper","kafka","storm"。0.9版本以后,offset存储的位置在kafka。 zk: zookeeper的地址 prot 端口号 refresh 刷新频率,更新到db。 retain 保留db的时间 dbname 在哪里存储记录(默认'offsetapp')

 

0
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • kafka 0号分区一共有24条记录,已经消费了24条,下一条待消费记录的offset是24!!! 命令行查看一下: [bdp_client@bjlfrz-client-50-162 software]$ /home/bdp_client/zmy/software/kafka/bin/kafka-consumer-...

  • kafka是由apache software foundation开发的一款分布式流处理平台和消息队列系统 可以处理大规模的实时数据流,具有高吞吐量、低延迟、持久性和可扩展性等优点 常用于数据架构、数据管道、日志聚合、事件驱动等场景...

  • kafka架构中包含四大组件:生产者、消费者、kafka集群、zookeeper集群。对照上面的结构图,我们先来搞清楚几个很重要的术语志、访问日志、消息服务等等,linkedin于2010年贡献给了apache基金会并成为顶级开源项目。

  • 衡量一款消息中间件是否符合需求需要从多个维度进行考察,首要的就是功能维度,...1. 功能维度优先级队列优先级队列不同于先进先出队列,优先级高的消息具备优先被消费的特权,这样可以为下游提供不同消息级别的保证。

  • 它可以模拟数据生产并消费,基本上覆盖了黑盒监控大部分指标,包括集群核心功能、数据读写、读写延迟等。使用者使用成本也相对简单,只需对接告警系统即可。 如果你的产品用到了kafka,强烈推荐使用...

  • 较常见的有kafka monitor和kafka manager。 其中kafka monitor使用简单,但功能很弱。 使用较多的是kafka manager。 1.1 kafka monitor kafka monitor的使用步骤如下所示: ①上传jar包kafkaoffsetmonitor...

  • 生产者写入消息到topic,kafka将依据不同的策略将数据分配到不同的分区中。默认的分配策略,也是使用最多的策略,可以最大限度保证所有消息平均分配到一个分区;如果在生产消息时,key为null,则使用轮序算法均衡地...

  • 1.为什么要使用 kafka?为什么要使用消息队列? 缓冲和削峰:上游数据时有突发流量,下游可能扛...冗余:可以采用一对多的方式,一个生产者发布消息,可以被多个订阅topic的服务消费到,供多个毫无关联的业务使用。 健

  • 消息队列中间件(简称消息中间件)是指利用高效可靠的消息传递机制进行与平台无关的数据交流,并基于数据通信来进行分布式系统的集成。通过提供消息传递和消息排队模型,它可以在分布式环境下提供应用解耦、弹性伸缩...

  • 生产者写入消息到topic,kafka将依据不同的策略将数据分配到不同的分区中 轮询分区策略 随机分区策略 按key分区分配策略 自定义分区策略 1.1.1 轮询分区策略 1.1.2 随机策略(不用) 随机策略,每次都...

  • 胡夕,《apache kafka实战》作者,北航计算机硕士毕业...国内活跃的kafka代码贡献者。 前言 虽然目前apache kafka已经全面进化成一个流处理平台,但大多数的用户依然使用的是其核心功能:消息队列。对于如何有效地监...

  • 胡夕,《apache kafka实战》作者,北航计算机硕士毕业,现任某互金公司计算平台总监,曾...对于如何有效地监控和调优kafka是一个大话题,很多用户都有这样的困扰,今天我们就来讨论一下。 一、kafka综述 在讨论具...

  • kafka是分布订阅式生产者消费者模型 架构: 角色解释: 1、broker:一台kafka服务器就是一个broker,里面有多个topic 2、producer:向broker发送消息的结点,生产者 3、consumer:从broker读取消息的结点,...

  • 1、kafka 的核心api 和相关概念 1.1 kafka 的核心 api 1.2 kafka 的相关概念 2、kafka 的架构 3、kafka 的使用场景 3.1 消息中间件 3.2 跟踪网站活动 3.3 日志聚合 3.4 流处理 3.5 事件采集 3.6 提交日志 ...

  • kafka uses yammer metrics for metrics reporting in both the server and the client. this can be configured to report stats using pluggable stats reporters to hook up to your monitoring syst...

  • python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。python社区提供了大量的第三方库,如numpy、pandas和requests,极大地丰富了python的应用领域,从数据科学到web开发。python库的丰富性是python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,matplotlib和seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。

  • stm32单片机fpga毕设电路原理论文报告基于ide硬盘的数字图像存储技术研究本资源系百度网盘分享地址

  • 适合rust入门。深入浅出,事无巨细,远胜市面上所有入门书。而且是免费的

  • vb语言vb房屋租凭管理系统毕业设计(源代码 系统)本资源系百度网盘分享地址

global site tag (gtag.js) - google analytics
网站地图