kafka简单介绍

kafka是一个分布式的,支持数据分区,多副本,基于zookeeper协调的分布式消息系统。
上个文章介绍了rabbitmq,他和kafaka的最大区别就是kafak是分布式的,并发处理能力强大。
在这里插入图片描述

broker:消息中间处理节点,一个kafka节点就是一个broker,可以组成集群
produce:生产者,向broker发送消息的客户端
consumer:消费者,从broker读取消息
consumer group:消费组,每个consumer对应一个组,一条消息可以被多个消费组消费,但是每个消费组里面只能有一个消费者消费该消息(分区的话,每个分区只能被每个消费组里面的一个消费者消费)
topic:kafka根据消息进行分类,发布到kafka的每条消息都系要制定一个topic,可以理解为队列
partition:一个topic可以分为多个partition。分区的概念

一、kafak内部机制
1.消费者消息的offset记录机制:消费的消息不会立马删除默认保留一周(其他的产品会立刻清除)。每个consumer会定期将自己的消费分区的offset提交给kafka内部的topic记录自己消费的位置。
2.消费者rebalance机制:如果消费组里的消费者数量有变化或分区变化,kafak会重新分配消费者和分区的关系
线上问题及优化:
消息丢失:
在这里插入图片描述

在这里插入图片描述
2.消息重复发送
消费发送端:生产者幂等性,开启enable,idempoteence ,true.。每次发送消息会生成PID和sequence number,broker会检查是否存在,存在就不再接受
在这里插入图片描述
在这里插入图片描述文章来源地址https://uudwc.com/A/Vern

原文地址:https://blog.csdn.net/liuhanyu9481/article/details/125715476

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请联系站长进行投诉反馈,一经查实,立即删除!

h
上一篇 2023年06月15日 16:52
下一篇 2023年06月15日 16:52