服务发现
概述
如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服务发现模块专门负责发现需要监控的目标采集点(target)信息,数据采集模块从服务发现模块订阅该信息,获取到target信息后,其中就包含协议(scheme)、主机地址:端口(instance)、请求路径(metrics_path)、请求参数(params)等;然后数据采集模块就可以基于这些信息构建出一个完整的Http Request请求,定时通过pull http协议不断的去目标采集点(target)拉取监控样本数据(sample);最后,将采集到监控样本数据交由TSDB模块进行数据存储。
为什么需要服务发现模块?
类似于微服务通过引入注册中心组件解决众多微服务间错综复杂的依赖调用。无论是服务主动停止,意外挂掉,还是因为流量增加对服务实现进行扩容,这些服务数据或状态上的动态变化,通过注册中心屏蔽服务状态变更造成的影响,简化了调用方处理逻辑。
同理,Prometheus最开始设计是一个面向云原生应用程序的,云原生、容器场景下按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。Prometheus解决方案就是引入一个中间的代理人,这个代理人掌握着当前所有监控目标的访问信息,Prometheus只需要向这个代理人询问有哪些监控目标即可,这种模式被称为服务发现(service discovery)。
(资料图片仅供参考)
目前,Prometheus支持的服务发现协议是非常丰富的,最新版本(2.41)已支持接近三十种服务发现协议:
服务发现配置解析
1、Prometheus服务启动加载prometheus.yml配置文件会被解析Config结构体:
❝
Config结构体是配置类的最顶层结构,内部包含6个字段分别对应prometheus配置的6大组成部分。
❞
2、其中数据采集配置部分ScrapeConfigs对应的是一个*ScrapeConfig类型切片,一个ScrapeConfig对应的是scrape_configs配置下的一个job抓取任务,服务发现协议配置对应其中ServiceDiscoveryConfigs字段:
3、discovery.Configs对应的是Config切片:
type Configs []Config所以,一个job抓取任务下可以配置多个服务发现协议,如:
- job_name: "prometheus" metrics_path: /metrics static_configs: - targets: ["124.222.45.207:9090"] file_sd_configs: - files: - targets/t1.json - targets/t2.json refresh_interval: 5m4、Config是一个接口:
Config是一个接口的定义,每种服务发现协议都会存在一个对应Config接口的实现(见下图)。该接口主要定义两个方法:
1、Name() string:定义服务发现协议类型,如eureka、kubernetes等等;2、NewDiscoverer(DiscovererOptions) (Discoverer, error):返回一个Discoverer类型变量,该类型也是一个接口,其只定义了一个方法Run方法,即Discoverer是对应的服务发现协议具体运行逻辑封装,通过Run方法提供统一的运行入口。服务发现核心原理说明:
Prometheus服务发现核心逻辑的入口主要关注Manager结构体的ApplyConfig方法:基于服务发现的配置使其生效;
ApplyConfig方法包括四个主要步骤:
type provider struct { name string d Discoverer subs []string config interface{}}❝一个job下一个服务发现协议对应一个Discoverer。❞
provider还有额外三个字段:
1、name:provider名称,格式:fmt.Sprintf("%s/%d", typ, len(m.providers));
2、subs:string切片,存放job名称,因为可能不同job下存在一致的服务发现配置,就只会生成一个provider,然后subs存放job列表;
3、config:服务发现配置
Discoverer接口Run方法,让服务发现逻辑运行;协程中运行updater方法;Discoverer接口Run方法主要基于具体服务发现协议发现target,然后通过通道传递给updater处理逻辑,将其解析处理放入到Manager结构体中targets字段中,并向triggerSend通道发送信号,表示当前targets发生变更;Manager结构体sender方法每5秒监听triggerSend通道信号,并将Manager结构体中targets字段处理后放入到syncCh通道中;数据采集模块(scrape)监听syncCh通道,就可以获取到服务发现生成的targets信息,然后reload将target纳入监控开始抓取监控指标。启动provider:遍历Manager结构体中providers切片,启动每个provider,该步骤主要是启动两个协程:❝Manager结构体sender方法是在Prometheus启动时discoveryManagerScrape.Run()方法中启动。❞取消服务发现:配置变更也会调用ApplyConfig方法,这时就要把基于之前配置运行的服务发现服务取消,然后基于当前配置重新生成;清空:主要清空discoverCancel、targets和providers几个容器元素,因为要基于当前配置重新生成;注册provider:provider是对Discoverer的封装,不同服务发现协议都会实现Config接口,其中NewDiscoverer方法就是创建Discoverer「Prometheus服务发现核心就是三个协程之间协作:」
「协程1:」负责运行Discoverer接口Run方法,基于协议发现采集点;「协程2:」负责将协程1发现的采集点信息更新到Manager结构体中targets字段的map中;「协程3:」负责将Manager结构体中targets字段的数据通过通道发送给scrape模块;scrape模块获取到采集点如何进行数据采集后续scrape模块分析。
监控指标
Prometheus服务发现通用指标主要有如下5个,都定义在discovery/manager.go中:
prometheus_sd_discovered_targetsprometheus_sd_failed_configsprometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total「1、采集点数量指标」
服务发现主要基于协议发现采集目标,prometheus_sd_discovered_targets指标反馈各个job发现的采集目标数:
prometheus_sd_discovered_targets:gauge类型,当前发现的目标数config:job名称name:取值scrape和notify,区分指标抓取服务发现还是告警通知服务发现示例:prometheus_sd_discovered_targets{config="auth_es1", name="scrape"} 12❝这里基于协议发现的目标数,还未进入采集模块,并不能区分是在线还是离线。❞
「2、服务发现协议异常错误指标」
服务发现会给每个发现配置项生成一个provider,并为每个provider使用协程运行,如果基于配置项生成provider错误就可以通过prometheus_sd_failed_configs指标反馈:
prometheus_sd_failed_configs:gauge类型,当前无法加载的服务发现配置数配置数:一个job可能存在多个服务发现协议配置,对应配置项则是多个示例:prometheus_sd_failed_configs{name="scrape"} 10prometheus_sd_failed_configs{name="notify"} 5一个job可能对应多个服务发现配置项,如下:这个job下配置了static_configs和file_sd_configs两个服务发现协议配置,则对应两个服务发现配置项,注册两个provider,每个provider在独立协程中运行:
scrape_configs: # The job name is added as a label `job=` to any timeseries scraped from this config. - job_name: "test" static_configs: - targets: ["localhost:9090"] file_sd_configs: - refresh_interval: 5m files: - targets/manual.*.json「3、协程交互指标」
服务发现主要涉及3类协程:
Discoverer协程(多个):封装provider,基于协议发现采集点,这里可能会存在多个,一个provider对应一个Discoverer协程;updater协程(1个):Discoverer协程发现采集点,通过channel通道通知到updater协程,updater协程将采集点更新到Manager结构体中targets字段中,然后向Manager结构体中triggerSend通道写入数据,告诉sender协程targets有更新;sender协程(1个):sender协程每5秒检测triggerSend通道数据,检测到更新则将Manager结构体targets数据处理封装写入到Manager结构体syncCh通道中,scrape模块监测该通道,即完成将服务发现模块和scrape模块交互。这其中涉及三个指标:
prometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total 关键词:
-
焦点简讯:prometheus 服务发现原理
如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服务发现模块专门负责发现需要监控的目标采集点(target)信息,数据采集模块从
-
环球快讯:会同县:积极开展结核病筛查 全力守护校园健康
红网时刻怀化3月25日讯(通讯员蒋小兰)3月24日,会同县中小学一年级学生肺结核筛查工作有序进行。当天,县卫生健康局
-
当前播报:呜咽的拼音
呜咽的拼音是[wūyè]1、呜咽是一个汉语词汇,读音为wūyè,指的是伤心哽泣的声音,形容低沉凄切悲戚的声音;形容凄切的水声或丝竹(管弦乐器
-
【世界速看料】辞职期间没工作怎么交社保?个人办理社保方法?
辞职期间没工作怎么交社保?个人办理社保方法?下面同社保网小编整理了解一下。社保缴费主要通过公司,如果离职或者失业的情况下,不想社保出
-
今日热讯:证监会出手!问询“券茅”宕机
转自:中国证券报东方财富宕机事件新进展来了!3月24日,证监会要求东方财富说明此次信息安全事件的发生原因、影响以及整改情况,并进一步说明
-
全球今热点:赛尔号谱尼的封印有什么力量_赛尔号 谱尼第7封印怎么打
1、赛尔号谱尼圣洁封印特性:一切属性招无效,必须用非属性技能附带的状态打,也就是说这个招数要有威力。2、像毒粉、鬼火等威
-
全球时讯:经常头晕是怎么回事?
第一,神经系统病变,如脑缺血病变、小脑病变、脑部病变、脑外伤、某些类型的癫痫等。此外,植物神经功能失调以及某些神经症的病人也会常常感
-
环球时讯:中国驻科威特大使馆发布斋月期间领事温馨提醒
中新网3月25日电据中国驻科威特大使馆微信公众号消息,2023年伊斯兰教斋月于3月23日开始。对穆斯林而言,斋月是一年
-
世界球精选!西安银行:连续3日融资净偿还累计1383.51万元(03-24)
2023年3月24日西安银行连续3日融资净偿还累计1383 51万元
-
全球看热讯:证券时报:车市回暖需要政策刺激 更要靠内生动力
【证券时报:车市回暖需要政策刺激更要靠内生动力】近期,全国已有20多个省份密集推出刺激汽车消费政策,补贴力度空前。汽车产业作为国民经济
-
每日精选:阳信县综合行政执法局推进“街长制” 助力城市精细化管理
阳信县综合行政执法局推进“街长制”助力城市精细化管理
-
天天最资讯丨吴聘是什么电视剧
1、吴聘,电视剧《那年花开月正圆》(又名《大义秦商》)角色,由何润东饰演。是一名儒商。2、那年花开月正圆》是由丁黑执导,由孙俪、陈晓领
-
环球今热点:记者眼中的临沂丨临沂的发展日新月异 老区“不老”风华正茂
记者眼中的临沂丨临沂的发展日新月异老区“不老”风华正茂
-
报道:“火热”数据折射中国经济“热度” 尽显开放中国的魅力
今年境内举办展览活动规模有望大幅增长在3月23日的商务部发布会上,新闻发言人介绍,今年以来,商务部和各地各相关部门一道,积极出台政策措施
-
精选!市场监管总局发布四部反垄断法配套规章
市场监管总局近日发布《制止滥用行政权力排除、限制竞争行为规定》《禁止垄断协议规定》《禁止滥用市场支配地位行为规定》《经营者集中审查规
-
今日快讯:美国多地将举办集会反对枪支暴力 美大学称高凶杀率令学生害怕未来
据美国福克斯新闻网3月23日报道,本星期内,美国佛罗里达州、密歇根州、加利福尼亚州等多地将同时举办集会,反对枪支暴力。2
-
今日聚焦!道氏技术:子公司广东佳纳与POSCO签订为59亿元购买合同,首批产品已按合同约定发运交付
道氏技术3月24日在互动平台表示,2022年11月,子公司广东佳纳与POSCOCHEMICALCO ,LTD签订为期三
-
世界滚动:我的起源高级烈焰之环效果是什么
我的起源高级烈焰之环效果是什么:攻击效果:115%攻击力火属性伤害;火焰区域残留每0 5s造成4 4%攻击力火属性伤害;持续时间:15s;攻击范围:
-
环球热文:打好“三张王牌” 点亮乡村夜经济
党的二十大报告提出“建设宜居宜业和美乡村”,乡村旅游发展进入了转型升级新阶段。近年来,全国各地趁着全面乡村振兴的东风,积极发展乡村旅
-
每日速讯:山航4月27日起恢复青岛=曼谷航线,前往东南亚旅游再增便捷空中通道
本周末,民航将开启夏秋航季。山航将新开多条国内、国际和地区航线以满足公众出行需求。其中,4月27日起,青岛=曼谷航线将正式恢复运行,市民