原创首发

初识promethus

南城阿宇发表于 2021-02-19 04:41 1874

prometheus

Prometheus的主要特点是：

一个多维数据模型，其中包含通过度量标准名称和键/值对标识的时间序列数据
PromQL，一种灵活的查询语言，可利用此维度
不依赖分布式存储；单服务器节点是自治的
时间序列收集通过HTTP上的拉模型进行
通过中间网关支持推送时间序列
通过服务发现或静态配置发现目标
多种图形和仪表板支持模式

组件

Prometheus生态系统包含多个组件，其中许多是可选的：

Prometheus主服务器，它会刮取并存储时间序列数据
客户端库，用于检测应用程序代码
一个支持短期工作的推送网关
诸如HAProxy，StatsD，Graphite等服务的专用出口商
一个alertmanager处理警报
各种支持工具

大多数Prometheus组件都是用Go编写的，因此易于构建和部署为静态二进制文件。

Prometheus的体系结构及其某些生态系统组件

Prometheus直接或通过中间推送网关从已检测作业中删除指标，以用于短期作业。它在本地存储所有报废的样本，并对这些数据运行规则，以汇总和记录现有数据中的新时间序列，或生成警报。Grafana或其他API使用者可以用来可视化收集的数据。

什么时候合适？

Prometheus非常适合记录任何纯数字时间序列。它既适合以机器为中心的监视，也适合监视高度动态的面向服务的体系结构。在微服务世界中，其对多维数据收集和查询的支持是一种特别的优势。

Prometheus是为可靠性而设计的，它是您在中断期间要使用的系统，可让您快速诊断问题。每个Prometheus服务器都是独立的，而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时，您可以依靠它，并且无需设置广泛的基础结构即可使用它。

配置Prometheus

Prometheus配置为YAML。Prometheus下载在一个名为的文件中带有一个示例配置，prometheus.yml这是一个入门的好地方。

我们删除了示例文件中的大多数注释，以使其更加简洁（注释以开头的行#）。

global:
  scrape_interval:     15s
  evaluation_interval: 15s

rule_files:
  # - "first.rules"
  # - "second.rules"

scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']

有示例配置文件中配置的三个模块：global，rule_files，和scrape_configs。

该global块控制Prometheus服务器的全局配置。我们有两个选择。第一个scrape_interval控制，Prometheus多久刮一次目标。您可以为单个目标覆盖此目标。在这种情况下，全局设置是每15秒刮一次。该evaluation_interval选项控制Prometheus多久评估一次规则。Prometheus使用规则来创建新的时间序列并生成警报。

该rule_files块指定了我们希望Prometheus服务器加载的任何规则的位置。目前，我们还没有任何规则。

最后一块，scrape_configs控制Prometheus监视哪些资源。由于Prometheus还将有关自身的数据公开为HTTP端点，因此它可以抓取并监视其自身的运行状况。在默认配置中，有一个名为的作业，prometheus它会刮擦Prometheus服务器公开的时间序列数据。作业包含一个静态配置的目标localhost端口9090。Prometheus希望指标可用于路径上的目标/metrics。因此，此默认作业是通过以下网址进行抓取：http：// localhost：9090 / metrics。

返回的时间序列数据将详细说明Prometheus服务器的状态和性能。

本文由南城阿宇原创发布于阳光沙滩，未经作者授权，禁止转载

0/240