跳到主要内容
版本:dev

监控:Ollama 本地大模型服务

HertzBeat 对 Ollama 本地大模型服务的版本信息、已安装模型列表和运行中模型进行采集监控。

准备工作

确保 Ollama 已运行且 API 可访问。默认情况下,Ollama 监听端口为 11434

如果 Ollama 运行在远程服务器上,可能需要设置 OLLAMA_HOST 环境变量为 0.0.0.0 以允许外部访问。

配置参数

参数名称参数帮助描述
监控Host被监控的 Ollama 服务的对端 IPV4、IPV6 或域名。注意:不带协议头(eg: https://, http://)。
任务名称标识此监控的名称,名称需要保证唯一性。
端口Ollama 服务监听的端口,默认为 11434。
SSL连接是否通过 HTTPS 连接 Ollama 服务。
采集器配置此监控使用哪台采集器调度采集。
密钥要直接访问 ollama.com 的 API密钥
监控周期监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒。
绑定标签对监控资源的分类管理标签。
描述备注更多标识和描述此监控的备注信息,用户可以在这里备注信息。

采集指标

指标集合:版本信息

指标名称指标单位指标帮助描述
版本Ollama 服务的版本号。

指标集合:已安装模型

指标名称指标单位指标帮助描述
模型名称已安装模型的名称。
模型大小MB模型文件的大小。
参数规模模型的参数规模(如 7B、13B)。
量化级别模型的量化级别(如 Q4_0、Q8_0)。
模型家族模型所属家族(如 llama、qwen)。
格式模型格式(如 gguf)。
修改时间模型最后修改时间。

指标集合:运行中模型

指标名称指标单位指标帮助描述
模型名称运行中模型的名称。
模型大小MB模型在内存中的大小。
VRAM占用MB模型占用的显存大小。
过期时间模型从内存中卸载的时间。