HertzBeat 对 Ollama 本地大模型服务的版本信息、已安装模型列表和运行中模型进行采集监控。
准备工作
确 保 Ollama 已运行且 API 可访问。默认情况下,Ollama 监听端口为 11434。
如果 Ollama 运行在远程服务器上,可能需要设置 OLLAMA_HOST 环境变量为 0.0.0.0 以允许外部访问。
配置参数
| 参数名称 | 参数帮助描述 |
|---|
| 监控Host | 被监控的 Ollama 服务的对端 IPV4、IPV6 或域名。注意:不带协议头(eg: https://, http://)。 |
| 任务名称 | 标识此监控的名称,名称需要保证唯一性。 |
| 端口 | Ollama 服务监听的端口,默认为 11434。 |
| SSL连接 | 是否通过 HTTPS 连接 Ollama 服务。 |
| 采集器 | 配置此监控使用哪台采集器调度采集。 |
| 密钥 | 要直接访问 ollama.com 的 API密钥 |
| 监控周期 | 监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒。 |
| 绑定标签 | 对监控资源的分类管理标签。 |
| 描述备注 | 更多标识和描述此监控的备注信息,用户可以在这里备注信息。 |
采集指标
指标集合:版本信息
| 指标名称 | 指标单位 | 指标帮助描述 |
|---|
| 版本 | 无 | Ollama 服务的版本号。 |
指标集合:已安装模型
| 指标名称 | 指标单位 | 指标帮助描述 |
|---|
| 模型名称 | 无 | 已安装模型的名称。 |
| 模型大小 | MB | 模型文件的大小。 |
| 参数规模 | 无 | 模型的参数规模(如 7B、13B)。 |
| 量化级别 | 无 | 模型的量化级别(如 Q4_0、Q8_0)。 |
| 模型家族 | 无 | 模型所属家族(如 llama、qwen)。 |
| 格式 | 无 | 模型格式(如 gguf)。 |
| 修改时间 | 无 | 模型最后修改时间。 |
指标集合:运行中模型
| 指标名称 | 指标单位 | 指标帮助描述 |
|---|
| 模型名称 | 无 | 运行中模型的名称。 |
| 模型大小 | MB | 模型在内存中的大小。 |
| VRAM占用 | MB | 模型占用的显存大小。 |
| 过期时间 | 无 | 模型从内存中卸载的时间。 |