跳转到内容

Ollama

Ollama 是一个本地 LLM 运行时,可以轻松在你的机器上运行开源模型。CoderClaw 通过 Ollama 的 OpenAI 兼容 API 进行集成,并且当你通过 OLLAMA_API_KEY(或认证配置)启用且未定义显式的 models.providers.ollama 条目时,可以自动发现支持工具调用的模型

  1. 安装 Ollama:https://ollama.ai

  2. 拉取模型:

Terminal window
ollama pull llama3.3
# 或
ollama pull qwen2.5-coder:32b
# 或
ollama pull deepseek-r1:32b
  1. 为 CoderClaw 启用 Ollama(任意值即可;Ollama 不需要真实密钥):
Terminal window
# 设置环境变量
export OLLAMA_API_KEY="ollama-local"
# 或在配置文件中设置
coderclaw config set models.providers.ollama.apiKey "ollama-local"
  1. 使用 Ollama 模型:
{
agents: {
defaults: {
model: { primary: "ollama/llama3.3" },
},
},
}

当你设置了 OLLAMA_API_KEY(或认证配置)且定义 models.providers.ollama 时,CoderClaw 会从本地 Ollama 实例 http://127.0.0.1:11434 发现模型:

  • 查询 /api/tags/api/show
  • 仅保留报告了 tools 能力的模型
  • 当模型报告 thinking 时标记为 reasoning
  • 在可用时从 model_info["<arch>.context_length"] 读取 contextWindow
  • maxTokens 设置为上下文窗口的 10 倍
  • 所有费用设置为 0

这样无需手动配置模型条目,同时保持目录与 Ollama 的能力对齐。

查看可用模型:

Terminal window
ollama list
coderclaw models list

要添加新模型,只需通过 Ollama 拉取:

Terminal window
ollama pull mistral

新模型将被自动发现并可供使用。

如果你显式设置了 models.providers.ollama,自动发现将被跳过,你必须手动定义模型(见下文)。

启用 Ollama 最简单的方式是通过环境变量:

Terminal window
export OLLAMA_API_KEY="ollama-local"

在以下情况使用显式配置:

  • Ollama 运行在其他主机/端口上。
  • 你想强制指定上下文窗口或模型列表。
  • 你想包含未报告工具支持的模型。
{
models: {
providers: {
ollama: {
// 使用包含 /v1 的主机地址以兼容 OpenAI API
baseUrl: "http://ollama-host:11434/v1",
apiKey: "ollama-local",
api: "openai-completions",
models: [
{
id: "llama3.3",
name: "Llama 3.3",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 8192,
maxTokens: 8192 * 10
}
]
}
}
}
}

如果设置了 OLLAMA_API_KEY,你可以在提供商条目中省略 apiKey,CoderClaw 会自动填充以进行可用性检查。

如果 Ollama 运行在不同的主机或端口上(显式配置会禁用自动发现,因此需要手动定义模型):

{
models: {
providers: {
ollama: {
apiKey: "ollama-local",
baseUrl: "http://ollama-host:11434/v1",
},
},
},
}

配置完成后,所有 Ollama 模型即可使用:

{
agents: {
defaults: {
model: {
primary: "ollama/llama3.3",
fallbacks: ["ollama/qwen2.5-coder:32b"],
},
},
},
}

当 Ollama 在 /api/show 中报告 thinking 时,CoderClaw 会将模型标记为具有推理能力:

Terminal window
ollama pull deepseek-r1:32b

Ollama 免费且在本地运行,因此所有模型费用均设置为 $0。

对于自动发现的模型,CoderClaw 会使用 Ollama 报告的上下文窗口(如果可用),否则默认为 8192。你可以在显式提供商配置中覆盖 contextWindowmaxTokens

确保 Ollama 正在运行,且你已设置 OLLAMA_API_KEY(或认证配置),并且定义显式的 models.providers.ollama 条目:

Terminal window
ollama serve

同时确认 API 可访问:

Terminal window
curl http://localhost:11434/api/tags

CoderClaw 仅自动发现报告了工具支持的模型。如果你的模型未列出,可以:

  • 拉取一个支持工具调用的模型,或
  • models.providers.ollama 中显式定义该模型。

添加模型:

Terminal window
ollama list # 查看已安装的模型
ollama pull llama3.3 # 拉取模型

检查 Ollama 是否在正确的端口上运行:

Terminal window
# 检查 Ollama 是否在运行
ps aux | grep ollama
# 或重启 Ollama
ollama serve