Venice AI
Venice AI(Venice 精选)
Section titled “Venice AI(Venice 精选)”Venice 是我们精选的 Venice 隐私优先推理配置,支持可选的匿名化访问专有模型。
Venice AI 提供注重隐私的 AI 推理服务,支持无审查模型,并可通过其匿名代理访问主流专有模型。所有推理默认私密——不会用你的数据训练,不会记录日志。
为什么在 CoderClaw 中使用 Venice
Section titled “为什么在 CoderClaw 中使用 Venice”- 私密推理,适用于开源模型(无日志记录)。
- 需要时可使用无审查模型。
- 在质量重要时,可匿名访问专有模型(Opus/GPT/Gemini)。
- 兼容 OpenAI 的
/v1端点。
Venice 提供两种隐私级别——理解这一点是选择模型的关键:
| 模式 | 描述 | 模型 |
|---|---|---|
| 私密 | 完全私密。提示词/回复从不存储或记录。临时性处理。 | Llama、Qwen、DeepSeek、Venice Uncensored 等 |
| 匿名化 | 通过 Venice 代理转发并剥离元数据。底层提供商(OpenAI、Anthropic)收到的是匿名化请求。 | Claude、GPT、Gemini、Grok、Kimi、MiniMax |
- 注重隐私:可选择”私密”(完全私密)和”匿名化”(代理转发)模式
- 无审查模型:访问无内容限制的模型
- 主流模型访问:通过 Venice 匿名代理使用 Claude、GPT-5.2、Gemini、Grok
- 兼容 OpenAI API:标准
/v1端点,易于集成 - 流式输出:✅ 所有模型均支持
- 函数调用:✅ 部分模型支持(请检查模型能力)
- 视觉:✅ 具有视觉能力的模型支持
- 无硬性速率限制:极端使用情况下可能触发公平使用限流
1. 获取 API 密钥
Section titled “1. 获取 API 密钥”- 在 venice.ai 注册
- 前往 Settings → API Keys → Create new key
- 复制你的 API 密钥(格式:
vapi_xxxxxxxxxxxx)
2. 配置 CoderClaw
Section titled “2. 配置 CoderClaw”方案 A:环境变量
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"方案 B:交互式设置(推荐)
coderclaw onboard --auth-choice venice-api-key这将:
- 提示输入你的 API 密钥(或使用已有的
VENICE_API_KEY) - 显示所有可用的 Venice 模型
- 让你选择默认模型
- 自动配置提供商
方案 C:非交互式
coderclaw onboard --non-interactive \ --auth-choice venice-api-key \ --venice-api-key "vapi_xxxxxxxxxxxx"3. 验证设置
Section titled “3. 验证设置”coderclaw chat --model venice/llama-3.3-70b "Hello, are you working?"设置完成后,CoderClaw 会显示所有可用的 Venice 模型。根据你的需求选择:
- 默认(我们的推荐):
venice/llama-3.3-70b,私密且性能均衡。 - 最佳整体质量:
venice/claude-opus-45,适合复杂任务(Opus 仍然是最强的)。 - 隐私:选择”私密”模型以获得完全私密的推理。
- 能力:选择”匿名化”模型以通过 Venice 代理访问 Claude、GPT、Gemini。
随时更改默认模型:
coderclaw models set venice/claude-opus-45coderclaw models set venice/llama-3.3-70b列出所有可用模型:
coderclaw models list | grep venice通过 coderclaw configure 配置
Section titled “通过 coderclaw configure 配置”- 运行
coderclaw configure - 选择 Model/auth
- 选择 Venice AI
应该使用哪个模型?
Section titled “应该使用哪个模型?”| 使用场景 | 推荐模型 | 原因 |
|---|---|---|
| 通用对话 | llama-3.3-70b | 综合表现好,完全私密 |
| 最佳整体质量 | claude-opus-45 | Opus 在复杂任务上仍然最强 |
| 隐私 + Claude 品质 | claude-opus-45 | 通过匿名代理获得最佳推理能力 |
| 编程 | qwen3-coder-480b-a35b-instruct | 代码优化,262k 上下文 |
| 视觉任务 | qwen3-vl-235b-a22b | 最佳私密视觉模型 |
| 无审查 | venice-uncensored | 无内容限制 |
| 快速 + 低成本 | qwen3-4b | 轻量级,仍有不错能力 |
| 复杂推理 | deepseek-v3.2 | 推理能力强,私密 |
可用模型(共 25 个)
Section titled “可用模型(共 25 个)”私密模型(15 个)— 完全私密,无日志记录
Section titled “私密模型(15 个)— 完全私密,无日志记录”| 模型 ID | 名称 | 上下文(token) | 特性 |
|---|---|---|---|
llama-3.3-70b | Llama 3.3 70B | 131k | 通用 |
llama-3.2-3b | Llama 3.2 3B | 131k | 快速,轻量 |
hermes-3-llama-3.1-405b | Hermes 3 Llama 3.1 405B | 131k | 复杂任务 |
qwen3-235b-a22b-thinking-2507 | Qwen3 235B Thinking | 131k | 推理 |
qwen3-235b-a22b-instruct-2507 | Qwen3 235B Instruct | 131k | 通用 |
qwen3-coder-480b-a35b-instruct | Qwen3 Coder 480B | 262k | 编程 |
qwen3-next-80b | Qwen3 Next 80B | 262k | 通用 |
qwen3-vl-235b-a22b | Qwen3 VL 235B | 262k | 视觉 |
qwen3-4b | Venice Small (Qwen3 4B) | 32k | 快速,推理 |
deepseek-v3.2 | DeepSeek V3.2 | 163k | 推理 |
venice-uncensored | Venice Uncensored | 32k | 无审查 |
mistral-31-24b | Venice Medium (Mistral) | 131k | 视觉 |
google-gemma-3-27b-it | Gemma 3 27B Instruct | 202k | 视觉 |
openai-gpt-oss-120b | OpenAI GPT OSS 120B | 131k | 通用 |
zai-org-glm-4.7 | GLM 4.7 | 202k | 推理,多语言 |
匿名化模型(10 个)— 通过 Venice 代理
Section titled “匿名化模型(10 个)— 通过 Venice 代理”| 模型 ID | 原始模型 | 上下文(token) | 特性 |
|---|---|---|---|
claude-opus-45 | Claude Opus 4.5 | 202k | 推理,视觉 |
claude-sonnet-45 | Claude Sonnet 4.5 | 202k | 推理,视觉 |
openai-gpt-52 | GPT-5.2 | 262k | 推理 |
openai-gpt-52-codex | GPT-5.2 Codex | 262k | 推理,视觉 |
gemini-3-pro-preview | Gemini 3 Pro | 202k | 推理,视觉 |
gemini-3-flash-preview | Gemini 3 Flash | 262k | 推理,视觉 |
grok-41-fast | Grok 4.1 Fast | 262k | 推理,视觉 |
grok-code-fast-1 | Grok Code Fast 1 | 262k | 推理,编程 |
kimi-k2-thinking | Kimi K2 Thinking | 262k | 推理 |
minimax-m21 | MiniMax M2.1 | 202k | 推理 |
当设置了 VENICE_API_KEY 时,CoderClaw 会自动从 Venice API 发现模型。如果 API 不可达,则回退到静态目录。
/models 端点是公开的(列出模型无需认证),但推理需要有效的 API 密钥。
流式输出与工具支持
Section titled “流式输出与工具支持”| 功能 | 支持情况 |
|---|---|
| 流式输出 | ✅ 所有模型 |
| 函数调用 | ✅ 大多数模型(请检查 API 中的 supportsFunctionCalling) |
| 视觉/图像 | ✅ 标记为”视觉”特性的模型 |
| JSON 模式 | ✅ 通过 response_format 支持 |
Venice 使用积分制。请查看 venice.ai/pricing 了解当前费率:
- 私密模型:通常成本较低
- 匿名化模型:与直接 API 定价相近 + 少量 Venice 费用
对比:Venice 与直接 API
Section titled “对比:Venice 与直接 API”| 方面 | Venice(匿名化) | 直接 API |
|---|---|---|
| 隐私 | 剥离元数据,匿名化 | 关联你的账户 |
| 延迟 | +10-50ms(代理) | 直连 |
| 功能 | 支持大部分功能 | 完整功能 |
| 计费 | Venice 积分 | 提供商计费 |
# 使用默认私密模型coderclaw chat --model venice/llama-3.3-70b
# 通过 Venice 使用 Claude(匿名化)coderclaw chat --model venice/claude-opus-45
# 使用无审查模型coderclaw chat --model venice/venice-uncensored
# 使用视觉模型处理图像coderclaw chat --model venice/qwen3-vl-235b-a22b
# 使用编程模型coderclaw chat --model venice/qwen3-coder-480b-a35b-instructAPI 密钥无法识别
Section titled “API 密钥无法识别”echo $VENICE_API_KEYcoderclaw models list | grep venice确保密钥以 vapi_ 开头。
Venice 模型目录会动态更新。运行 coderclaw models list 查看当前可用的模型。部分模型可能暂时离线。
Venice API 地址为 https://api.venice.ai/api/v1。确保你的网络允许 HTTPS 连接。
配置文件示例
Section titled “配置文件示例”{ env: { VENICE_API_KEY: "vapi_..." }, agents: { defaults: { model: { primary: "venice/llama-3.3-70b" } } }, models: { mode: "merge", providers: { venice: { baseUrl: "https://api.venice.ai/api/v1", apiKey: "${VENICE_API_KEY}", api: "openai-completions", models: [ { id: "llama-3.3-70b", name: "Llama 3.3 70B", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 131072, maxTokens: 8192, }, ], }, }, },}