跳转到内容

Venice AI

Venice 是我们精选的 Venice 隐私优先推理配置,支持可选的匿名化访问专有模型。

Venice AI 提供注重隐私的 AI 推理服务,支持无审查模型,并可通过其匿名代理访问主流专有模型。所有推理默认私密——不会用你的数据训练,不会记录日志。

  • 私密推理,适用于开源模型(无日志记录)。
  • 需要时可使用无审查模型
  • 在质量重要时,可匿名访问专有模型(Opus/GPT/Gemini)。
  • 兼容 OpenAI 的 /v1 端点。

Venice 提供两种隐私级别——理解这一点是选择模型的关键:

模式描述模型
私密完全私密。提示词/回复从不存储或记录。临时性处理。Llama、Qwen、DeepSeek、Venice Uncensored 等
匿名化通过 Venice 代理转发并剥离元数据。底层提供商(OpenAI、Anthropic)收到的是匿名化请求。Claude、GPT、Gemini、Grok、Kimi、MiniMax
  • 注重隐私:可选择”私密”(完全私密)和”匿名化”(代理转发)模式
  • 无审查模型:访问无内容限制的模型
  • 主流模型访问:通过 Venice 匿名代理使用 Claude、GPT-5.2、Gemini、Grok
  • 兼容 OpenAI API:标准 /v1 端点,易于集成
  • 流式输出:✅ 所有模型均支持
  • 函数调用:✅ 部分模型支持(请检查模型能力)
  • 视觉:✅ 具有视觉能力的模型支持
  • 无硬性速率限制:极端使用情况下可能触发公平使用限流
  1. venice.ai 注册
  2. 前往 Settings → API Keys → Create new key
  3. 复制你的 API 密钥(格式:vapi_xxxxxxxxxxxx

方案 A:环境变量

Terminal window
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

方案 B:交互式设置(推荐)

Terminal window
coderclaw onboard --auth-choice venice-api-key

这将:

  1. 提示输入你的 API 密钥(或使用已有的 VENICE_API_KEY
  2. 显示所有可用的 Venice 模型
  3. 让你选择默认模型
  4. 自动配置提供商

方案 C:非交互式

Terminal window
coderclaw onboard --non-interactive \
--auth-choice venice-api-key \
--venice-api-key "vapi_xxxxxxxxxxxx"
Terminal window
coderclaw chat --model venice/llama-3.3-70b "Hello, are you working?"

设置完成后,CoderClaw 会显示所有可用的 Venice 模型。根据你的需求选择:

  • 默认(我们的推荐)venice/llama-3.3-70b,私密且性能均衡。
  • 最佳整体质量venice/claude-opus-45,适合复杂任务(Opus 仍然是最强的)。
  • 隐私:选择”私密”模型以获得完全私密的推理。
  • 能力:选择”匿名化”模型以通过 Venice 代理访问 Claude、GPT、Gemini。

随时更改默认模型:

Terminal window
coderclaw models set venice/claude-opus-45
coderclaw models set venice/llama-3.3-70b

列出所有可用模型:

Terminal window
coderclaw models list | grep venice
  1. 运行 coderclaw configure
  2. 选择 Model/auth
  3. 选择 Venice AI
使用场景推荐模型原因
通用对话llama-3.3-70b综合表现好,完全私密
最佳整体质量claude-opus-45Opus 在复杂任务上仍然最强
隐私 + Claude 品质claude-opus-45通过匿名代理获得最佳推理能力
编程qwen3-coder-480b-a35b-instruct代码优化,262k 上下文
视觉任务qwen3-vl-235b-a22b最佳私密视觉模型
无审查venice-uncensored无内容限制
快速 + 低成本qwen3-4b轻量级,仍有不错能力
复杂推理deepseek-v3.2推理能力强,私密

私密模型(15 个)— 完全私密,无日志记录

Section titled “私密模型(15 个)— 完全私密,无日志记录”
模型 ID名称上下文(token)特性
llama-3.3-70bLlama 3.3 70B131k通用
llama-3.2-3bLlama 3.2 3B131k快速,轻量
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B131k复杂任务
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking131k推理
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct131k通用
qwen3-coder-480b-a35b-instructQwen3 Coder 480B262k编程
qwen3-next-80bQwen3 Next 80B262k通用
qwen3-vl-235b-a22bQwen3 VL 235B262k视觉
qwen3-4bVenice Small (Qwen3 4B)32k快速,推理
deepseek-v3.2DeepSeek V3.2163k推理
venice-uncensoredVenice Uncensored32k无审查
mistral-31-24bVenice Medium (Mistral)131k视觉
google-gemma-3-27b-itGemma 3 27B Instruct202k视觉
openai-gpt-oss-120bOpenAI GPT OSS 120B131k通用
zai-org-glm-4.7GLM 4.7202k推理,多语言

匿名化模型(10 个)— 通过 Venice 代理

Section titled “匿名化模型(10 个)— 通过 Venice 代理”
模型 ID原始模型上下文(token)特性
claude-opus-45Claude Opus 4.5202k推理,视觉
claude-sonnet-45Claude Sonnet 4.5202k推理,视觉
openai-gpt-52GPT-5.2262k推理
openai-gpt-52-codexGPT-5.2 Codex262k推理,视觉
gemini-3-pro-previewGemini 3 Pro202k推理,视觉
gemini-3-flash-previewGemini 3 Flash262k推理,视觉
grok-41-fastGrok 4.1 Fast262k推理,视觉
grok-code-fast-1Grok Code Fast 1262k推理,编程
kimi-k2-thinkingKimi K2 Thinking262k推理
minimax-m21MiniMax M2.1202k推理

当设置了 VENICE_API_KEY 时,CoderClaw 会自动从 Venice API 发现模型。如果 API 不可达,则回退到静态目录。

/models 端点是公开的(列出模型无需认证),但推理需要有效的 API 密钥。

功能支持情况
流式输出✅ 所有模型
函数调用✅ 大多数模型(请检查 API 中的 supportsFunctionCalling
视觉/图像✅ 标记为”视觉”特性的模型
JSON 模式✅ 通过 response_format 支持

Venice 使用积分制。请查看 venice.ai/pricing 了解当前费率:

  • 私密模型:通常成本较低
  • 匿名化模型:与直接 API 定价相近 + 少量 Venice 费用
方面Venice(匿名化)直接 API
隐私剥离元数据,匿名化关联你的账户
延迟+10-50ms(代理)直连
功能支持大部分功能完整功能
计费Venice 积分提供商计费
Terminal window
# 使用默认私密模型
coderclaw chat --model venice/llama-3.3-70b
# 通过 Venice 使用 Claude(匿名化)
coderclaw chat --model venice/claude-opus-45
# 使用无审查模型
coderclaw chat --model venice/venice-uncensored
# 使用视觉模型处理图像
coderclaw chat --model venice/qwen3-vl-235b-a22b
# 使用编程模型
coderclaw chat --model venice/qwen3-coder-480b-a35b-instruct
Terminal window
echo $VENICE_API_KEY
coderclaw models list | grep venice

确保密钥以 vapi_ 开头。

Venice 模型目录会动态更新。运行 coderclaw models list 查看当前可用的模型。部分模型可能暂时离线。

Venice API 地址为 https://api.venice.ai/api/v1。确保你的网络允许 HTTPS 连接。

{
env: { VENICE_API_KEY: "vapi_..." },
agents: { defaults: { model: { primary: "venice/llama-3.3-70b" } } },
models: {
mode: "merge",
providers: {
venice: {
baseUrl: "https://api.venice.ai/api/v1",
apiKey: "${VENICE_API_KEY}",
api: "openai-completions",
models: [
{
id: "llama-3.3-70b",
name: "Llama 3.3 70B",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 131072,
maxTokens: 8192,
},
],
},
},
},
}