差别

这里会显示出您选择的修订版和当前版本之间的差别。

--- vpet:mod:chatvpetprocess [2026/04/27 16:48] – 有米
+++ vpet:mod:chatvpetprocess [2026/05/10 16:34] (当前版本) – 有米
@@ 行 10: / 行 10: @@
 . [基本设置 — API 配置](#2-基本设置 — API 配置)
    - [使用 OpenAI API](#2-1 使用 OpenAI API)
-   - [使用 DeepSeek API](#22-使用-deepseek-api)
+   - [使用 DeepSeek API](#使用_deepseek_api)
-. [基本设置 — Embedding 配置](#3-基本设置--embedding-配置)
+. [基本设置 — Embedding 配置](#基本设置_embedding_配置)
-   - [什么是 Embedding](#31-什么是-embedding)
+   - [什么是 Embedding](#什么是_embedding)
-   - [使用 OpenAI Embedding](#32-使用-openai-embedding)
+   - [使用 OpenAI Embedding](#使用_openai_embedding)
-   - [使用 DeepSeek Embedding](#33-使用-deepseek-embedding)
+   - [使用 LBGAME 提供的 bge-m3 模型](#使用_由_lbgame_提供的_bge-m3_模型)
-. [基本设置 — 其他参数](#4-基本设置--其他参数)
+. [基本设置 — 其他参数](#基本设置_其他参数)
-. [其他设置 — 语音输入与高级参数](#5-其他设置--语音输入与高级参数)
+. [其他设置 — 语音输入与高级参数](#其他设置_语音输入与高级参数)
 . [知识库设置](#6-知识库设置)
 . [数据库预览](#7-数据库预览)
@@ 行 36: / 行 36: @@
 | 字段 | 说明 |
-|------|------|
 | **API URL** | 聊天接口地址，建议以 `/v1` 结尾 |
 | **API Key** | 用于鉴权的密钥 |
-| **Web 代理** | 可选。HTTP/SOCKS 代理地址，国内访问 OpenAI 等限制模型商时使用. 无需可不填 |
+| **Web 代理** | 可选。填入 HTTP/SOCKS 代理地址。若在国内直接访问 OpenAI 等服务，请务必填写或使用 API 中转。 |
 | **Model** | 使用的语言模型名称，可下拉选择或手动输入 |
 | **初始化文本** | 系统提示词（System Prompt），不会被遗忘，字越多越贵 |
@@ 行 45: / 行 44: @@
 | **单次最大花费** | 单次请求允许消耗的最大 Token 数（在"其他设置"中设置，参见第 5 节） |
-> **提示**：初始化文本中`{Name}` 占位符会被替换为桌宠的实际名称，可在初始化文本中使用，例如：
+<wrap info>**提示**：初始化文本中`{Name}` 占位符会被替换为桌宠的实际名称，可在初始化文本中使用，例如：
-> `你是一只桌宠，你的名字叫{Name}。`
+ 你是一只桌宠，你的名字叫`{Name}`。</wrap>
 **注意: 模型需要支持 ToolCall (工具调用) 功能**
@@ 行 61: / 行 60: @@
 . 前往 [OpenAI 平台](https://platform.openai.com/) 注册账号并充值。
 . 进入 **API Keys** 页面，点击 **Create new secret key** 生成密钥（以 `sk-` 开头）。
-. 在设置窗口中填写：
+. 在设置窗口中填写：\\
-   - **API URL**：`https://api.openai.com/v1/`
+   - **API URL**：`https://api.openai.com/v1/`\\
-   - **API Key**：粘贴你的 `sk-xxxxxxxx` 密钥
+   - **API Key**：粘贴你的 `sk-xxxxxxxx` 密钥\\
    - **Model**：推荐 `gpt-4o-mini`（性价比高）或 `gpt-4o`
-> 若在中国大陆访问，需在 **Web 代理** 中填写代理地址，或使用中转
+<wrap info>若在中国大陆访问，需在 **Web 代理** 中填写代理地址，或使用中转</wrap>
 **常用模型参考**
 | 模型 | 特点 |
-|------|------|
 | `gpt-5.4-nano` | 便宜 |
 | `gpt-5.4-mini` | 贵 |
@@ 行 84: / 行 82: @@
 . 前往 [DeepSeek 开放平台](https://platform.deepseek.com/) 注册账号并充值。
 . 进入 **API Keys** 页面，创建并复制你的 API Key（以 `sk-` 开头）。
-. 在设置窗口中填写：
+. 在设置窗口中填写：\\
-   - **API URL**：`https://api.deepseek.com/v1`
+   - **API URL**：`https://api.deepseek.com/v1`\\
-   - **API Key**：粘贴你的 DeepSeek API Key
+   - **API Key**：粘贴你的 DeepSeek API Key\\
    - **Model**：`deepseek-chat`（通用对话）或 `deepseek-reasoner`（推理增强）
@@ 行 94: / 行 92: @@
 | 模型 | 特点 |
-|------|------|
 | `deepseek-chat` | 通用对话，速度快，中文能力强 |
 | `deepseek-reasoner` | 链式推理，适合逻辑密集型任务 |
 ---
 ### 2.3 使用本地部署模型
@@ 行 118: / 行 114: @@
    打开 LM Studio，进入 **Model Search** 标签页，搜索并下载一个支持 Tool Call 的模型。**建议选择 8B 或以上参数量的模型**（例如 `qwen3.5-35b-a3b`、`gemma-4-26b-a4b`、`glm-4.7-flash`）。更小的模型容易出现格式错误。
-. **启动本地服务器**
+. **启动本地服务器**  \\
-   - 在左侧边栏点击 **Developer** 标签页。
+   - 在左侧边栏点击 **Developer** 标签页。\\
-   - 选择 **Load Model** ,选择已下载的模型，点击 **Start Server** 启动服务。
+   - 选择 **Load Model** ,选择已下载的模型，点击 **Start Server** 启动服务。\\
    - 默认 API 地址为 `http://localhost:1234/v1`。
 . **在 ChatVPet 中填写配置**
-   参考以下信息填写设置窗口：
+参考以下信息填写设置窗口：\\
-   - **API URL**：`http://localhost:1234/v1`
+- **API URL**：`http://localhost:1234/v1`\\
-   - **API Key**：任意非空字符串即可（如 `local`），LM Studio 本地服务不对 Key 做校验
+- **API Key**：任意非空字符串即可（如 `local`），LM Studio 本地服务不对 Key 做校验\\
-   - **Model**：填写 LM Studio 中实际加载的模型名称（可在 Server 界面查看，如 `glm-4.7-flash`）
+- **Model**：填写 LM Studio 中实际加载的模型名称（可在 Server 界面查看，如 `glm-4.7-flash`）\\
-   - 其余字段（如温度、代理等）根据实际需求填写
+- 其余字段（如温度、代理等）根据实际需求填写
-> ⚠️ **注意**：LM Studio 的 `/v1/chat/completions` 端点完全兼容 OpenAI API 格式，原生支持 **Tool Call（函数调用）** 功能。只要模型本身具备 Tool Call 能力，ChatVPet 即可正常调用。
+<wrap info> **注意**：LM Studio 的 `/v1/chat/completions` 端点完全兼容 OpenAI API 格式，原生支持 **Tool Call（函数调用）** 功能。只要模型本身具备 Tool Call 能力，ChatVPet 即可正常调用。</wrap>
 ---
@@ 行 149: / 行 145: @@
    使用内置的 `llama-server` 启动 OpenAI 兼容的 API 服务：
-   ```bash
+   `./llama-server -m /path/to/model.gguf --host 0.0.0.0 --port 8080 -c 4096 --jinja`
-   ./llama-server -m /path/to/model.gguf \
-                  --host 0.0.0.0 \
+   - `-m`：模型文件路径\\
-                  --port 8080 \
+   - `--host` / `--port`：监听地址和端口\\
-                  -c 4096 \
+   - `-c`：上下文长度（需与模型匹配）\\
-                  --jinja
-   ```
-   - `-m`：模型文件路径
-   - `--host` / `--port`：监听地址和端口
-   - `-c`：上下文长度（需与模型匹配）
    - `--jinja`：**启用 Jinja 模板解析，这是 Tool Call 正常工作的关键参数**
-. **在 ChatVPet 中填写配置**
+. **在 ChatVPet 中填写配置**\\
+    - **API URL**：`http://localhost:8080/v1`\\
-   - **API URL**：`http://localhost:8080/v1`
+   - **API Key**：任意非空字符串\\
-   - **API Key**：任意非空字符串
+   - **Model**：填写模型名称（可先访问 `http://localhost:8080/v1/models` 查看）\\
-   - **Model**：填写模型名称（可先访问 `http://localhost:8080/v1/models` 查看）
-> 💡 **提示**：llama.cpp 的 API 服务完全兼容 OpenAI 格式，原生支持 Tool Call。若需要 GPU 加速，请根据您的硬件在编译时启用相应的后端（NVIDIA 使用 CUDA，Apple Silicon 使用 Metal）。
+<wrap tip>  **提示**：llama.cpp 的 API 服务完全兼容 OpenAI 格式，原生支持 Tool Call。若需要 GPU 加速，请根据您的硬件在编译时启用相应的后端（NVIDIA 使用 CUDA，Apple Silicon 使用 Metal）。</wrap>
 ---
@@ 行 194: / 行 184: @@
 | 字段 | 说明 |
-|------|------|
 | **Embedding URL** | Embedding 接口地址，留空则使用主 API URL |
 | **Embedding Key** | Embedding 接口密钥，留空则自动使用主 API Key |
 | **Embedding Model** | 使用的 Embedding 模型，默认 `text-embedding-3-small` |
-> **注意**：更换 Embedding 模型或 API 后，请前往 **数据库预览** 标签页点击 **清除向量缓存**，以确保旧缓存失效，重新生成向量。
+<wrap info> **注意**：更换 Embedding 模型或 API 后，请前往 **数据库预览** 标签页点击 **清除向量缓存**，以确保旧缓存失效，重新生成向量。</wrap>
 ---
@@ 行 209: / 行 199: @@
 如需单独指定：
-- **Embedding URL**：`https://api.openai.com/v1`
+- **Embedding URL**：`https://api.openai.com/v1`  \\
-- **Embedding Key**：与主 API Key 相同
+- **Embedding Key**：与主 API Key 相同\\
 - **Embedding Model**：`text-embedding-3-small`或 `text-embedding-3-large`
@@ 行 224: / 行 214: @@
 >  注: 服务器不收集用户信息, 但是为了节约性能开销, 会缓存 文本->向量 以避免重复计算
 ---
@@ 行 236: / 行 227: @@
 | 字段 | 说明 |
-|------|------|
 | **累计花费** | 显示迄今为止消耗的 Token 总数，只读 |
 | **Token 显示** | 是否在聊天记录中显示每次消耗的 Token 数量 |
@@ 行 252: / 行 242: @@
 | 字段 | 说明 |
-|------|------|
 | **启用语音输入** | 开关，启用后聊天界面会显示麦克风按钮 |
 | **语音密钥** | Azure Speech 资源的订阅密钥 |
@@ 行 261: / 行 250: @@
 | 字段 | 默认值 | 说明 |
-|------|--------|------|
 | **最大聊天记录** | 20 | 单次对话注入上下文的最大历史条数 |
 | **最大工具库** | 10 | 每次对话最多召回的工具条数，越多越消耗 Token |
@@ 行 273: / 行 261: @@
 | 字段 | 默认值 | 说明 |
-|------|--------|------|
 | **压缩触发条数** | 24 | 聊天记录超过此数时自动触发压缩，设为 0 禁用 |
 | **压缩保留最近数** | 10 | 压缩时保留最近几条对话不参与摘要 |
@@ 行 280: / 行 267: @@
 ---
 ## 6. 知识库设置
@@ 行 292: / 行 278: @@
 **规则**：
 - 每行一条知识
 - 知识不会直接全部塞入提示词，而是由 Embedding 算法按相关度动态召回。