pdf2zh-desktop · macOS 使用教程

START

安装与启动

从 GitHub Release 下载 pdf2zh-desktop-mac-vx.x.x.zip，解压后把 pdf2zh-desktop.app 拖到「应用程序」即可。首次启动如果系统提示「无法验证开发者」，请去 系统设置 → 隐私与安全性 点「仍要打开」。

ⓘ

系统要求： macOS 12 (Monterey) 及以上 · Apple Silicon / Intel 双架构 · 首次启动会下载 ~80MB 字体与字典缓存到 ~/.cache/babeldoc。

⚠

App 没有签名（个人开发者）。如果首次打开被 Gatekeeper 拦截，在 Finder 里 右键 → 打开，或者执行一次 xattr -cr /Applications/pdf2zh-desktop.app 解除隔离属性。

PAGE 01

① 翻译页 — 主战场

这是你日常用得最多的页面。把 PDF 拖到上方的虚线框，挑一个翻译服务，点最下面的「开始翻译」就行。所有选项都有合理默认，第一次用直接拖文件 + 点开始即可出结果。

1

2

3

4

5

6

7

8

9

10

1

左侧导航

四个 Tab：翻译 / 阅读 / 设置 / 关于。点「设置」配 API Key（首次必做），点「阅读」看历史译文。

2

拖放区

把一个或多个 PDF 直接拖进来，也可以点击选择文件。支持批量：拖进 5 个文件就排队翻 5 个。

3

源语言

原文语言。一般保持 English。如果你翻日文/德文，下拉选对应语种 — 选错会导致句子拆分错乱。

4

目标语言

翻成什么语种。默认 中文(简体)，可改繁中、日、韩、英、俄、法、德、意、葡、西、阿等 20+ 语言。

5

翻译服务

核心选项。Google 免费但慢且需翻墙；DeepSeek/通义千问/智谱用 API Key，质量好且便宜。→ 怎么选见下文

6

页码范围

默认全部。也可填 1-10 只翻前 10 页，或 1,3,5-8 跳着翻。建议先小范围试翻验证服务可用。

7

输出格式

三选一：左右并排（推荐 · 原文译文同页对照）/ 双语对照（先原文页后译文页）/ 仅译文（只输出中文版）。

8

线程数

同时跑多少个翻译请求。免费服务别开太大（容易封 IP），DeepSeek/通义建议 16-32，长文本翻得快。

9

分块翻译 / 扫描件 / 表格 / OCR

大文件（>50 页）勾「分块翻译」，按 50 页一块，间隔 10 秒，避免触发 API 限流。扫描版 PDF 勾「扫描版 PDF」启用 OCR — 但效果有限，见下文。

10

开始翻译

点这里开跑。状态会变成「翻译中…」并显示进度条。完成后会自动跳到「阅读」页预览结果。骰子按钮：随便从内置示例论文里抽一篇试翻，验证流程。

★

第一次用？ 拖一个 5-10 页的外文论文进来，服务选 Google 翻译（不需要 Key），点开始 — 30 秒后你就能看到中外对照的 PDF 了。然后再回头去配 DeepSeek 提升质量。

PAGE 02

② 设置页 — 配 API & 偏好

所有翻译服务的 API Key 都填在这里。每个服务独立配置，互不影响。配好后翻译页才能选到对应服务。

1

2

3

4

5

6

7

8

9

10

11

1

翻译服务选择

下拉选你要配的服务。每选一个服务，下面的 Key/URL/Model 字段会切换。每个服务的配置独立保存。

2

API Key

从服务商后台复制粘贴。本地存储为 base64 + 文件权限 600，不上传任何服务器。失焦自动保存（点别处或按回车）。

3

模型

下拉选具体模型。DeepSeek 推荐 deepseek-chat（便宜快），deepseek-reasoner 准但慢且贵。OpenAI 用 gpt-4o-mini。

4

Base URL

API 端点。一般保持默认，除非你用三方代理（Cloudflare AI Gateway / OpenRouter / 自建中转）。

5

测试连接

点一下让程序发一个最小翻译请求验证 Key 有效。失败时会弹错误信息（额度不足 / Key 无效 / 网络超时）。

6

AI 助手（独立配置）

阅读页右侧的「AI 问答」用的服务。可以和翻译服务用同一家（默认勾上「使用独立配置」就关闭，沿用翻译服务）。也可以让翻译用便宜的，AI 助手用更聪明的。

7

翻译设置

四个开关：深色模式（界面跟随）/ 翻译缓存（建议开 · 同一段重复翻只调一次 API）/ AI 布局检测（实验性，开了会更准但更慢）/ 字体子集化（开了输出 PDF 更小）。

8

翻译提示词

给 AI 的指令模板。默认「直译」，你可以改成「学术」「口语」「保留专业术语」等风格，支持多套预设，点「保存 / 新建 / 导入 / 导出」管理。改完点「保存」生效。

9

术语表

固定专业名词的翻法。比如 Transformer → Transformer（不译）、token → 词元。每个学科一份术语表，翻译前选对的一份。

10

Zotero 联动

把翻译好的 PDF 自动导入 Zotero 文献库。点「一键安装」装 Zotero 插件，配好后翻译完成会问你「是否导入 Zotero」。

11

打开数据目录

跳转到 ~/.config/pdf2zh/。出问题时把 config.json 和 history.json 截图发给我们排查。不要手动改这两个文件，App 会覆盖。

ⓘ

API Key 在哪买？ 直接跳到下面的「买 API · 服务推荐」章节，列了每家服务的注册地址、价格、推荐场景。

PAGE 03

③ 阅读页 — 内置阅读器

翻译完成后会自动跳到这一页。左侧是历史记录，中间是 PDF 预览，右侧（点开后）是 AI 助手。关键功能：双语切换、AI 划词问答、跨译文高亮笔记。

1

2

3

4

5

6

7

8

9

10

11

1

翻译历史 + 缩略图 + 清空

左栏顶部。点「缩略图」切换列表/缩略图视图，点「清空」删除全部历史（不可逆，会问确认）。下方「全部 / 自建标签」按学科/项目分类。

2

历史记录列表

每翻译一份 PDF 自动添加一条。点击一条 = 直接打开该译文的 Side by Side 视图。右键可重命名、删除、移到分组。

3

Dual

双语对照模式：先一页原文，再一页译文，交替展示。适合精读 / 反复对照术语。

4

Mono

仅译文模式：只显示中文版。适合快速浏览全文掌握大意。

5

Side by Side

左右并排（默认）：左原文右译文，滚动同步。最常用，推荐。

6

连续 / 单页

滚动行为切换。「连续」=网页式无限滚动，「单页」=一次显示一页（按 → 翻页）。

7

打开 + 翻页器

「打开」按钮：手动选别的 PDF。右边的 « < 1/N > » 是首页/上页/页码/下页/末页。

8

缩放滑块 + 150%

拖滑块调缩放比例（25%-300%），右边显示当前百分比。Cmd+滚轮也能缩放。

9

适宽 / 适页

「适宽」让 PDF 宽度撑满，竖向滚动；「适页」整页显示，左右居中。看公式多的论文用「适宽」。

10

AI 问答 / 高亮 / 全屏

AI 问答：右侧抽屉，划词问 AI 解释。高亮：选中文字加荧光笔，跨语言同步（高亮原文，译文版同位置自动高亮）。全屏：F 键切换沉浸阅读。

11

选择记录查看详情

预览区空时的提示。点左侧任一历史记录或翻译完成后自动加载，这块就会变成 PDF 预览。

★

AI 问答用法：在 PDF 预览里选中一段中文或外文 → 点右上「AI 问答」→ 在抽屉里直接问「这段什么意思」「这个公式怎么推导」「举个例子」。AI 会拿你选的文字 + 上下文一起回答。

PAGE 04

④ 关于页 — 反馈 & 支持

查看版本号、特性列表、跳转到 GitHub、加 QQ 群、看小红书支持者墙。出 bug 也从这里走。

1

2

3

4

5

6

1

版本与简介

左上角是当前版本号（v2.2.6）。下面是简短描述：「开箱即用的学术 PDF 翻译工具」。

2

macOS 版特性

列出本版本的核心能力：原生设计、深色模式、Dual/Mono/Side by Side、历史管理、智能分块、触摸板手势、术语表、AI 问答、Zotero 联动等。

3

小红书账号

「艾伦说」是项目作者的小红书号。发布更新预告、使用技巧、用户案例。点「关注」直接跳到主页。

4

GitHub ↗

跳转到仓库主页。看 Release 页下载新版、看 Issue 报 bug、看 Star 涨了多少。

5

支持者墙

感谢所有在小红书互动 / Star / 反馈 bug 的朋友。每个圆圈代表一位用户（昵称首字母）。

6

进入 QQ 群

桌面交流群。这是最快得到帮助的地方 — 翻译异常、API 问题、功能建议丢群里，群主和老用户会回答。

SERVICE

买 API · 服务推荐

翻译需要调外部 AI 服务。每家服务都要去对应官网注册账号 → 充值 → 创建 API Key → 粘贴到设置页。下面按「场景」推荐，照着选不会错。

我该选哪家？

最便宜质量好

DeepSeek · 千 token ¥0.001 · 学术翻译质量最佳性价比，一篇 30 页论文约 ¥0.05

完全免费

Google 翻译 · 不要 Key · 但要稳定翻墙，且大文件容易被限流；适合临时小文件

国内不翻墙

通义千问 / 智谱 / DeepSeek · 国内服务商直连，速度最快，无需代理

质量最高

OpenAI GPT-4o · 文学性最好但贵 · 一篇 30 页论文约 ¥3-5 · 需海外信用卡或代理购买

学校或公司有内网模型

OpenAI 兼容 / Ollama 本地 · 自定义 Base URL，连任何 OpenAI-API 兼容服务（vLLM / Xinference / Ollama）

主流服务清单

D

DeepSeek

最推荐

国产大模型 · 学术翻译质量第一档 · 千 token ¥0.001（输入），¥0.002（输出） · 注册送 ¥10 额度可翻 200 篇论文 · 模型选 deepseek-chat。

注册 / 充值创建 Key

Q

通义千问 (DashScope)

国内优选

阿里云出品 · 稳定速度快 · 千 token ¥0.0008-0.012（按模型档位）· 注册送大量免费额度 · 推荐模型 qwen-plus / qwen-max。

百炼平台文档

Z

智谱 ChatGLM

清华系 · GLM-4 系列 · 千 token ¥0.001（GLM-4-Flash 免费档）· 注册送资源包 · 适合预算敏感大量翻译。

开放平台创建 Key

O

OpenAI

质量天花板 · GPT-4o-mini 性价比可以 · 千 token $0.00015（输入）· 但需海外信用卡充值，国内信用卡多被风控。

API Keys 价格

G

Google Gemini

Gemini 1.5 Flash 免费档每分钟 15 请求 · 长文本能力强（2M token 窗口）· 国内需翻墙 · 用 Google 账号即可申请 Key。

AI Studio

S

SiliconFlow 硅基流动

国内 LLM 聚合中转 · 一个 Key 调 20+ 模型（DeepSeek/Qwen/Yi/Llama）· 价格对齐源厂 · 注册送 ¥14 体验金。

注册 API Key

D

DeepL

欧系翻译质量第一 · 但学术领域不如 LLM · 月 50万字符免费 · 注册需海外手机号或信用卡 · 不支持公式术语保留。

DeepL Pro API

F

Google 翻译

免费

不需要 Key，但需要稳定翻墙环境。质量一般，大文件容易被限流。仅用于第一次试用流程，正式用强烈建议切到 LLM 服务。

→ 翻译页直接选

∞

OpenAI 兼容 / 自建

设置页选「OpenAI-liked」，Base URL 填你自己的 vLLM/Xinference/Ollama 地址（如 http://localhost:11434/v1）。完全本地，零成本，质量看你跑的模型。

Ollama vLLM

⚠

第一次充值前先小额试用：每家都先充 ¥10 / $5，跑两篇论文确认翻译质量、速度、计费方式都符合预期，再决定是不是大额充值。API Key 永远只放本地，不要发到群里、邮件里、GitHub 仓库里。

OCR

扫描版 PDF · 文字层补全方案

如果你的 PDF 是扫描件（图片型，选不了文字、复制不出来），翻译页的「OCR 识别」勾选框只能做非常基础的文字识别，对复杂版面、公式、表格、多栏论文识别率低。强烈建议先用专业 OCR 软件给 PDF 加一层文字层，再回到 pdf2zh 翻译，效果天差地别。

A

ABBYY FineReader

最准

业界标杆 · 中英日多语种 · 公式识别可用 · 表格保留结构 · macOS 版 ¥1300/年 · 大量论文 OCR 必备。

官网

A

Adobe Acrobat Pro

Acrobat Pro DC 自带 OCR · 「工具 → 增强扫描」一键加文字层 · ¥130/月订阅 · 已有 Adobe 全家桶的人首选。

Acrobat

B

白描 / Text Scanner (Mac)

便宜好用

App Store 搜「白描」· ¥38 买断 · 中文 OCR 准 · 拖入 PDF 一键识别导出可搜索 PDF · 小批量论文足够。

官网

T

OCRmyPDF (开源)

免费

Tesseract 内核 · 命令行 · brew install ocrmypdf 然后 ocrmypdf in.pdf out.pdf · 中文加 -l chi_sim+eng。

GitHub

P

PDFgear / PDF24

免费

免费 PDF 工具箱内置 OCR · 中等准度 · 适合一两个文件临时用 · 都有 macOS 版。

PDFgear PDF24

B

百度 / 腾讯 OCR API

通用文字识别 + 公式识别 API · 千次 ¥0.5-2 · 需要自己写脚本调用 → 拼回 PDF · 适合开发者批量处理。

百度 OCR 腾讯 OCR

★

推荐工作流：

扫描 PDF → 用 白描 / ABBYY / OCRmyPDF 加文字层 → 输出新 PDF
用 Acrobat / Preview 打开新 PDF，确认能选中文字、能复制
把这个新 PDF 拖进 pdf2zh-desktop · 不勾「扫描版 PDF」「OCR 识别」
正常翻译 — 这时候得到的版式、公式、术语效果就跟原生 PDF 一样好

FAQ

常见问题

翻译卡在 0% 不动？

通常是 API Key 没配 / 配错。回设置页点「测试连接」验证。免费 Google 翻译需要稳定翻墙环境。

大文件提示限流 / 失败？

翻译页勾「分块翻译」，每块 50 页，间隔 10 秒。或线程数从 16 调到 4-8。免费服务尤其需要。

公式翻乱 / 字符错位？

v2.2.5+ 已修复 MS-Mincho 误判 / DeepSeek 注释抑制。如果仍异常，关掉「AI 布局检测」试试。

App 打开闪退 / 崩溃？

删掉 ~/.cache/babeldoc，再重新打开（会重新下载字体）。还不行去 GitHub Issue 贴日志：~/Library/Logs/pdf2zh-desktop/。

翻译质量不如预期？

服务从 Google 切到 DeepSeek/通义千问，质量提升明显。设置页加术语表，固定专业名词译法。

能翻日文 / 德文 / 俄文吗？

能。翻译页改「源语言」为对应语种。模型默认都支持 50+ 语言互译。

能翻成英文 / 日文吗？

能。翻译页改「目标语言」即可。中→英、英→日都很常见。

翻译历史在哪？怎么备份？

阅读页左栏 = 历史。原始数据：~/.config/pdf2zh/history.json。备份这个文件即可。

API Key 安全吗？

本地存 base64 + 文件权限 600，不上传服务器。如果担心源码可在 GitHub 仓库审计 config_manager.py。