macOS Edition · v2.2.6

把外文论文翻成中文 PDF
排版照旧、公式不糊

pdf2zh-desktop 是一款 macOS 学术 PDF 翻译工具,保留原始排版、公式、图表,支持多家翻译服务,自带阅读器与 AI 助手。本教程用真实截图带你走完每一步操作。

📐 保留排版 🧮 公式不糊 📚 批量翻译 🪄 AI 助手 🌐 20+ 翻译服务 📖 内置阅读器
START

安装与启动

从 GitHub Release 下载 pdf2zh-desktop-mac-vx.x.x.zip,解压后把 pdf2zh-desktop.app 拖到「应用程序」即可。首次启动如果系统提示「无法验证开发者」,请去 系统设置 → 隐私与安全性 点「仍要打开」。

系统要求: macOS 12 (Monterey) 及以上 · Apple Silicon / Intel 双架构 · 首次启动会下载 ~80MB 字体与字典缓存到 ~/.cache/babeldoc
App 没有签名(个人开发者)。如果首次打开被 Gatekeeper 拦截,在 Finder 里 右键 → 打开,或者执行一次 xattr -cr /Applications/pdf2zh-desktop.app 解除隔离属性。
PAGE 01

① 翻译页 — 主战场

这是你日常用得最多的页面。把 PDF 拖到上方的虚线框,挑一个翻译服务,点最下面的「开始翻译」就行。所有选项都有合理默认,第一次用直接拖文件 + 点开始即可出结果。

翻译页截图
1
2
3
4
5
6
7
8
9
10
1

左侧导航

四个 Tab:翻译 / 阅读 / 设置 / 关于。点「设置」配 API Key(首次必做),点「阅读」看历史译文。

2

拖放区

把一个或多个 PDF 直接拖进来,也可以点击选择文件。支持批量:拖进 5 个文件就排队翻 5 个。

3

源语言

原文语言。一般保持 English。如果你翻日文/德文,下拉选对应语种 — 选错会导致句子拆分错乱。

4

目标语言

翻成什么语种。默认 中文(简体),可改繁中、日、韩、英、俄、法、德、意、葡、西、阿等 20+ 语言。

5

翻译服务

核心选项。Google 免费但慢且需翻墙;DeepSeek/通义千问/智谱用 API Key,质量好且便宜。→ 怎么选见下文

6

页码范围

默认全部。也可填 1-10 只翻前 10 页,或 1,3,5-8 跳着翻。建议先小范围试翻验证服务可用。

7

输出格式

三选一:左右并排(推荐 · 原文译文同页对照)/ 双语对照(先原文页后译文页)/ 仅译文(只输出中文版)。

8

线程数

同时跑多少个翻译请求。免费服务别开太大(容易封 IP),DeepSeek/通义建议 16-32,长文本翻得快。

9

分块翻译 / 扫描件 / 表格 / OCR

大文件(>50 页)勾「分块翻译」,按 50 页一块,间隔 10 秒,避免触发 API 限流。扫描版 PDF 勾「扫描版 PDF」启用 OCR — 但效果有限,见下文

10

开始翻译

点这里开跑。状态会变成「翻译中…」并显示进度条。完成后会自动跳到「阅读」页预览结果。骰子按钮:随便从内置示例论文里抽一篇试翻,验证流程。

第一次用? 拖一个 5-10 页的外文论文进来,服务选 Google 翻译(不需要 Key),点开始 — 30 秒后你就能看到中外对照的 PDF 了。然后再回头去配 DeepSeek 提升质量。
PAGE 02

② 设置页 — 配 API & 偏好

所有翻译服务的 API Key 都填在这里。每个服务独立配置,互不影响。配好后翻译页才能选到对应服务。

设置页截图
1
2
3
4
5
6
7
8
9
10
11
1

翻译服务选择

下拉选你要配的服务。每选一个服务,下面的 Key/URL/Model 字段会切换。每个服务的配置独立保存。

2

API Key

从服务商后台复制粘贴。本地存储为 base64 + 文件权限 600,不上传任何服务器。失焦自动保存(点别处或按回车)。

3

模型

下拉选具体模型。DeepSeek 推荐 deepseek-chat(便宜快),deepseek-reasoner 准但慢且贵。OpenAI 用 gpt-4o-mini

4

Base URL

API 端点。一般保持默认,除非你用三方代理(Cloudflare AI Gateway / OpenRouter / 自建中转)。

5

测试连接

点一下让程序发一个最小翻译请求验证 Key 有效。失败时会弹错误信息(额度不足 / Key 无效 / 网络超时)。

6

AI 助手(独立配置)

阅读页右侧的「AI 问答」用的服务。可以和翻译服务用同一家(默认勾上「使用独立配置」就关闭,沿用翻译服务)。也可以让翻译用便宜的,AI 助手用更聪明的。

7

翻译设置

四个开关:深色模式(界面跟随)/ 翻译缓存(建议开 · 同一段重复翻只调一次 API)/ AI 布局检测(实验性,开了会更准但更慢)/ 字体子集化(开了输出 PDF 更小)。

8

翻译提示词

给 AI 的指令模板。默认「直译」,你可以改成「学术」「口语」「保留专业术语」等风格,支持多套预设,点「保存 / 新建 / 导入 / 导出」管理。改完点「保存」生效。

9

术语表

固定专业名词的翻法。比如 Transformer → Transformer(不译)token → 词元每个学科一份术语表,翻译前选对的一份。

10

Zotero 联动

把翻译好的 PDF 自动导入 Zotero 文献库。点「一键安装」装 Zotero 插件,配好后翻译完成会问你「是否导入 Zotero」。

11

打开数据目录

跳转到 ~/.config/pdf2zh/。出问题时把 config.jsonhistory.json 截图发给我们排查。不要手动改这两个文件,App 会覆盖。

API Key 在哪买? 直接跳到下面的 「买 API · 服务推荐」章节,列了每家服务的注册地址、价格、推荐场景。
PAGE 03

③ 阅读页 — 内置阅读器

翻译完成后会自动跳到这一页。左侧是历史记录,中间是 PDF 预览,右侧(点开后)是 AI 助手。关键功能:双语切换、AI 划词问答、跨译文高亮笔记

阅读页截图
1
2
3
4
5
6
7
8
9
10
11
1

翻译历史 + 缩略图 + 清空

左栏顶部。点「缩略图」切换列表/缩略图视图,点「清空」删除全部历史(不可逆,会问确认)。下方「全部 / 自建标签」按学科/项目分类。

2

历史记录列表

每翻译一份 PDF 自动添加一条。点击一条 = 直接打开该译文的 Side by Side 视图。右键可重命名、删除、移到分组。

3

Dual

双语对照模式:先一页原文,再一页译文,交替展示。适合精读 / 反复对照术语。

4

Mono

仅译文模式:只显示中文版。适合快速浏览全文掌握大意。

5

Side by Side

左右并排(默认):左原文右译文,滚动同步。最常用,推荐。

6

连续 / 单页

滚动行为切换。「连续」=网页式无限滚动,「单页」=一次显示一页(按 → 翻页)。

7

打开 + 翻页器

「打开」按钮:手动选别的 PDF。右边的 « < 1/N > » 是首页/上页/页码/下页/末页。

8

缩放滑块 + 150%

拖滑块调缩放比例(25%-300%),右边显示当前百分比。Cmd+滚轮也能缩放。

9

适宽 / 适页

「适宽」让 PDF 宽度撑满,竖向滚动;「适页」整页显示,左右居中。看公式多的论文用「适宽」。

10

AI 问答 / 高亮 / 全屏

AI 问答:右侧抽屉,划词问 AI 解释。高亮:选中文字加荧光笔,跨语言同步(高亮原文,译文版同位置自动高亮)。全屏:F 键切换沉浸阅读。

11

选择记录查看详情

预览区空时的提示。点左侧任一历史记录或翻译完成后自动加载,这块就会变成 PDF 预览。

AI 问答用法:在 PDF 预览里选中一段中文或外文 → 点右上「AI 问答」→ 在抽屉里直接问「这段什么意思」「这个公式怎么推导」「举个例子」。AI 会拿你选的文字 + 上下文一起回答。
PAGE 04

④ 关于页 — 反馈 & 支持

查看版本号、特性列表、跳转到 GitHub、加 QQ 群、看小红书支持者墙。出 bug 也从这里走。

关于页截图
1
2
3
4
5
6
1

版本与简介

左上角是当前版本号(v2.2.6)。下面是简短描述:「开箱即用的学术 PDF 翻译工具」。

2

macOS 版特性

列出本版本的核心能力:原生设计、深色模式、Dual/Mono/Side by Side、历史管理、智能分块、触摸板手势、术语表、AI 问答、Zotero 联动等。

3

小红书账号

「艾伦说」是项目作者的小红书号。发布更新预告、使用技巧、用户案例。点「关注」直接跳到主页。

4

GitHub ↗

跳转到 仓库主页。看 Release 页下载新版、看 Issue 报 bug、看 Star 涨了多少。

5

支持者墙

感谢所有在小红书互动 / Star / 反馈 bug 的朋友。每个圆圈代表一位用户(昵称首字母)。

6

进入 QQ 群

桌面交流群。这是最快得到帮助的地方 — 翻译异常、API 问题、功能建议丢群里,群主和老用户会回答。

SERVICE

买 API · 服务推荐

翻译需要调外部 AI 服务。每家服务都要去对应官网注册账号 → 充值 → 创建 API Key → 粘贴到设置页。下面按「场景」推荐,照着选不会错。

我该选哪家?

最便宜质量好
DeepSeek · 千 token ¥0.001 · 学术翻译质量最佳性价比,一篇 30 页论文约 ¥0.05
完全免费
Google 翻译 · 不要 Key · 但要稳定翻墙,且大文件容易被限流;适合临时小文件
国内不翻墙
通义千问 / 智谱 / DeepSeek · 国内服务商直连,速度最快,无需代理
质量最高
OpenAI GPT-4o · 文学性最好但贵 · 一篇 30 页论文约 ¥3-5 · 需海外信用卡或代理购买
学校或公司有内网模型
OpenAI 兼容 / Ollama 本地 · 自定义 Base URL,连任何 OpenAI-API 兼容服务(vLLM / Xinference / Ollama)

主流服务清单

D
DeepSeek
最推荐

国产大模型 · 学术翻译质量第一档 · 千 token ¥0.001(输入),¥0.002(输出) · 注册送 ¥10 额度可翻 200 篇论文 · 模型选 deepseek-chat

Q
通义千问 (DashScope)
国内优选

阿里云出品 · 稳定速度快 · 千 token ¥0.0008-0.012(按模型档位)· 注册送大量免费额度 · 推荐模型 qwen-plus / qwen-max

Z
智谱 ChatGLM

清华系 · GLM-4 系列 · 千 token ¥0.001(GLM-4-Flash 免费档)· 注册送资源包 · 适合预算敏感大量翻译。

O
OpenAI

质量天花板 · GPT-4o-mini 性价比可以 · 千 token $0.00015(输入)· 但需海外信用卡充值,国内信用卡多被风控。

G
Google Gemini

Gemini 1.5 Flash 免费档每分钟 15 请求 · 长文本能力强(2M token 窗口)· 国内需翻墙 · 用 Google 账号即可申请 Key。

S
SiliconFlow 硅基流动

国内 LLM 聚合中转 · 一个 Key 调 20+ 模型(DeepSeek/Qwen/Yi/Llama)· 价格对齐源厂 · 注册送 ¥14 体验金。

D
DeepL

欧系翻译质量第一 · 但学术领域不如 LLM · 月 50万字符免费 · 注册需海外手机号或信用卡 · 不支持公式术语保留。

F
Google 翻译
免费

不需要 Key,但需要稳定翻墙环境。质量一般,大文件容易被限流。仅用于第一次试用流程,正式用强烈建议切到 LLM 服务。

OpenAI 兼容 / 自建

设置页选「OpenAI-liked」,Base URL 填你自己的 vLLM/Xinference/Ollama 地址(如 http://localhost:11434/v1)。完全本地,零成本,质量看你跑的模型。

第一次充值前先小额试用:每家都先充 ¥10 / $5,跑两篇论文确认翻译质量、速度、计费方式都符合预期,再决定是不是大额充值。API Key 永远只放本地,不要发到群里、邮件里、GitHub 仓库里。
OCR

扫描版 PDF · 文字层补全方案

如果你的 PDF 是扫描件(图片型,选不了文字、复制不出来),翻译页的「OCR 识别」勾选框只能做非常基础的文字识别,对复杂版面、公式、表格、多栏论文识别率低。强烈建议先用专业 OCR 软件给 PDF 加一层文字层,再回到 pdf2zh 翻译,效果天差地别。

A
ABBYY FineReader
最准

业界标杆 · 中英日多语种 · 公式识别可用 · 表格保留结构 · macOS 版 ¥1300/年 · 大量论文 OCR 必备。

A
Adobe Acrobat Pro

Acrobat Pro DC 自带 OCR · 「工具 → 增强扫描」一键加文字层 · ¥130/月订阅 · 已有 Adobe 全家桶的人首选。

B
白描 / Text Scanner (Mac)
便宜好用

App Store 搜「白描」· ¥38 买断 · 中文 OCR 准 · 拖入 PDF 一键识别导出可搜索 PDF · 小批量论文足够。

T
OCRmyPDF (开源)
免费

Tesseract 内核 · 命令行 · brew install ocrmypdf 然后 ocrmypdf in.pdf out.pdf · 中文加 -l chi_sim+eng

P
PDFgear / PDF24
免费

免费 PDF 工具箱内置 OCR · 中等准度 · 适合一两个文件临时用 · 都有 macOS 版。

B
百度 / 腾讯 OCR API

通用文字识别 + 公式识别 API · 千次 ¥0.5-2 · 需要自己写脚本调用 → 拼回 PDF · 适合开发者批量处理。

推荐工作流:
  1. 扫描 PDF → 用 白描 / ABBYY / OCRmyPDF 加文字层 → 输出新 PDF
  2. 用 Acrobat / Preview 打开新 PDF,确认能选中文字、能复制
  3. 把这个新 PDF 拖进 pdf2zh-desktop · 不勾「扫描版 PDF」「OCR 识别」
  4. 正常翻译 — 这时候得到的版式、公式、术语效果就跟原生 PDF 一样好
FAQ

常见问题

翻译卡在 0% 不动?

通常是 API Key 没配 / 配错。回设置页点「测试连接」验证。免费 Google 翻译需要稳定翻墙环境。

大文件提示限流 / 失败?

翻译页勾「分块翻译」,每块 50 页,间隔 10 秒。或线程数从 16 调到 4-8。免费服务尤其需要。

公式翻乱 / 字符错位?

v2.2.5+ 已修复 MS-Mincho 误判 / DeepSeek 注释抑制。如果仍异常,关掉「AI 布局检测」试试。

App 打开闪退 / 崩溃?

删掉 ~/.cache/babeldoc,再重新打开(会重新下载字体)。还不行去 GitHub Issue 贴日志:~/Library/Logs/pdf2zh-desktop/

翻译质量不如预期?

服务从 Google 切到 DeepSeek/通义千问,质量提升明显。设置页加术语表,固定专业名词译法。

能翻日文 / 德文 / 俄文吗?

能。翻译页改「源语言」为对应语种。模型默认都支持 50+ 语言互译。

能翻成英文 / 日文吗?

能。翻译页改「目标语言」即可。中→英、英→日都很常见。

翻译历史在哪?怎么备份?

阅读页左栏 = 历史。原始数据:~/.config/pdf2zh/history.json。备份这个文件即可。

API Key 安全吗?

本地存 base64 + 文件权限 600,不上传服务器。如果担心源码可在 GitHub 仓库审计 config_manager.py