PDF 文件翻譯神器升級:PDFMathTranslate Next 免部署版使用教學


去年我寫過一篇文章,介紹過 PDFMathTranslate 這款 PDF 全文雙語翻譯工具

那時候我對它的印象很好。因為它不是單純把 PDF 轉成純文字再丟去翻譯,而是專門針對 PDF 裡面的公式、圖表、排版、段落結構做處理。對常常需要閱讀論文、技術手冊、醫學資料、英文講義的人來說,這類工具真的很有用。

但老實說,去年那個版本對一般使用者還是有一個門檻。

當時我自己是用 Miniconda 來部署,流程大概是建立 conda 環境、安裝套件、啟動虛擬環境,然後再用命令列把 WebUI 跑起來。對有碰過 Python 的人來說,這不算太難。可是對只是想翻譯 PDF 的一般使用者來說,這一段可能就先被勸退。

你只是想翻譯一份 PDF,結果前面先叫你學 conda、環境變數、API key、model name......工具本身很好,但很多人會卡在「還沒開始用工具之前」就先被嚇到。

這次新版 PDFMathTranslate Next 最大的差異,就是它已經有 Windows 免安裝執行檔。對一般使用者來說,這個改變就很便利。你不用先學 Python,也不用先維護 Conda 環境,只要下載、解壓縮、雙擊 pdf2zh.exe,就可以立刻開啟本機 WebUI 來翻譯 PDF。

如果去年我會把它歸類成「很強,但比較適合願意折騰的人」,那現在我會比較願意把它推薦給一般進階使用者。尤其是平常真的會大量看外文 PDF 的人。

PDFMathTranslate 到底是在解決什麼問題?

一般翻譯工具遇到 PDF,最麻煩的地方不是翻譯文字本身,而是 PDF 的版面。

一份普通文章還好。可是如果是論文、技術手冊、醫學文件,裡面常常會有:

  • 數學公式
  • 表格
  • 圖說
  • 兩欄式排版
  • 註解
  • 目錄
  • 參考文獻
  • 特殊字型

如果你直接複製文字去翻譯,常常會發現段落亂掉、公式亂掉、表格亂掉。更麻煩的是,有些 PDF 複製出來的文字順序本來就不對。

PDFMathTranslate 的價值就在這裡。

它會先分析 PDF 版面,盡量保留原本的公式、圖表、目錄與註解,再把需要翻譯的文字送到你指定的翻譯服務。最後它會輸出新的 PDF,通常可以產生兩種版本:

  • Mono:單語翻譯版
  • Dual:雙語對照版

官方對 PDFMathTranslate Next 的定位也很明確,就是針對 PDF scientific paper translation and bilingual comparison,也就是 PDF 科學文件翻譯與雙語對照。它背後是基於 BabelDOC,官方也說這個專案是呼叫 BabelDOC 進行 PDF 翻譯的參考實作。

所以這裡要先提醒一下:PDFMathTranslate 主要處理的是 PDF。它不是 Word、PowerPoint、Excel 的通用文件翻譯器。如果你要翻譯 Word 或簡報,通常要先轉成 PDF,再交給它處理。

PDFMathTranslate bilingual PDF output example


相較去年舊版,新版最有感的更新

這次我看新版 PDFMathTranslate Next,最有感的不是某一個小功能,而是整體使用門檻下降很多。

1. Windows 可以直接用免安裝版

以前要自己建立 Python 或 Conda 環境。現在 Windows 使用者可以直接到 GitHub Releases 下載 zip。

官方建議第一次使用可以下載 with-assets-win64.zip 版本。這個版本會把字體、模型等資源一起包好。檔案比較大,但比較不容易在第一次啟動時因為網路問題卡住。

對一般使用者來說,這件事很重要。因為很多工具不是功能不強,是前面安裝階段就讓人放棄。

2. 預設就有 SiliconFlowFree

新版預設服務是 SiliconFlowFree。簡單講,就是你可以先不用填 API key,也能開始測試翻譯。

這對第一次使用很友善。你可以先拿一份不敏感的 PDF 試跑,看看版面、速度、翻譯品質大概如何。等你確定這個工具真的適合你,再考慮要不要接自己的 API。

不過這裡也要講清楚:只要你用雲端翻譯服務,文件文字就會送到外部服務處理。如果是公司機密、病人資料、合約、未公開研究資料,就不要直接拿免費雲端服務測。

3. 可搭配的 AI 服務更多

新版可用的服務供應商比去年更完整。

目前在程式設定裡可以看到不少翻譯引擎,例如 OpenAI、Google、Bing、DeepL、DeepSeek、Ollama、Xinference、AzureOpenAI、ModelScope、Zhipu、SiliconFlow、SiliconFlowFree、Tencent、Gemini、Azure、AnythingLLM、Dify、Grok、Groq、QwenMt、OpenAICompatible、AliyunDashScope、ClaudeCode、CLITranslator 等。

這裡我最在意的是 OpenAICompatible。

因為現在很多免費或高 CP 值的雲端 API,都會提供類似 OpenAI 的呼叫格式。只要工具支援 OpenAI-compatible provider,通常就有機會把這些服務接進來。這一點可以搭配我之前整理的 免費與高 CP 值雲端 API 來源 來看。

4. GUI 介面更完整

新版 WebUI 有幾個對日常使用很有幫助的改進。

例如支援多檔上傳、批次下載 zip、介面在地化、設定保存、rate limit 設定、術語表上傳、自動術語擷取等。

這些功能會讓工具更像一個可以長期使用的工具,而不是只拿來試一次的 demo。

5. PDF 進階處理選項更多

新版也把 BabelDOC 的進階選項暴露得更完整。

你可以針對掃描 PDF、表格文字、短行分段、富文字翻譯、快取、浮水印、雙語輸出方式等做調整。

如果只是翻一般 PDF,你不用一開始就改這些設定。但如果你遇到某份 PDF 翻譯後版面怪怪的,這些選項就很有用。

PDFMathTranslate Next WebUI upload screen

如何下載與啟動 PDFMathTranslate Next

如果你是 Windows 一般使用者,我會建議先走官方免安裝版。

步驟如下:

  1. 前往 PDFMathTranslate Next Releases
  2. 找到最新版。
  3. 下載檔名類似 pdf2zh-v版本號-BabelDOC-版本號-with-assets-win64.zip 的檔案。
  4. 解壓縮 zip。
  5. 進入解壓縮後的 pdf2zh 資料夾。
  6. 雙擊 pdf2zh.exe
  7. 等待約半分鐘到一分鐘。
  8. 瀏覽器通常會自動開啟 WebUI。
  9. 如果沒有自動開啟,可以手動打開 http://localhost:7860/

如果雙擊後完全打不開,官方文件建議安裝 Microsoft Visual C++ Runtime,也就是 VC Runtime。這類問題通常不是 PDFMathTranslate 本身壞掉,而是 Windows 缺少執行時期元件。

PDFMathTranslate Next installation and usage page

設定畫面逐項說明

接下來我用一般使用者的角度,依照設定畫面順序說明。

這裡不用急著全部改。第一次使用時,我反而建議先用預設值跑一份測試 PDF。等你知道工具怎麼運作,再慢慢調整。

介面語言

這是 WebUI 的顯示語言。

如果你主要用繁體中文,可以選繁體中文。這只影響介面顯示,不等於翻譯目標語言。

翻譯目標語言要看 Translate to 或目標語言欄位。一般英文 PDF 翻成中文時,可以選繁體中文。

服務(供應商)

這是最重要的設定之一。

PDFMathTranslate 本身負責 PDF 版面處理,但文字要送給哪個翻譯引擎,就看這裡。

如果你第一次用,可以先選 SiliconFlowFree。優點是不用 API key,馬上可以測。缺點是你比較不能控制模型、費率、穩定性與資料流向。

如果你已經有自己的 API key,可以改用其他服務。

我會這樣分:

  • 想最簡單:SiliconFlowFree
  • 想接自己的低成本雲端 API:OpenAICompatible
  • 想用 Google 生態:Gemini
  • 想追求速度:Groq
  • 想用阿里 Qwen 系列:QwenMt 或 AliyunDashScope
  • 想保護隱私:Ollama 或 LM Studio 類本地模型
  • 想用專業翻譯服務:DeepL

SiliconFlowFree 的 JSON mode

畫面上會看到 SiliconFlowFree 的 JSON mode。

JSON mode 的用途,是希望模型用比較固定的格式回傳結果。理論上它可以降低解析錯誤,但不同服務支援程度不同。

第一次使用我建議先關閉。除非你發現翻譯結果常常格式不穩,或官方文件特別建議再打開。

自動術語擷取

Auto Term Extraction 是新版很值得注意的功能。

它會先從文件中擷取可能需要一致翻譯的專有名詞,像是醫學名詞、工程名詞、研究方法、產品名稱等,再把這些術語用在後續翻譯。

如果你的 PDF 是論文、白皮書、技術手冊,這個功能很有價值。因為同一個專有名詞在整份文件中翻得一致,閱讀體驗會好很多。

但它也會增加處理時間。因為工具要先做一次術語擷取,再進入主要翻譯流程。

我的建議是:

  • 想快速看懂大意:先關閉
  • 論文、醫學、技術文件:可以開啟
  • 正式要保存或分享的翻譯稿:建議開啟

術語擷取引擎

Term extraction engine 是自動術語擷取要使用哪個翻譯引擎。

如果你不想多想,可以選 Follow main translation engine,也就是跟主要翻譯引擎相同。

如果你想省成本,也可以把主要翻譯用比較好的模型,術語擷取用比較便宜的模型。但初學者不需要一開始就這樣拆。

Rate Limit Mode

這裡是在控制請求速度。

很多 API 服務都有速率限制。你送太快,就可能被擋、報錯、重試,最後反而更慢。

畫面常見三種模式:

  • RPM (Requests Per Minute):每分鐘請求數
  • Concurrent Requests:同時請求數
  • Custom:自己設定 QPS(每秒查詢數)與 worker

如果你的 API 供應商有明確寫 RPM,可以用 RPM。
如果它只告訴你同時連線數,可以用 Concurrent Requests。
如果你已經知道自己要怎麼調,就用 Custom。

我自己的建議是,新手先保守一點。

如果你接的是免費 API,先從 QPS 1 到 2 開始。不要一開始就把速度拉很高。PDF 翻譯會切很多段文字送出,長文件很容易碰到 rate limit。

如果供應商已經明確給你 RPM 限制,例如每分鐘 20 次 request,那就直接選 RPM 模式,不要硬改成 QPS 1。因為 QPS 1 等於每分鐘 60 次請求,反而可能超過免費 API 的限制。

QPS 與 Pool Max Workers

QPS(每秒查詢數)是每秒送出多少請求。

Pool Max Workers 是最多同時有多少工作執行緒。

簡單講,數字越高,理論上越快,但也越容易撞到 API 限制。

一般使用者可以這樣抓:

  • 免費 API:QPS 1 到 2,Pool Max Workers 1 到 2
  • 付費 API:依供應商額度調整,可以從 QPS 3 到 5 測
  • 內建 SiliconFlowFree:通常先用預設值
  • 本地模型:取決於你的電腦效能,筆電不建議開太高

如果你看到錯誤訊息、翻譯中斷、429 rate limit,第一件事不是換工具,而是先把 QPS 降低。

Pages 頁面範圍

這裡決定要翻譯哪些頁面。

常見選項有:

  • All:整份 PDF
  • First:第一頁
  • First 5 pages:前五頁
  • Range:指定範圍

我強烈建議第一次不要直接翻整本。

先選 First 5 pages。確認翻譯品質、版面、速度都可以,再切回 All。這樣比較不會浪費時間,也比較不會消耗不必要的 API 額度。

如果你只需要某一章,可以用 Range。例如 1,3,5-10 這種格式。

僅在輸出 PDF 中包含已翻譯的頁面

這個選項通常跟頁面範圍一起使用。

如果你只翻第 10 到 20 頁,開啟這個選項後,輸出 PDF 只會包含這些頁。關閉時,輸出結果可能保留更多原始頁面結構。

如果你只是測試前五頁,可以開啟。
如果你希望輸出檔仍然比較接近原始 PDF 的完整結構,可以關閉。

PDFMathTranslate Next basic settings screen


PDF 輸出選項

停用單語輸出

單語輸出就是只保留翻譯後文字的 PDF。

如果你只想要雙語對照,可以勾選停用單語輸出,這樣可以少產一個檔案,也可能節省一點輸出處理時間。

停用雙語輸出

雙語輸出會保留原文與譯文對照。

如果你只想看翻譯後結果,可以停用雙語輸出。不過我通常建議保留雙語輸出,尤其是專業文件。因為譯文有時候會出錯,有原文對照比較容易校正。

在雙語模式中將已翻譯頁面置於優先

這會影響雙語 PDF 裡原文與譯文的排列順序。

如果你希望先看到中文,再回頭對原文,可以開啟。
如果你習慣先看原文,再看譯文,可以關閉。

使用交錯頁面進行雙頁 PDF 處理

這是雙語輸出的另一種排列方式。

有些人喜歡第 1 頁原文、第 1 頁譯文、第 2 頁原文、第 2 頁譯文這樣交錯閱讀。這樣比整份原文後面接整份譯文更好對照。

如果你的主要用途是閱讀與校對,我會建議可以試試這個模式。

Watermark mode

浮水印模式可以選 Watermarked 或 No Watermark。

如果只是自己閱讀,我會選 No Watermark。
如果你要尊重工具來源、保留工具標記,或是公開分享時想保留生成來源,可以選 Watermarked。

PDFMathTranslate Next PDF output options


進階選項

自訂系統提示

Custom System Prompt 可以讓你指定翻譯風格。

例如你可以要求:

You are a professional Traditional Chinese translator. Please translate into fluent zh-TW and keep technical terms accurate.

如果翻譯學術論文,也可以加上「保持專有名詞一致」、「不要改寫公式」、「保留英文縮寫」這類要求。

但我建議不要一開始就寫太長。提示詞太複雜,有時反而會讓模型自由發揮太多。

最小翻譯文字長度

這個欄位決定多短的文字才要送去翻譯。

預設值通常可以保留。
如果設太低,可能連頁碼、單字、符號都送去翻譯,增加成本。
如果設太高,短標題或圖表文字可能漏翻。

一般我會先保留 5。

儲存自動擷取的詞彙表

如果你開啟自動術語擷取,可以勾選這個選項,把擷取出的 glossary 存下來。

這對常常翻同一領域文件的人很有用。像是你常翻醫學、法規、工程文件,累積下來的術語表可以重複使用。

翻譯文字的主要字型系列

這個選項會影響翻譯後文字使用的字型風格。

一般使用 Auto 就好。
如果你的文件有很明確的排版需求,例如論文希望看起來更像正式出版格式,再考慮 serif 或 sans-serif。

Glossary File

這裡可以上傳術語表 CSV。

格式通常會有 source 與 target 欄位,例如:

source,target
machine learning,機器學習
large language model,大型語言模型
randomized controlled trial,隨機對照試驗

如果你的 PDF 是專業文件,這個功能很實用。

舉例來說,同一個 term 在整份文件裡不要一下翻「試驗」、一下翻「實驗」、一下翻「測試」。術語表可以幫你把翻譯固定下來。

PDFMathTranslate Next advanced options


PDF 選項

跳過清理

Skip clean 可能改善某些 PDF 的相容性。

如果你翻譯後發現版面亂掉、文字消失、輸出失敗,可以試著開啟。一般情況先不要動。

停用富文字翻譯

Disable rich text translation 也偏向相容性選項。

如果 PDF 裡面有很多特殊字型、粗體、斜體、複雜格式,富文字處理有時會讓版面更接近原文,但也可能造成某些 PDF 出問題。

一般先關閉。遇到問題再開。

翻譯表格文字

Translate table text 是實驗性功能。

如果你的 PDF 有大量表格,可以測看看。
但表格是 PDF 翻譯裡很容易翻車的區域。建議先用 First 5 pages 或指定頁面測試,不要一開始就整份跑。

強制將短行分割為不同段落

有些 PDF 版面會讓文字看起來是一段,但底層其實被切成很多短行。

這個選項會影響短行怎麼分段。
如果你發現翻譯後段落合併怪怪的,或句子順序不自然,可以試著調整。

一般先保持預設。

跳過掃描偵測

Skip scanned detection 會跳過工具對掃描 PDF 的偵測。

如果你的 PDF 是真正的文字型 PDF,可以開啟來節省一點處理時間。
如果你的 PDF 是掃描圖檔,或你不確定它是不是文字型 PDF,就不要開。

OCR workaround

這是針對掃描型文件或文字顯示異常的 workaround。

如果翻譯後文字顏色、背景、可讀性出問題,可以測。
一般數位 PDF 先不要開。

自動啟用 OCR workaround

這個選項會讓工具在偵測到嚴重掃描文件時,自動啟用 OCR 相關 workaround。

如果你常處理掃描 PDF,可以試。
如果你主要處理論文 PDF、電子手冊、下載型 PDF,先關閉也可以。

每個部分的最大頁數

Max pages per part 是用來控制長文件分段處理。

長 PDF 如果一次處理太大,容易耗時、失敗、或 API 用量爆掉。可以設定每段最多幾頁,讓工具分批處理。

如果你的 PDF 超過 100 頁,可以考慮設定 20 到 50 頁。一般文件可以先留空或 0。

用於識別公式文字的字型模式與字元模式

這兩個是進階正規表示式設定,用來協助判斷哪些文字可能是公式。

如果你不是在修特定 PDF 的公式判斷問題,不建議改。
改錯可能會讓正常文字被當成公式,或公式被當成一般文字送去翻譯。

忽略快取

Ignore cache 會強制重新翻譯。

一般不要開。快取可以節省時間與 API 額度。

只有在你換了模型、換了 prompt、或想重新產生結果時,再勾選忽略快取。

PDFMathTranslate Next PDF options


BabelDOC 進階選項

這一區通常不是新手一開始要改的地方。

合併交替行號

有些學術文件或法律文件會有行號。PDF 解析時,行號可能跟正文交錯在一起。

如果你發現翻譯結果一直把行號混進句子,可以試著開啟。

跳過公式偏移計算

這是跟公式排版位置有關的選項。

如果你的文件公式很多,而輸出位置怪怪的,可以測。但一般文件先不要動。

非公式行 IoU 閾值

這是判斷文字行與版面區域重疊程度的技術參數。

我會建議一般使用者保留預設。除非你很明確知道某份 PDF 的行判斷有問題。

圖表保護閾值

這個會影響圖、表內的線條或文字是否被處理。

數值調太激進,可能會處理到不該動的圖表內容。
數值太保守,又可能漏掉一些表格文字。

一般先保留預設。如果你的 PDF 表格很多,可以搭配「翻譯表格文字」一起小範圍測試。

移除非公式行

這也是偏進階的排版處理選項。

除非你在處理某些特殊 PDF,發現有大量干擾線條或錯誤文字,不然不建議一開始就改。

PDFMathTranslate Next BabelDOC advanced options


服務供應商設定範例

這一段我會搭配前面介紹過的免費或高 CP 值 API 來源來看。

PDFMathTranslate 這類工具很適合接便宜、快速、可大量處理文字的模型。因為 PDF 翻譯不是只問一次問題,它會把文件切成很多段落分批送出。

所以你要看的不是模型排行榜而已,還要看:

  • 價格
  • 免費額度
  • rate limit
  • 回應速度
  • 是否支援 OpenAI-compatible API
  • 是否允許你的使用情境
  • 文件內容能不能送到雲端

範例一:最簡單的 SiliconFlowFree

適合對象:第一次測試、不想申請 API key、只想先看看效果的人。

設定方式:

  • Service:SiliconFlowFree
  • JSON mode:先關閉
  • Pages:First 5 pages
  • Rate limit:先用預設
  • Output:保留雙語輸出

這是最簡單的路線。拿一份不敏感的 PDF 試跑,很快就知道這個工具適不適合你。

範例二:OpenAICompatible 接 Agnes AI

我之前寫過 Agnes AI 免費 API 實測。Agnes AI 的好處是支援 OpenAI 相容格式,所以可以用 OpenAICompatible 的概念接進很多工具。

在 PDFMathTranslate Next 裡,可以這樣設定:

  • Service:OpenAICompatible
  • Base URL:https://apihub.agnes-ai.com/v1
  • API Key:填入 Agnes AI 控制台建立的 API Key
  • Model:agnes-2.0-flash
  • JSON mode:第一次測試先關閉
  • Rate Limit Mode:RPM
  • RPM:20
  • Term RPM:如果有開啟自動術語擷取,也先設 20;如果想保守一點,可以先設 10 到 15
  • Pool Max Workers:如果系統有自動換算,可以先不用手動調;若遇到錯誤,就把併發降到 1

這個設定適合拿來做低成本測試。不要一開始就丟 200 頁 PDF。先用前五頁確認翻譯品質與速度,再決定要不要跑整份。

如果翻譯時遇到 429 rate limit,或是中途一直重試,就把 RPM 從 20 降到 15,甚至 10。免費 API 最怕的不是慢一點,而是送太快被限流,最後反而更慢。

OpenAICompatible 欄位怎麼看?以 LM Studio 為例

OpenAICompatible 這一區欄位比較多,新手第一次看到可能會有點不知道哪些要填。

如果你只是要接一般 OpenAI-compatible 服務,真正最重要的是三個欄位:

  • Model:模型名稱
  • Base URL:API 服務入口
  • API Key:金鑰

其他欄位多半可以先留空,等你真的遇到問題再調。

以 LM Studio 來說,官方 OpenAI-compatible 文件的概念就是:把原本指向 OpenAI 伺服器的 Base URL,改成你本機 LM Studio server 的位置。預設 port 通常是 1234,所以在 PDFMathTranslate Next 裡可以這樣填:

  • OpenAI Compatible model to use:填 LM Studio 當下載入模型的 model identifier,例如 google/gemma-3-4b-it 這類名稱,不要照抄畫面預設的 gpt-4o-mini
  • Base URL for OpenAI Compatible service:http://localhost:1234/v1
  • API key for OpenAI Compatible service:如果 LM Studio 沒有開啟 Require Authentication,可以填 lm-studio 或任意非空字串;如果你有在 LM Studio server settings 裡啟用 API token,就填那組 token
  • Timeout:本地模型比較慢時可以填 300600 秒;如果模型很小、速度很快,可以先留空
  • Temperature:一般翻譯可以填 00.2,讓輸出穩定一點;但要搭配下方「Send temperature」才會送出
  • Reasoning effort:先留空,除非你確定目前模型與 LM Studio endpoint 支援這個參數
  • Send temperature:只有你上面有填 Temperature,而且想明確把溫度送給模型時再勾
  • Send reasoning effort:一般不要勾,除非你知道模型支援
  • Enable JSON mode:第一次測試先不要勾,本地模型對 JSON mode 的穩定度不一定一致

這裡要注意一個小地方:localhost 只有在 PDFMathTranslate 和 LM Studio 跑在同一台電腦時才適用。如果你把 PDFMathTranslate 放在 Docker、WSL 或另一台電腦上,就要改成它能連到 LM Studio 的 IP 或 host。

LM Studio 這條路線的好處是文件內容不必送到雲端。缺點是速度取決於你的電腦硬體和模型大小。如果只是要測本地翻譯,我會先用小一點的模型,Rate Limit Mode 選 Custom,QPS 設 1,Pool Max Workers 設 1。確認穩定後,再慢慢加到 2。

範例三:Gemini

如果你本來就有 Google AI Studio 或 Gemini API key,可以選 Gemini。

設定概念很單純:

  • Service:Gemini
  • API Key:填入 Google AI Studio 建立的 key
  • Model:填入官方後台目前提供的 model ID
  • JSON mode:初次測試先關閉
  • QPS:依你的額度保守設定

這裡要提醒一下,model name 不要憑印象打。很多工具設定失敗,不是 API key 錯,而是 model ID 差一個字。

範例四:Groq

Groq 的優點通常是速度快,很適合大量短文字請求的場景。

設定方式:

  • Service:Groq
  • Groq API Key:填入自己的 key
  • Groq model:從 Groq 後台複製可用 model ID
  • QPS:先保守測

如果你的 PDF 很長,速度快會很有感。但一樣要注意 rate limit。送太快不一定真的比較快,因為被限流後會重試。

範例五:LM Studio 或 Ollama 本地模型

如果文件內容敏感,我會優先考慮本地模型。

LM Studio 可以啟動 OpenAI-compatible server。常見設定是:

  • Service:OpenAICompatible
  • Base URL:http://localhost:1234/v1
  • API Key:未開啟驗證時可填 lm-studio;若有開 API token,就填 token
  • Model:填入 LM Studio 當下載入模型的 model identifier
  • Timeout:本地模型較慢時可填 300600
  • JSON mode:第一次測試先關閉
  • Rate Limit Mode:Custom
  • QPS:1
  • Pool Max Workers:1

Ollama 則可以直接選 Ollama:

  • Service:Ollama
  • Ollama host:http://localhost:11434
  • Model:填入你已經拉好的模型名稱

本地模型的優點是隱私與不用按 token 計費。缺點是速度與品質會受電腦硬體影響。筆電如果沒有足夠 GPU,長文件翻譯可能會很慢。


實際翻譯一份 PDF 的建議流程

我會建議用這個流程:

  1. 先準備一份不敏感的 PDF。
  2. 啟動 pdf2zh.exe
  3. 打開 WebUI。
  4. 介面語言選繁體中文。
  5. 目標語言選繁體中文。
  6. Service 先選 SiliconFlowFree,或選你自己的 API provider。
  7. Pages 先選 First 5 pages。
  8. PDF output 先保留雙語輸出。
  9. Auto Term Extraction 如果只是測速度可以先關閉。
  10. 按下 Translate。
  11. 等待處理完成。
  12. 下載 Dual PDF。
  13. 檢查公式、圖表、段落、頁面順序。
  14. 沒問題後,再改成 All 跑整份文件。

這個流程看起來多一步,但會省很多時間。

不要一開始就拿 300 頁 PDF 直接跑。萬一 provider 設錯、model name 填錯、QPS 太高、PDF 本身解析有問題,你會等很久才發現方向錯了。

先跑前五頁,確認可行,再跑整份。這是最穩的做法。


PDFMathTranslate Next PDF preview before translation

PDFMathTranslate Next translation progress screen

PDFMathTranslate Next translation result screen

使用時要注意的幾個小陷阱

1. PDFMathTranslate 主要還是 PDF 工具

它不是萬用文件翻譯器。

如果你要翻 Word、PPT、網頁、圖片,通常要先轉成 PDF。它的輸出也主要是 PDF。

2. 雲端 API 會處理你的文件文字

只要你選雲端服務,文件內容就會送出去。

如果資料敏感,請改用本地模型,或確認公司與供應商政策允許。

3. 掃描 PDF 不一定適合直接翻

如果 PDF 其實是圖片掃描檔,翻譯效果會不穩。

你可以測 OCR workaround,但不要期待每一份掃描 PDF 都能完美處理。

4. 翻譯速度不是只看模型

很多人會以為換更快模型就一定快。

其實 PDF 翻譯速度還跟 PDF 頁數、版面複雜度、切段數量、API rate limit、網路狀況、是否開啟術語擷取有關。

如果覺得慢,先看這幾個地方:

  • 是否開啟 Auto Term Extraction
  • QPS 是否太低或太高
  • 是否同時輸出 Mono 與 Dual
  • PDF 是否太大
  • 是否用了本地小模型
  • 供應商是否限流
Groq API rate limit dashboard example

這次新版最值得推薦給誰?

我會推薦給這幾類人:

  • 常看英文論文的研究生
  • 需要讀技術文件的工程師
  • 需要看國外 guideline 或醫學文獻的人
  • 常看 PDF 講義、白皮書、產品手冊的人
  • 想把外文 PDF 快速轉成雙語對照稿的人
  • 不想維護 Conda 或 Python 環境的人
  • 想測不同 AI API 翻譯品質的人

如果你只是偶爾翻一小段文字,用一般翻譯工具就好。
如果你常常面對整份 PDF,尤其是排版複雜的 PDF,那 PDFMathTranslate Next 就很值得試。

PDFMathTranslate translated PDF comparison output

結語:這次升級讓 PDFMathTranslate 更接近一般使用者

我自己最有感的地方,是它從「需要懂一點部署的人比較好上手」,變成「一般使用者也可以直接試」。

去年我介紹 PDFMathTranslate 時,還需要帶大家建立 conda 環境、安裝套件、下指令啟動。現在官方有免安裝版,這件事就簡單很多。

再加上這一年免費與高 CP 值 API 供應商變多,OpenAI-compatible 也越來越普遍,PDFMathTranslate Next 的可玩性比以前高很多。

你可以先用 SiliconFlowFree 快速測。
你也可以接 Agnes AI、Gemini、Groq、SiliconFlow、Qwen、Ollama、LM Studio。
你還可以針對術語、頁面範圍、輸出格式、表格、掃描文件慢慢調。

以前它比較像給進階玩家的 PDF 翻譯工具。現在它比較像一個一般使用者也能放進工具箱的 AI PDF 翻譯助手。

如果你平常真的常看外文 PDF,我會建議你至少下載免安裝版,拿一份不敏感的 PDF 跑前五頁看看。很多工具或許不用看太多介紹,自己跑一次就知道有沒有用。


📌您可能也會有興趣的其他文章

官方參考連結

留言

熱門文章

Notebook LM 語音轉文字完整教學:免費、快速又省力的最佳解法

ChatGPT 專案對話打不開?「Unable to load conversation」教你一招解決!

從靜態簡報到全場互動:講師必備的 4 大即時投票系統推薦與使用技巧

打造數位分身:F5-TTS 本地部署教學與語音克隆應用分享

用AI一鍵生成簡報PPT投影片真的有那麼神?全網最詳細AI簡報工具彙整與實測心得

不是主持人也能做筆記!Otter.ai、Notta.ai 線上會議即時轉錄逐字稿完整教學

用手機接續操作電腦版 Codex:codexUI 與 Windows 快速啟動器實作

G6PD 缺乏者的抗生素選擇指南|社區診所常見處方與藥師建議一次搞懂

GLP-1 減重針安全嗎?瘦瘦針機轉、效果、副作用一次看懂

快速又免費的語音轉文字神器『Faster Whisper』,一鍵解決影音內容爆量時代的痛點!