ChatGPTBox：在瀏覽器選取文字後，直接用 AI 快問快答、翻譯與摘要

作者：亞瑟 6月 04, 2026

我們現在接收新資訊，很大一部分都在瀏覽器裡面完成。

看新聞、查技術文件、讀國外文章、看 GitHub 專案、查產品說明，很多時候我們不是要做很完整的研究，只是想快速搞懂某個名詞是什麼、某段話在講什麼，或是把一小段文字翻譯、摘要一下。

早些年遇到不懂的名詞或概念，我們大多會把關鍵字複製起來，貼到 Google、Bing 這類搜尋引擎查詢。這種做法到現在還是很有用，尤其是要找來源、找資料、查官方文件的時候。

只是這幾年有了 AI 以後，很多人開始習慣直接問 AI。最直覺的做法，就是把文字複製起來，打開 ChatGPT、Gemini、Claude 或其他 LLM（大型語言模型）的 WebUI，貼上去問。

這樣當然可以，但操作上有一點麻煩。

如果只是查一個名詞、翻譯一句話、摘要一小段內容，每次都要切換分頁、複製、貼上、送出，最後還留下一堆零碎的對話紀錄。久了以後，自己的 AI 對話列表也會變得很亂。

進階一點的用法，是打開瀏覽器側邊欄，例如 Chrome 的 Gemini、Edge 的 Copilot，或其他第三方 AI 側邊欄外掛。這類工具已經比純手動複製貼上方便很多，但在一些很小的任務上，仍然有點偏重。

所以我後來就會想，有沒有一種方式可以更像翻譯外掛？

就像沉浸式翻譯、Google 翻譯、DeepL 翻譯那樣，我在網頁上直接選取一段文字，就能在同一個畫面快速取得解釋、翻譯、摘要，必要時再追問一下。

這次要介紹的 ChatGPTBox，就是很接近這個需求的一款瀏覽器外掛。

ChatGPTBox 是什麼？

ChatGPTBox 是一款瀏覽器擴充功能。

它的名字叫 ChatGPTBox，但實際上不只限於 ChatGPT。它可以搭配不同的 AI 使用方式，也支援自訂 API address。換句話說，你可以使用網頁版 LLM 模型，也可以依照自己的需求串接 OpenAI-compatible API 模型。

它的重點很簡單：把 AI 問答放進瀏覽器的使用情境裡。

你在網頁上看到一段不懂的文字，可以直接選取起來，用浮動工具或右鍵選單請 AI 解釋。你看到一段外文，可以請它翻譯。你看到一大段內容，可以請它摘要。你如果想針對這段文字繼續問，也可以直接追問。

這個使用情境很適合處理那些「小而頻繁」的問題。

而且很多問題其實是「用過即丟」的臨時對話。問完、看懂、繼續閱讀就好，沒有必要長期保留在正式的 AI 對話串裡。

不是每一次使用 AI 都需要開一個正式對話串。有些問題其實只需要 10 秒鐘幫你抓重點，然後你就可以繼續看原本的網頁。

主要功能特色

根據官方 GitHub 與 Chrome 線上應用程式商店的介紹，ChatGPTBox 的功能其實不少。

第一個最核心的功能，就是選取文字後處理內容。

你可以針對選取的文字做解釋、翻譯、摘要、潤飾、情緒分析、段落分割、程式碼解釋，也可以直接問問題。這對於閱讀技術文件、英文文章、產品說明、GitHub issue，或是比較長的網頁段落，都很有幫助。

第二個是右鍵選單。

如果你不喜歡選字後跳出浮動工具列，也可以改用右鍵選單。這一點我覺得很重要，因為每個人的閱讀習慣不同。有些人喜歡選字後立刻出現工具，有些人會覺得畫面被干擾。ChatGPTBox 的 Selection tools bubble 可以在設定裡調整或關閉，所以你可以只保留自己想用的操作方式。

第三個是浮動聊天框。

它可以在目前頁面中叫出聊天框，不一定要跳到另一個完整的 AI WebUI。當你只想圍繞目前網頁內容問幾個問題時，這種方式會比較輕。

第四個是獨立對話頁。

如果某一次已經超出查名詞，想多問幾輪，也可以開獨立對話頁來處理。這樣就不會完全卡在原本網頁的小視窗裡。

第五個是多 API 與自訂 API address 支援。

這也是我覺得它比一般選字翻譯外掛更有彈性的地方。你可以依照自己的模型偏好與預算，選擇不同平台或模型，而不是只能用固定的一個服務。

安裝方式：Chrome 商店或 GitHub Release

如果你只是想先用看看，最簡單的方式就是從 Chrome 線上應用程式商店安裝。

Chrome 商店版的好處是安裝簡單，也會走瀏覽器擴充功能的一般更新機制。對多數使用者來說，這是比較省事的方式。

如果你想看原始碼、確認專案狀態，或是想使用 GitHub 上較新的 release，也可以到 ChatGPTBox 官方 GitHub 查看。

我撰文查詢時，GitHub release 已經可以看到 v2.6.0；Chrome 商店頁面則顯示 v2.5.9。這代表兩邊版本可能會有一點時間差。

一般使用者不一定需要追最新版。你先用 Chrome 商店版測試就好。等你真的需要某個新版功能，或是你本來就熟悉手動載入 unpacked extension，再考慮 GitHub release。

這裡要提醒一下：只要是手動下載擴充功能，都要確認來源。不要從不明網站下載別人重新打包的版本。

基本設定與使用邏輯

安裝後，建議先做三件事。

第一，先確認觸發方式。

你可以決定要手動觸發、選取文字後顯示浮動工具，或是主要透過右鍵選單使用。

如果你喜歡快速操作，選字後顯示浮動工具會比較直接，點一下就能翻譯、摘要或提問。

如果你比較在意閱讀時不要被畫面打斷，也可以把不需要的浮動工具關掉，改成主要使用右鍵選單。兩種取向都可以，重點是選一個自己看文章時最不會被干擾的方式。

第二，確認常用工具。

如果你的主要需求是閱讀網頁，那我會建議先保留幾個最常用的功能就好：

解釋
翻譯
摘要
問問題
程式碼解釋

不要一開始把所有工具都打開。工具太多，反而每次選字後還要多想一下要按哪個。先抓自己最常用的 3 到 5 個功能，使用起來會更順。

第三，設定 AI 模式。

你可以用網頁版 LLM，也可以使用 API 模式。這裡要看你自己的需求。

如果你還沒有 API key，先用網頁版測試就可以。等到你確定這個工具真的會常用，再花時間設定 API。

如果你已經有 API key，或是本來就有使用 OpenAI-compatible endpoint，那就可以進一步設定自訂模型。像我前面測 Google Gemini 的 OpenAI-compatible API 時，就發現有些欄位要填的是完整 Chat Completions URL，而不是單純 base URL。舉例來說，若外掛欄位要求完整 API URL，就要填到 /chat/completions 這一段。

這種小地方很容易讓人卡住。看到 404 時，不一定是 API key 錯，也可能只是 API URL 的路徑不完整。

網頁版 LLM 與 API 模式的差異

我自己實測下來，API 串接通常會比網頁版 LLM 快。

原因其實很好理解。

網頁版的原理，是外掛在背景利用你已經登入，或是無需登入的網頁服務下指令，然後等待回覆。中間會牽涉到網頁載入、平台狀態、瀏覽器背景流程等因素。

API 的原理比較直接。它是端點對端點發送請求，也就是把你的問題送到指定 API endpoint，再等模型回傳結果。

所以在速度上，API 模式通常比較乾淨俐落。

不過 API 也不是填了就一定最快。最後速度還是會受到幾個條件影響：

你使用哪一個 API 供應商
模型本身大小
模型是否偏深度推理
當下平台負載
回答內容長度

所以選模型時，要先想清楚自己的任務。

如果你只是要查名詞、翻譯、摘要，其實不一定要用最強、最會推理的模型。這類任務比較在意速度、反應性與穩定度。模型太大，反而會讓體驗變慢。

我個人的配置思路

以我目前自己的使用情境來說，ChatGPTBox 比較像是瀏覽網頁時的快速輔助工具。

我不會拿它來做很長的深度推理，也不會把它當成完整研究工具。它最適合的任務是快問快答、定義、翻譯、摘要、整理一小段內容。

所以我的配置重點會放在速度。

我目前會偏向使用 Groq 平台上相容 OpenAI 格式的高速開源模型，例如 gpt-oss-120b，或類似的高速模型來配置。實測下來，回答速度非常快，很多時候幾乎是瞬間就能完成翻譯、摘要或簡短解釋。

這種速度差異，在瀏覽資料時很有感。

因為你不是坐下來準備跟 AI 長聊，你是在閱讀過程中遇到一個小卡點。這時候如果 AI 要等很久，你原本閱讀的節奏就會被打斷。反過來說，如果它可以很快回覆，你就比較容易把它當成閱讀流程的一部分。

講白話一點，它要像一個快速查詢工具，而不是每次都把你帶去另一個完整工作流程。

如果不想設定 API，可以先用網頁版

當然，如果你不想自己設 API，或是從來沒有申請過 API key，也可以直接使用網頁版 LLM。

只是網頁版的回應速度通常會稍微慢一點，這點要有心理準備。

以我目前測下來的感覺，網頁版使用體驗比較好的還是 OpenAI 的 ChatGPT。

原因很簡單。ChatGPT 目前有免登入即可使用的網頁版情境，所以用起來比較不會卡在「你要先在另一個分頁登入」這件事。對一些快速問答來說，也比較不容易把外掛裡的小問題全部留到自己的正式對話紀錄裡。

其他像 Anthropic 的 Claude、Google 的 Gemini、Kimi Moonshot 等服務，很多情況下需要你先在瀏覽器登入過，外掛才有辦法在背景調用。

如果是登入自己的個人帳號，那就要注意一件事：外掛裡的對話可能會同步留在平台上。

這就會回到一開始講的問題。你只是問一個名詞、翻譯一句話，結果平台對話列表裡留下很多零碎紀錄，後面還要自己手動清除。

所以如果你要用網頁版，我會比較建議先從 ChatGPT 開始測。

如果你追求速度與乾淨的使用流程，再考慮改用 API。

瀏覽器以外的文字也可以這樣處理

ChatGPTBox 畢竟是瀏覽器外掛。

所以最自然的使用場景，還是在網頁裡面選取文字。

可是如果今天資料來自其他桌面軟體，例如 PDF、Word、聊天訊息、簡報內容，那怎麼辦？

有一個很簡單的折衷做法：開一個瀏覽器裡的空白可輸入頁，把你要處理的文字貼進去，再用 ChatGPTBox 選取處理。

這不是最華麗的方法，但很好用。

你可以用一些線上純文字輸入頁面，例如：

也可以做一個很簡單的書籤小工具。

例如這個可輸入文字頁：

data:text/html, <title>Text Editor</title><body contenteditable style="font-size:2rem;line-height:1.4;max-width:60rem;margin:0 auto;padding:4rem;">

或是更簡單的純文字版本：

data:text/html, <html contenteditable>

你把這段存成瀏覽器書籤，以後點一下就會開出一個可以輸入文字的空白頁。把桌面軟體中的文字貼過去，選取後就能用 ChatGPTBox 處理。

這個方法多了一個貼上的步驟，但它很輕量，也不用另外安裝桌面軟體。

如果你希望在整個電腦桌面環境中，直接選取文字後就能提問或翻譯，確實也有其他軟體可以做到。不過那就是另一個主題了，後續有機會再來聊。

這款外掛適合誰？

我覺得 ChatGPTBox 特別適合幾種人。

這裡也可以先補充一個常見疑問。有人可能會想，翻譯功能不是已經有沉浸式翻譯、DeepL、Google 翻譯這些外掛了嗎？

對，沒有錯。如果你的需求只有翻譯，這些工具都很好用。但它們比較像是一個工具對應一種用途。你要翻譯就開翻譯工具，你要摘要就再找摘要工具，你要解釋名詞或追問內容，又要換另一個入口。

ChatGPTBox 的優勢在於，它把名詞解釋、定義、翻譯、問答、摘要、改寫、程式碼解釋這些事情，集中在同一個工具裡處理。對閱讀網頁的人來說，這會少掉很多切換工具的成本。

第一種，是常常閱讀外文資料的人。

有些外文資料大致看得懂，只是偶爾會卡在幾個句子或專有名詞。這時候用選字翻譯或解釋，比整篇丟給 AI 更有效率。

第二種，是常常查技術文件、GitHub、產品說明的人。

技術文件裡常會有一些關鍵詞、參數、錯誤訊息。你可以直接選取後請 AI 解釋，或是請它用白話整理這段文件在講什麼。

第三種，是已經有 API key 的使用者。

如果你本來就有使用 OpenAI-compatible API，ChatGPTBox 可以變成一個很輕量的前端入口。你不用每次都開完整 WebUI，只要在網頁裡選取文字就能快速送出。

第四種，是不想讓小問題污染正式 AI 對話紀錄的人。

這一點我自己很在意。因為很多問題真的只是閱讀時的臨時需求，不值得留在正式對話裡面。用外掛處理掉，回到原本網頁繼續看，整個流程會乾淨很多。

使用時要注意什麼？

第一，不要把敏感資料隨便丟給不確定的 API 或網頁服務。

這點很基本，但還是要提醒。只要你按下送出，內容就會被送到你設定的平台或模型服務。公司資料、客戶資料、個資、未公開文件，都要自己先判斷風險。

第二，如果你使用網頁版 LLM，要注意對話紀錄。

有些平台會把你在外掛中觸發的對話同步留在帳號裡。這不一定是壞事，但如果你只是想問一些零碎問題，就可能讓對話列表變得很亂。

第三，如果你使用 API，要注意費用與速率限制。

有些模型很快，但可能有額度限制。有些模型品質很好，但速度比較慢或成本比較高。這要看你自己的使用頻率與任務類型。

第四，Chrome 商店版與 GitHub release 可能有版本差異。

我查詢時 GitHub release 已經有 v2.6.0，但 Chrome 商店頁顯示的是 v2.5.9。這不代表哪個一定比較好，只是提醒你，如果你看到別人文章裡的畫面和自己的設定頁有一點不同，有可能只是版本不同。

小結：讓 AI 回到閱讀流程裡

我會把 ChatGPTBox 定位成一個「瀏覽器裡的 AI 快速查詢工具」。

它不一定要取代 ChatGPT、Gemini、Claude 這些完整 WebUI。那些工具還是很適合長對話、深度分析、寫作與複雜任務。

可是當你正在瀏覽網頁，只是想快速理解一個名詞、一段外文、一段技術文件，或是請 AI 幫你摘要目前選取的內容，這時候另外開一個完整對話介面就有點太重。

ChatGPTBox 解決的是這種小任務。

選取文字，點一下，取得答案，然後回到原本的閱讀流程。

如果你剛開始接觸，可以先用 Chrome 商店版搭配 ChatGPT 網頁版測看看。等你覺得這個流程真的適合自己，再進一步設定 API。若你在意速度，可以嘗試 Groq、OpenAI-compatible endpoint，或其他高速模型。

先不要一開始就把設定弄得很複雜。先讓它在你的閱讀流程中跑起來，再慢慢調整成你最順手的版本。

搜尋此網誌

亞瑟 ASK - 職涯隨筆與生活漫談