ChatGPTBox:在瀏覽器選取文字後,直接用 AI 快問快答、翻譯與摘要

我們現在接收新資訊,很大一部分都在瀏覽器裡面完成。

看新聞、查技術文件、讀國外文章、看 GitHub 專案、查產品說明,很多時候我們不是要做很完整的研究,只是想快速搞懂某個名詞是什麼、某段話在講什麼,或是把一小段文字翻譯、摘要一下。

早些年遇到不懂的名詞或概念,我們大多會把關鍵字複製起來,貼到 Google、Bing 這類搜尋引擎查詢。這種做法到現在還是很有用,尤其是要找來源、找資料、查官方文件的時候。

只是這幾年有了 AI 以後,很多人開始習慣直接問 AI。最直覺的做法,就是把文字複製起來,打開 ChatGPT、Gemini、Claude 或其他 LLM(大型語言模型)的 WebUI,貼上去問。

這樣當然可以,但操作上有一點麻煩。

如果只是查一個名詞、翻譯一句話、摘要一小段內容,每次都要切換分頁、複製、貼上、送出,最後還留下一堆零碎的對話紀錄。久了以後,自己的 AI 對話列表也會變得很亂。

進階一點的用法,是打開瀏覽器側邊欄,例如 Chrome 的 Gemini、Edge 的 Copilot,或其他第三方 AI 側邊欄外掛。這類工具已經比純手動複製貼上方便很多,但在一些很小的任務上,仍然有點偏重。

所以我後來就會想,有沒有一種方式可以更像翻譯外掛?

就像沉浸式翻譯、Google 翻譯、DeepL 翻譯那樣,我在網頁上直接選取一段文字,就能在同一個畫面快速取得解釋、翻譯、摘要,必要時再追問一下。

這次要介紹的 ChatGPTBox,就是很接近這個需求的一款瀏覽器外掛。


ChatGPTBox 是什麼?

ChatGPTBox 是一款瀏覽器擴充功能。

它的名字叫 ChatGPTBox,但實際上不只限於 ChatGPT。它可以搭配不同的 AI 使用方式,也支援自訂 API address。換句話說,你可以使用網頁版 LLM 模型,也可以依照自己的需求串接 OpenAI-compatible API 模型。

它的重點很簡單:把 AI 問答放進瀏覽器的使用情境裡。

你在網頁上看到一段不懂的文字,可以直接選取起來,用浮動工具或右鍵選單請 AI 解釋。你看到一段外文,可以請它翻譯。你看到一大段內容,可以請它摘要。你如果想針對這段文字繼續問,也可以直接追問。

這個使用情境很適合處理那些「小而頻繁」的問題。

而且很多問題其實是「用過即丟」的臨時對話。問完、看懂、繼續閱讀就好,沒有必要長期保留在正式的 AI 對話串裡。

不是每一次使用 AI 都需要開一個正式對話串。有些問題其實只需要 10 秒鐘幫你抓重點,然後你就可以繼續看原本的網頁。


主要功能特色

根據官方 GitHub 與 Chrome 線上應用程式商店的介紹,ChatGPTBox 的功能其實不少。

第一個最核心的功能,就是選取文字後處理內容。

你可以針對選取的文字做解釋、翻譯、摘要、潤飾、情緒分析、段落分割、程式碼解釋,也可以直接問問題。這對於閱讀技術文件、英文文章、產品說明、GitHub issue,或是比較長的網頁段落,都很有幫助。

第二個是右鍵選單。

如果你不喜歡選字後跳出浮動工具列,也可以改用右鍵選單。這一點我覺得很重要,因為每個人的閱讀習慣不同。有些人喜歡選字後立刻出現工具,有些人會覺得畫面被干擾。ChatGPTBox 的 Selection tools bubble 可以在設定裡調整或關閉,所以你可以只保留自己想用的操作方式。

第三個是浮動聊天框。

它可以在目前頁面中叫出聊天框,不一定要跳到另一個完整的 AI WebUI。當你只想圍繞目前網頁內容問幾個問題時,這種方式會比較輕。

第四個是獨立對話頁。

如果某一次已經超出查名詞,想多問幾輪,也可以開獨立對話頁來處理。這樣就不會完全卡在原本網頁的小視窗裡。

第五個是多 API 與自訂 API address 支援。

這也是我覺得它比一般選字翻譯外掛更有彈性的地方。你可以依照自己的模型偏好與預算,選擇不同平台或模型,而不是只能用固定的一個服務。


安裝方式:Chrome 商店或 GitHub Release

如果你只是想先用看看,最簡單的方式就是從 Chrome 線上應用程式商店 安裝。

Chrome 商店版的好處是安裝簡單,也會走瀏覽器擴充功能的一般更新機制。對多數使用者來說,這是比較省事的方式。

如果你想看原始碼、確認專案狀態,或是想使用 GitHub 上較新的 release,也可以到 ChatGPTBox 官方 GitHub 查看。

我撰文查詢時,GitHub release 已經可以看到 v2.6.0;Chrome 商店頁面則顯示 v2.5.9。這代表兩邊版本可能會有一點時間差。

一般使用者不一定需要追最新版。你先用 Chrome 商店版測試就好。等你真的需要某個新版功能,或是你本來就熟悉手動載入 unpacked extension,再考慮 GitHub release。

這裡要提醒一下:只要是手動下載擴充功能,都要確認來源。不要從不明網站下載別人重新打包的版本。


基本設定與使用邏輯

安裝後,建議先做三件事。

第一,先確認觸發方式。

你可以決定要手動觸發、選取文字後顯示浮動工具,或是主要透過右鍵選單使用。

如果你喜歡快速操作,選字後顯示浮動工具會比較直接,點一下就能翻譯、摘要或提問。

如果你比較在意閱讀時不要被畫面打斷,也可以把不需要的浮動工具關掉,改成主要使用右鍵選單。兩種取向都可以,重點是選一個自己看文章時最不會被干擾的方式。

第二,確認常用工具。

如果你的主要需求是閱讀網頁,那我會建議先保留幾個最常用的功能就好:

  • 解釋
  • 翻譯
  • 摘要
  • 問問題
  • 程式碼解釋

不要一開始把所有工具都打開。工具太多,反而每次選字後還要多想一下要按哪個。先抓自己最常用的 3 到 5 個功能,使用起來會更順。

第三,設定 AI 模式。

你可以用網頁版 LLM,也可以使用 API 模式。這裡要看你自己的需求。

如果你還沒有 API key,先用網頁版測試就可以。等到你確定這個工具真的會常用,再花時間設定 API。

如果你已經有 API key,或是本來就有使用 OpenAI-compatible endpoint,那就可以進一步設定自訂模型。像我前面測 Google Gemini 的 OpenAI-compatible API 時,就發現有些欄位要填的是完整 Chat Completions URL,而不是單純 base URL。舉例來說,若外掛欄位要求完整 API URL,就要填到 /chat/completions 這一段。

這種小地方很容易讓人卡住。看到 404 時,不一定是 API key 錯,也可能只是 API URL 的路徑不完整。


網頁版 LLM 與 API 模式的差異

我自己實測下來,API 串接通常會比網頁版 LLM 快。

原因其實很好理解。

網頁版的原理,是外掛在背景利用你已經登入,或是無需登入的網頁服務下指令,然後等待回覆。中間會牽涉到網頁載入、平台狀態、瀏覽器背景流程等因素。

API 的原理比較直接。它是端點對端點發送請求,也就是把你的問題送到指定 API endpoint,再等模型回傳結果。

所以在速度上,API 模式通常比較乾淨俐落。

不過 API 也不是填了就一定最快。最後速度還是會受到幾個條件影響:

  • 你使用哪一個 API 供應商
  • 模型本身大小
  • 模型是否偏深度推理
  • 當下平台負載
  • 回答內容長度

所以選模型時,要先想清楚自己的任務。

如果你只是要查名詞、翻譯、摘要,其實不一定要用最強、最會推理的模型。這類任務比較在意速度、反應性與穩定度。模型太大,反而會讓體驗變慢。


我個人的配置思路

以我目前自己的使用情境來說,ChatGPTBox 比較像是瀏覽網頁時的快速輔助工具。

我不會拿它來做很長的深度推理,也不會把它當成完整研究工具。它最適合的任務是快問快答、定義、翻譯、摘要、整理一小段內容。

所以我的配置重點會放在速度。

我目前會偏向使用 Groq 平台上相容 OpenAI 格式的高速開源模型,例如 gpt-oss-120b,或類似的高速模型來配置。實測下來,回答速度非常快,很多時候幾乎是瞬間就能完成翻譯、摘要或簡短解釋。

這種速度差異,在瀏覽資料時很有感。

因為你不是坐下來準備跟 AI 長聊,你是在閱讀過程中遇到一個小卡點。這時候如果 AI 要等很久,你原本閱讀的節奏就會被打斷。反過來說,如果它可以很快回覆,你就比較容易把它當成閱讀流程的一部分。

講白話一點,它要像一個快速查詢工具,而不是每次都把你帶去另一個完整工作流程。

如果不想設定 API,可以先用網頁版

當然,如果你不想自己設 API,或是從來沒有申請過 API key,也可以直接使用網頁版 LLM。

只是網頁版的回應速度通常會稍微慢一點,這點要有心理準備。

以我目前測下來的感覺,網頁版使用體驗比較好的還是 OpenAI 的 ChatGPT。

原因很簡單。ChatGPT 目前有免登入即可使用的網頁版情境,所以用起來比較不會卡在「你要先在另一個分頁登入」這件事。對一些快速問答來說,也比較不容易把外掛裡的小問題全部留到自己的正式對話紀錄裡。

其他像 Anthropic 的 Claude、Google 的 Gemini、Kimi Moonshot 等服務,很多情況下需要你先在瀏覽器登入過,外掛才有辦法在背景調用。

如果是登入自己的個人帳號,那就要注意一件事:外掛裡的對話可能會同步留在平台上。

這就會回到一開始講的問題。你只是問一個名詞、翻譯一句話,結果平台對話列表裡留下很多零碎紀錄,後面還要自己手動清除。

所以如果你要用網頁版,我會比較建議先從 ChatGPT 開始測。

如果你追求速度與乾淨的使用流程,再考慮改用 API。


瀏覽器以外的文字也可以這樣處理

ChatGPTBox 畢竟是瀏覽器外掛。

所以最自然的使用場景,還是在網頁裡面選取文字。

可是如果今天資料來自其他桌面軟體,例如 PDF、Word、聊天訊息、簡報內容,那怎麼辦?

有一個很簡單的折衷做法:開一個瀏覽器裡的空白可輸入頁,把你要處理的文字貼進去,再用 ChatGPTBox 選取處理。

這不是最華麗的方法,但很好用。

你可以用一些線上純文字輸入頁面,例如:

也可以做一個很簡單的書籤小工具。

例如這個可輸入文字頁:

data:text/html, <title>Text Editor</title><body contenteditable style="font-size:2rem;line-height:1.4;max-width:60rem;margin:0 auto;padding:4rem;">

或是更簡單的純文字版本:

data:text/html, <html contenteditable>

你把這段存成瀏覽器書籤,以後點一下就會開出一個可以輸入文字的空白頁。把桌面軟體中的文字貼過去,選取後就能用 ChatGPTBox 處理。

這個方法多了一個貼上的步驟,但它很輕量,也不用另外安裝桌面軟體。

如果你希望在整個電腦桌面環境中,直接選取文字後就能提問或翻譯,確實也有其他軟體可以做到。不過那就是另一個主題了,後續有機會再來聊。


這款外掛適合誰?

我覺得 ChatGPTBox 特別適合幾種人。

這裡也可以先補充一個常見疑問。有人可能會想,翻譯功能不是已經有沉浸式翻譯、DeepL、Google 翻譯這些外掛了嗎?

對,沒有錯。如果你的需求只有翻譯,這些工具都很好用。但它們比較像是一個工具對應一種用途。你要翻譯就開翻譯工具,你要摘要就再找摘要工具,你要解釋名詞或追問內容,又要換另一個入口。

ChatGPTBox 的優勢在於,它把名詞解釋、定義、翻譯、問答、摘要、改寫、程式碼解釋這些事情,集中在同一個工具裡處理。對閱讀網頁的人來說,這會少掉很多切換工具的成本。

第一種,是常常閱讀外文資料的人。

有些外文資料大致看得懂,只是偶爾會卡在幾個句子或專有名詞。這時候用選字翻譯或解釋,比整篇丟給 AI 更有效率。

第二種,是常常查技術文件、GitHub、產品說明的人。

技術文件裡常會有一些關鍵詞、參數、錯誤訊息。你可以直接選取後請 AI 解釋,或是請它用白話整理這段文件在講什麼。

第三種,是已經有 API key 的使用者。

如果你本來就有使用 OpenAI-compatible API,ChatGPTBox 可以變成一個很輕量的前端入口。你不用每次都開完整 WebUI,只要在網頁裡選取文字就能快速送出。

第四種,是不想讓小問題污染正式 AI 對話紀錄的人。

這一點我自己很在意。因為很多問題真的只是閱讀時的臨時需求,不值得留在正式對話裡面。用外掛處理掉,回到原本網頁繼續看,整個流程會乾淨很多。


使用時要注意什麼?

第一,不要把敏感資料隨便丟給不確定的 API 或網頁服務。

這點很基本,但還是要提醒。只要你按下送出,內容就會被送到你設定的平台或模型服務。公司資料、客戶資料、個資、未公開文件,都要自己先判斷風險。

第二,如果你使用網頁版 LLM,要注意對話紀錄。

有些平台會把你在外掛中觸發的對話同步留在帳號裡。這不一定是壞事,但如果你只是想問一些零碎問題,就可能讓對話列表變得很亂。

第三,如果你使用 API,要注意費用與速率限制。

有些模型很快,但可能有額度限制。有些模型品質很好,但速度比較慢或成本比較高。這要看你自己的使用頻率與任務類型。

第四,Chrome 商店版與 GitHub release 可能有版本差異。

我查詢時 GitHub release 已經有 v2.6.0,但 Chrome 商店頁顯示的是 v2.5.9。這不代表哪個一定比較好,只是提醒你,如果你看到別人文章裡的畫面和自己的設定頁有一點不同,有可能只是版本不同。


小結:讓 AI 回到閱讀流程裡

我會把 ChatGPTBox 定位成一個「瀏覽器裡的 AI 快速查詢工具」。

它不一定要取代 ChatGPT、Gemini、Claude 這些完整 WebUI。那些工具還是很適合長對話、深度分析、寫作與複雜任務。

可是當你正在瀏覽網頁,只是想快速理解一個名詞、一段外文、一段技術文件,或是請 AI 幫你摘要目前選取的內容,這時候另外開一個完整對話介面就有點太重。

ChatGPTBox 解決的是這種小任務。

選取文字,點一下,取得答案,然後回到原本的閱讀流程。

如果你剛開始接觸,可以先用 Chrome 商店版搭配 ChatGPT 網頁版測看看。等你覺得這個流程真的適合自己,再進一步設定 API。若你在意速度,可以嘗試 Groq、OpenAI-compatible endpoint,或其他高速模型。

先不要一開始就把設定弄得很複雜。先讓它在你的閱讀流程中跑起來,再慢慢調整成你最順手的版本。


📌 您可能也會有興趣的其他文章:

留言

熱門文章

Notebook LM 語音轉文字完整教學:免費、快速又省力的最佳解法

ChatGPT 專案對話打不開?「Unable to load conversation」教你一招解決!

從靜態簡報到全場互動:講師必備的 4 大即時投票系統推薦與使用技巧

打造數位分身:F5-TTS 本地部署教學與語音克隆應用分享

用AI一鍵生成簡報PPT投影片真的有那麼神?全網最詳細AI簡報工具彙整與實測心得

不是主持人也能做筆記!Otter.ai、Notta.ai 線上會議即時轉錄逐字稿完整教學

用手機接續操作電腦版 Codex:codexUI 與 Windows 快速啟動器實作

G6PD 缺乏者的抗生素選擇指南|社區診所常見處方與藥師建議一次搞懂

GLP-1 減重針安全嗎?瘦瘦針機轉、效果、副作用一次看懂

快速又免費的語音轉文字神器『Faster Whisper』,一鍵解決影音內容爆量時代的痛點!