OpenLess Unbound 實測:Typeless 免費開源替代方案,補上繁中本地化與 Provider 自由度

前一篇文章我才剛分享過 Codex 全域語音輸入實測。那篇文章的重點其實很簡單:語音輸入工具要真的好用,除了模型聽不聽得懂,還要看它能不能出現在我真正需要打字的地方。

因為我平常不會只在 ChatGPT 網頁裡講話。我可能在寫部落格、回訊息、整理筆記、填表單、寫 GitHub issue,甚至是在跟不同 AI 工具互動。這時候,如果語音輸入只能卡在某一個平台裡,其實就很可惜。

過去我也陸續實測過 Wispr Flow、Typeless、Handy、Vibing 這些工具。老實說,如果只看整體功能完整度、回應速度、輸出品質和使用體驗,目前我覺得商用工具裡面最成熟的仍然是 Typeless。

Typeless 讓我最有感的地方,是它已經超過「語音轉文字」的範圍。它比較像是一個語音寫作工作站。你可以講一段比較口語的內容,讓它幫你整理成比較像人會貼出去的文字。它也有語音編輯、即時翻譯、即時搜尋和更完整的工作流。

不過 Typeless 畢竟是商用軟體。它很好用,但不是每個人都想訂閱,也不是每個人都想被綁在同一個平台或額度裡。

所以我後來一直在找一個問題的答案:

有沒有一套免費、開源,而且使用體驗能接近 Typeless 的替代方案?

目前我實測下來,OpenLess 是我看到最接近這個方向的專案。而這次我花了一段時間研究原始碼、測試、修改、打包並公開的 OpenLess Unbound,就是基於 OpenLess 做的一個 fork,重點是修改了幾個我實際使用時想解放的限制。


OpenLess 為什麼值得注意?

OpenLess 本身不是我從零開始寫的軟體。它是由原開發者維護的一套開源語音輸入工具。原版 OpenLess 已經把很多重要功能做出來了,這點我覺得非常值得肯定。

如果用白話講,OpenLess 的基本流程是這樣:

  1. 按快捷鍵開始錄音。
  2. ASR 模型把語音轉成文字。
  3. LLM 語言模型再幫你做文字後處理。
  4. 最後把整理好的文字插入到目前游標所在位置。

這個流程用講的聽起來都很簡單,但真正要做得順並不容易,背後需要很多程式腳本上的同步運作。

因為一般語音轉文字工具常常只給你一段原始逐字稿。問題是我們平常講話不會像寫文章一樣完整。我們會停頓、重複、改口、漏標點,講到一半又補一句。這些內容如果直接貼出去,常常還要自己再手動整理潤色一次。

OpenLess 比較接近 Typeless 的地方,是它會在轉文字之後,再交給 LLM 做 AI 後修飾。這樣就可以把一段口語內容整理成比較像正式文字的結果,例如有標點、有分段、有條列,甚至可以依照不同風格改寫。


四種輸出風格,讓語音輸入更像寫作工具

OpenLess 原本就內建幾種輸出風格,這點我覺得是它很接近 Typeless 的原因之一。

目前常用的風格包含:

  • 原文
  • 輕度潤色
  • 清晰結構
  • 正式表達

這幾個風格不是單純改幾個字而已,背後其實就是不同的 prompt 設計。

舉例來說,如果我只是要快速回訊息,可能用「輕度潤色」就好。它不要幫我改太多,只要把語氣整理得順一點。

如果我是要口述一段文章大綱,那我可能會用「清晰結構」。這樣它會比較願意幫我分段、列點,把原本比較散的口語整理成可以繼續編輯的內容。

如果是要寫比較正式的信件或文件,就可以改用「正式表達」。

所以這幾個風格的價值,在於它已經把「語音輸入」往「語音寫作」推進一步。


即時翻譯與劃詞追問,讓它更像 AI 助理入口

OpenLess 另一個我覺得很有潛力的地方,是它也不侷限於一般語音輸入。

它也有即時翻譯和劃詞追問。

即時翻譯的使用方式不複雜。你可以先設定工作語言和目標語言,錄音時透過快捷鍵觸發翻譯,最後把翻譯結果插入目前的文字框。對需要回英文訊息、整理英文筆記,或把中文想法快速轉成英文的人來說,這個功能很實用。

劃詞追問則更像是一個小型 AI 助理。你可以在任何 app 裡選取一段文字,叫出浮窗後直接針對這段文字提問。這個方向很像 Typeless 後來強化的路線:讓語音從輸入工具,延伸成操作 AI 的入口。

當然,這裡也要先講清楚:OpenLess 的劃詞追問目前沒有調用外部 tool 或瀏覽器搜尋的流程。換句話說,它不會真的幫你即時上網查匯率、天氣或新聞。它比較適合針對你已經選取的文字做解釋、整理、改寫與延伸提問。

但即使如此,對於整理一段文字、解釋一段內容、幫忙改寫或延伸問題,這個功能已經很有價值。


BYOK:自帶 API Key 的彈性

OpenLess 對我來說還有一個很重要的優點,就是它走 BYOK,也就是 Bring Your Own Key。

講白話就是,你可以接自己的 API。

這點對一般使用者不一定馬上有感,但對我這種平常會測很多模型、很多 provider 的人來說,差很多。

商用工具的好處是開箱即用,但限制也在這裡。它的模型、額度、路由、功能怎麼開,很多時候都要看官方安排。

BYOK 的好處是,我可以自己決定要用哪個 ASR 模型做語音轉寫,也可以自己決定要用哪個 LLM 做後處理。速度、品質、成本可以分開考量。

例如日常語音輸入,我可能比較重視速度和低延遲。可是劃詞追問,我可能比較重視回答品質和推理能力。這兩個需求其實不一定要用同一個模型。

這也是後來我會做 OpenLess Unbound 的原因之一。


原版 OpenLess 我實際遇到的限制

OpenLess 原版已經很不錯,但我實際安裝使用後,遇到幾個對我來說蠻關鍵的限制。

第一個是劃詞追問。

我原本想測這個功能,但它當時跳出缺少火山 ASR 憑證的錯誤。問題是,我平常並沒有使用火山 ASR。我比較常用的是 Groq Whisper、OpenAI-compatible endpoint,或是透過 Codex OAuth 走不同模型。

火山 ASR 本身不是不能用。官方也有 語音識別 ASR 產品頁帳號註冊流程文件。不過官方註冊流程需要手機號碼接收簡訊驗證,後續若要進一步體驗或購買雲服務,還需要完成帳號實名認證。對沒有中國大陸手機號碼、也沒有對應實名資料的台灣使用者來說,這個門檻就不太適合被設計成預設依賴。

這就有點可惜。

因為一般語音輸入明明已經可以設定其他 provider,可是劃詞追問如果還卡在特定 ASR provider,那對非中國大陸服務使用者來說,就會變成一個很大的門檻。

第二個是劃詞追問的回答模型。

我實際使用後覺得,一般潤色模型和劃詞追問模型最好可以分開。原因很簡單:它們的任務不一樣。

一般語音輸入常常只是把我講的口語內容變成順一點的文字。這時候我希望速度快、延遲低、不要太貴。

但劃詞追問比較像問答與推理。它可能要理解我選取的文字,還要接著我的問題做整理、解釋、延伸。這時候我反而願意用品質比較好的模型。

第三個是 Windows 繁體中文輸入法問題。

原版 OpenLess 安裝後,Windows 會多一個 OpenLess Voice Input 輸入法。但我當時看到它被放在「簡體中文(中國)」底下。對台灣使用者來說,這件事很容易干擾平常使用繁體中文注音輸入的習慣。

尤其我平常會用 Shift 在英文與繁中注音之間切換。如果語音輸入後系統被帶到簡中輸入法,那日常使用會很卡。

這裡牽涉到 Windows TSF 輸入法 profile 註冊語系,已經超過單純介面翻譯的範圍。


所以我做了 OpenLess Unbound

OpenLess Unbound 是我基於 OpenLess 做的 fork。

我沒有想把它包裝成完全不同的軟體。它的基礎仍然是 OpenLess,也保留原開發者資訊與上游來源。這點很重要,因為原專案已經完成很多底層工作,包含跨平台介面、錄音流程、ASR、LLM 後處理、快捷鍵與 Windows 插入後端。

OpenLess Unbound 的重點,是針對我實際使用遇到的限制做補強。

這次主要改了幾個方向:

  1. 劃詞追問不再強制依賴火山 ASR。
  2. 劃詞追問回答模型可以獨立設定。
  3. Windows TSF 輸入法 profile 改為繁體中文台灣。
  4. App identity 改成 OpenLess Unbound,資料夾也獨立。
  5. 劃詞追問回答可以選取局部文字複製,也可以一鍵複製整則回答。
  6. 同步部分上游 OpenLess 1.3.6 beta 改善。

GitHub 專案位置在這裡:

https://github.com/taoyutsun/openless-unbound

目前 release 版本可從這裡下載:

OpenLess Unbound Releases


Unbound 解決了哪些核心限制?

第一個是劃詞追問 ASR。

OpenLess Unbound 讓劃詞追問可以跟隨目前已設定的 ASR provider。也就是說,如果你平常語音轉寫用的是 Groq Whisper 或其他 OpenAI-compatible endpoint,就不用為了劃詞追問另外去申請火山 ASR。

第二個是劃詞追問的回答模型。

現在你可以讓劃詞追問沿用一般潤色模型,也可以獨立指定 provider、model 與 thinking 設定。這樣就能把速度型模型和品質型模型分工。

第三個是繁體中文 Windows 輸入體驗。

OpenLess Unbound 把 Windows TSF profile 註冊為繁體中文台灣,目標是避免語音輸入後被切到簡體中文輸入法。對我這種平常使用繁中注音的人來說,這個修正非常實際。

第四個是劃詞追問回答可以直接拿來用。

原本問答結果如果只能看,實用性會差一點。OpenLess Unbound 的回答氣泡支援手動選取局部文字,右上角也有複製按鈕,可以一鍵複製整則 assistant 回答。這樣問完之後,如果某一段可以直接放進文章、訊息或筆記,就不用重新打字。

第五個是資料與 app 身分獨立。

OpenLess Unbound 使用自己的 app identity 與資料目錄,預設資料位置是:

%APPDATA%\OpenLess Unbound

這樣就可以跟官方 OpenLess 分開獨立測試使用,不會直接覆蓋原版設定。


這次同步了哪些上游改善?

OpenLess Unbound 目前的版本是 v1.3.6-1

這版除了保留前面提到的 fork 改動,也同步了部分上游 OpenLess 1.3.6 beta 的改善。

比較有感的包括:

  • 本地 ASR 模型儲存管理。
  • 多螢幕環境下,膠囊提示會跟隨目前輸入所在螢幕。
  • Toggle 錄音結束後加入短暫冷卻,降低誤觸後馬上重新錄音的機率。
  • 支援 MediaPlayPause 熱鍵觸發。
  • Groq / OpenAI Whisper 使用 verbose JSON 過濾,降低靜音或極短音訊被誤判成文字的機率。

最後這一點我自己測試時有感。因為如果錄音太短,有些 Whisper provider 可能會把無聲音或雜訊誤判成像 Thank you. 這類文字。過濾後,這種情況會比較少。


我的個人參考配置

這裡先說清楚,下面只是我的個人配置,不是唯一正解。

我目前會把 OpenLess Unbound 分成三段來設定:

第一段是 ASR 語音轉寫。

我用的是 Groq  Whisper large v3。主要原因是速度飛快、延遲低,適合日常即時輸入。語音輸入最怕的是整個節奏被打斷。只要你講完後要等太久,這個工具就很難變成日常習慣。

第二段是一般文字潤色後處理。

我用 Groq openai/gpt-oss-120b。這個模型的優點是回應速度飛快,拿來做一般口語整理很適合。日常輸入通常不需要每一句都用最高品質模型,只要它能把我的口語整理成有標點、有段落、語氣自然的文字,就已經很夠用。


第三段是劃詞追問。

這部分我會用 Codex OAuthGPT-5.5。原因是劃詞追問比較像問答和推理,已經超過文字修飾的範圍。它需要理解選取內容,還要根據我的問題做整理、解釋或延伸。這時候我比較願意用品質更高的模型。

所以我的邏輯很簡單:

  • 語音轉寫要快。
  • 一般潤色要順。
  • 劃詞追問要準。

三個任務不同,就不需要硬綁同一個 provider。


如何安裝 OpenLess Unbound?

安裝方式很簡單。

到 GitHub Releases 頁面下載最新版本:

https://github.com/taoyutsun/openless-unbound/releases

Windows 使用者會看到兩種主要檔案:

  • OpenLess_Unbound_<version>_x64.msi
  • OpenLess_Unbound_<version>_x64_portable.zip

如果你是要長期日常使用,我會建議優先用 MSI 安裝版。原因是 OpenLess Unbound 有 Windows 輸入法後端,需要透過安裝流程註冊到系統裡。

Portable zip 比較適合短期測試或臨時使用。它不一定能提供跟 MSI 完全一樣的系統層整合體驗。

另外也要提醒,目前這個 build 還沒有 Windows code signing 簽章,所以第一次執行時,Windows 可能會跳出 SmartScreen 或未知發行者提醒。這不代表它一定有病毒,而是 Windows 對未簽章、下載量還不高的新執行檔比較保守。

如果你是公司電腦,或 IT 管控比較嚴格的環境,建議先確認公司政策再安裝。


第一次使用要設定哪些地方?

安裝後,第一個要看的地方是「設定 → 服務」。

這裡主要有兩類設定。

第一類是 ASR,也就是語音轉文字。

你可以依照自己習慣選擇 Groq Whisper、OpenAI Whisper-compatible endpoint、Foundry Local Whisper、Sherpa-ONNX local,或其他支援 provider。

第二類是 LLM,也就是文字潤色、翻譯和問答用的語言模型。

這裡可以設定 Codex OAuth、Groq、OpenAI、Gemini、OpenRouter,或自訂 OpenAI-compatible endpoint。

設定完 provider 後,建議先做一次連線驗證,確認 API key、Base URL 和 model name 都能正常使用。

如果你還不知道可以去哪裡找免費或高 CP 值的 provider,也可以參考我之前整理的這篇文章:想玩 AI Agent 自動化卻怕太花錢?9 個免費與高 CP 值雲端 API 來源一次整理。裡面有一些可以拿來搭配 BYOK 工具測試的 API 來源。


一般語音輸入怎麼用?

一般語音輸入的流程是:

  1. 把游標放到你想輸入文字的地方。
  2. 按 Right Ctrl 開始錄音。
  3. 再按 Right Ctrl 停止錄音。
  4. OpenLess Unbound 會先做 ASR 轉寫。
  5. 接著交給 LLM 依照目前風格做後處理。
  6. 最後把文字插入目前游標位置。

這裡有一個小地方要注意,就是錄音模式。

如果你設定的是「按住說話」,那 Right Ctrl 要按住不放,講完再放開。如果只是快速點一下,音訊太短,可能會顯示「沒有識別到語音」。

如果你比較習慣按一下開始、再按一下停止,可以改成 Toggle 模式。這比較適合長段口述。


詞彙表:讓工具更懂你的專有名詞

我自己很建議使用詞彙表。

因為語音輸入最常出錯的地方,通常集中在專有名詞,而不是一般生活用語。

例如:

  • Codex
  • Claude Code
  • OpenClaw
  • Typeless
  • Wispr Flow
  • 公司名、人名、產品名
  • 專案名稱、客戶名稱、藥品名稱、品牌名稱
  • 常見中英混合詞或縮寫

這些字如果沒有先放進詞彙表,ASR 或 LLM 很可能會聽錯誤判。OpenLess Unbound 可以把啟用的詞彙送進 ASR prompt 或 LLM prompt,讓辨識和後處理更容易命中。


即時翻譯怎麼用?

即時翻譯的操作大概是這樣:

  1. 到「翻譯」頁面選擇工作語言與目標語言。
  2. 用 Right Ctrl 開始錄音。
  3. 錄音中按一下 Shift 觸發翻譯。
  4. 再按 Right Ctrl 停止錄音。
  5. 翻譯結果會插入目前游標位置。

如果目標語言設定為不啟用,Shift 就不會觸發翻譯。

這個功能適合需要快速把中文想法轉成英文訊息的人。像我有時候要先用中文把想法講清楚,再讓 AI 幫我轉成英文,這種流程就蠻順。


劃詞追問怎麼用?

劃詞追問的流程是:

  1. Ctrl+Shift+; 開啟浮窗。
  2. 在任意 app 裡選取一段文字。
  3. 按 Right Ctrl 開始錄音提問。
  4. 再按 Right Ctrl 停止並送出。
  5. 可以繼續多輪追問。
  6. 按 Esc 關閉浮窗。

OpenLess Unbound 這裡與原版最大的差異,就是你可以讓劃詞追問使用獨立模型。

例如你平常語音輸入用 Groq 做快速潤色,但劃詞追問改用 Codex OAuth GPT-5.5。這樣就可以兼顧速度和回答品質。

另一個亮點就是問答結果也可以直接複製使用。你可以在回答氣泡裡手動選取其中一段文字,也可以按回答旁邊的複製按鈕,把整則回答複製到剪貼簿。

不過還是要再提醒一次:目前劃詞追問本身不內建即時上網搜尋,也沒有調用外部 tool 的流程。它可以整理你選取的文字,但不會真的即時查詢最新匯率、天氣或新聞。



OpenLess Unbound 適合誰?

我會覺得它適合幾種人。

第一種,是想找 Typeless 免費開源替代方案的人。

如果你已經認同 Typeless 那種「語音輸入 + AI 後處理 + 快捷鍵 + 跨 app」的方向,但暫時不想使用商用訂閱,OpenLess Unbound 可以試試看。

第二種,是已經有自己的 API key 或 OpenAI-compatible endpoint 的人。

這類使用者本來就會希望模型可以自由選,不想被單一平台綁死。

第三種,是 Windows 繁體中文使用者。

如果你平常使用繁中注音,而且不希望語音輸入後系統跳到簡體中文輸入法,那 OpenLess Unbound 的 TSF profile 修正會比較貼近你的使用情境。

第四種,是想把語音輸入放進日常 workflow 的人。

例如寫文章、回訊息、整理筆記、下 prompt、跟 AI agent 溝通。只要你常常需要輸入文字,這類工具就有機會幫你省很多力氣。


它目前不適合誰?

當然,這也不是每個人都適合。

如果你完全不想處理 API key,不想設定 provider,只想下載後馬上用,那商用工具還是比較省事。

如果你在公司電腦上不能安裝未簽章程式,或 IT 政策很嚴格,那也要先確認環境允不允許。

如果你非常需要內建即時搜尋、語音編輯、跨平台同步、客服支援和完整商用品質保證,那 Typeless 目前還是比較成熟。

OpenLess Unbound 比較像是給願意自己設定 provider、也願意接受開源工具仍在快速演進中的使用者。


小結:這是一個更自由,也更貼近繁中使用者的版本

我自己的感覺是,Typeless 目前仍然是整體體驗最完整的商用語音輸入工具。

但如果你想找免費開源替代方案,OpenLess 是目前很值得看的選擇。而 OpenLess Unbound 則是在這個基礎上,再把幾個我實際遇到的限制補起來。

它真正有感的地方,是這三件事:

  • 劃詞追問不再卡特定 ASR provider。
  • 一般潤色和劃詞追問可以用不同模型分工。
  • Windows 繁體中文輸入體驗比較不會被簡中輸入法干擾。

如果你平常已經在用 Groq、Codex OAuth、OpenAI-compatible endpoint,或本來就在找 Typeless 的免費開源替代方案,那 OpenLess Unbound 值得試試看。

專案與下載頁在這裡:

OpenLess Unbound GitHub

OpenLess Unbound Releases


📌 您可能也會有興趣的其他文章:

留言

熱門文章

Notebook LM 語音轉文字完整教學:免費、快速又省力的最佳解法

ChatGPT 專案對話打不開?「Unable to load conversation」教你一招解決!

從靜態簡報到全場互動:講師必備的 4 大即時投票系統推薦與使用技巧

打造數位分身:F5-TTS 本地部署教學與語音克隆應用分享

用AI一鍵生成簡報PPT投影片真的有那麼神?全網最詳細AI簡報工具彙整與實測心得

不是主持人也能做筆記!Otter.ai、Notta.ai 線上會議即時轉錄逐字稿完整教學

用手機接續操作電腦版 Codex:codexUI 與 Windows 快速啟動器實作

G6PD 缺乏者的抗生素選擇指南|社區診所常見處方與藥師建議一次搞懂

GLP-1 減重針安全嗎?瘦瘦針機轉、效果、副作用一次看懂

快速又免費的語音轉文字神器『Faster Whisper』,一鍵解決影音內容爆量時代的痛點!