想玩 AI Agent 自動化卻怕太花錢?9 個免費與高 CP 值雲端 API 來源一次整理

 


最近有不少親朋好友在跟我聊 AI Agent,還有各種 AI 自動化服務。

很多人一開口問的,不外乎就是兩件事。

第一個,是不是一定要先買一台高規電腦?
第二個,是不是一開始就要準備一筆不小的 API 費用?

講白話,很多人不是卡在不會用 AI,而是還沒開始,就先被「硬體成本」跟「算力成本」嚇到了。

但老實說,這裡面其實有不少迷思。

如果你現在想接觸 AI Agent、Vibe Coding,或是想開始玩一些 AI 自動化服務,你不一定要先砸很多錢,也不一定要先買很高階的硬體。

很多情況下,一台一般規格的電腦就能開始。而且目前市面上,也真的有不少免費、或者高 CP 值的雲端大型語言模型服務可以用。

這篇文章,我就幫大家整理一下我自己實際有在用、也覺得值得參考的雲端 LLM / API 來源。

如果你剛好也卡在「到底要選哪一家」「API 怎麼申請」「會不會一開通就開始噴錢」,那這篇應該可以幫你先把方向釐清。


先拆掉兩個常見迷思

迷思一:做 AI Agent,一定要高規硬體

這個說法不能說完全錯,但只對一半。

如果你要跑的是純本地端的大型語言模型,那的確,高規格硬體就很重要。尤其是 GPU、顯卡記憶體、整體運算能力,這些都會直接影響你能跑什麼模型、跑得順不順。

但如果你現在大多數的使用情境,是透過雲端模型來做事,那其實很多任務根本不需要高規硬體。

像是:

  • AI Agent 串接雲端模型
  • Vibe Coding
  • 文件整理
  • 翻譯
  • 語音轉文字
  • 一般聊天問答
  • 中小型自動化流程
這些事情,很多時候運算真正發生的地方,是服務供應商的雲端,不是在你的電腦上。

換句話說,你的電腦很多時候只是「操作台」,不是「主引擎」。

所以如果你現在主要是要用雲端模型,那一台一般規格的電腦,很多時候其實就夠你開始了。

高規硬體不是沒用。當然有用。
但那通常是你之後想往更深的本地部署走,才會變成關鍵。

所以不要一開始就被硬體門檻嚇退。
先搞清楚你要跑的是本地模型,還是雲端模型,這個比較重要。

迷思二:做 AI 自動化,一定很燒 API 費

這個也一樣,只對一半。

如果你什麼事情都丟給高階雲端模型,當然成本會上去。這個很合理。你拿頂規模型去做大量 coding、長時間自動化、文件分析,費用本來就不可能完全沒感覺。

但問題是,很多人會不小心把所有任務都用同一種規格處理。

這就像你只是要去巷口買個飲料,結果每次都開跑車去,當然油錢會很有感。

其實比較合理的做法是分工。

例如:

  • 複雜推理、Vibe Coding、需要長上下文的任務,用高品質模型
  • 翻譯、語音轉文字、簡單整理、快速回應,用低成本模型或免費模型
  • 能本地處理的,就盡量本地處理
  • 雲端模型額度不夠時,再用免費平台或備援方案接手
這樣做下來,成本通常會比很多人想像中低很多。

更別說,現在市場上其實真的有不少平台,會提供不錯的免費額度,甚至某些服務本身就幾乎可以當作免費備援來使用。

所以重點不是「會不會花錢」,而是你有沒有把資源分配做好。


在介紹平台之前,先搞懂 API 設定的四個基本項目

很多人第一次安裝 AI 工具,真正卡住的地方,不是在模型本身,而是在設定畫面。

因為它一打開就問你:

  • service provider 是哪一家公司?
  • base URL 路徑?
  • API key 是多少?
  • model 要填哪個型號?
結果第一步就停住了。

所以這邊我先用白話講一下。

1. service provider 是什麼?

這個其實就是服務供應商。

常見的像是:

  • OpenAI
  • Google
  • Anthropic
  • NVIDIA
  • Groq
  • Ollama
  • OpenRouter
你可以把它理解成「模型是誰家提供的」。

很多工具在設定時,第一個就會先要你選 service provider。因為你選的是哪一家,後面能用的模型、認證方式、base URL,通常都會跟著不同。

2. base URL 是什麼?

base URL 可以把它想成 API 的入口網址。

有些工具很貼心,你一選 provider,它就幫你自動帶入。
但有些工具不會,你就得自己填。

而且要注意,有些服務雖然是同一家平台,但根據不同用途,URL 格式也可能不太一樣。

所以如果你看到工具要求你輸入 base URL,不用太緊張。這不是什麼很高深的東西,就是 API 要接去哪裡而已。

3. API key / API token 是什麼?

這個最簡單的理解方式,就是「開門的鑰匙」。

你沒有這把鑰匙,工具就進不去 API 倉庫。

不管它叫 API key、API token,或是其他名稱,本質上都是讓服務知道:
「好,你是有被授權的人,可以進來用。」

這類資料要特別注意,因為它是敏感資訊。

供應商名稱、base URL、模型名稱,這些通常都不是秘密。
真正屬於你個人的,通常就是 API key 或 API token。

所以一般原則很簡單:

  • 不要直接寫死在程式裡
  • 不要亂貼到公開畫面
  • 最好放進環境變數或 .env 檔管理
這個習慣早一點建立,後面會省很多事。

4. model 設定為什麼要特別小心?

很多新手最容易卡在這裡。

因為我們平常嘴巴講模型,可能會講:

  • GPT-5.4
  • Gemini 3.1 Pro
  • Claude Opus 4.6
但在實際設定工具時,它要吃的常常不是這種人類好記的名字,而是非常精確的 model ID

這些 ID 通常會很敏感,像是:

  • 大小寫不一樣
  • dash 少一個
  • 版本號格式不一樣
  • 命名規則差一點點
都有可能直接讓設定失敗。

所以這一段我想先提醒大家,真正要設定時,不要憑印象打。最好直接去官方文件、官方 API 頁面,或讓 AI 幫你查當前正確格式。


看懂 rate limit,才知道怎麼分配資源

接下來這一段很重要。

很多人挑平台只看模型強不強,卻沒注意到另一件更實際的事:你到底能用多少。

這時候就會看到一些常見縮寫。

1. RPM / TPM / RPD 是什麼?

最常見的三個是:

  • RPM:Requests Per Minute,每分鐘請求數
  • TPM:Tokens Per Minute,每分鐘 token 數
  • RPD:Requests Per Day,每日請求數
講白話就是:
  • RPM 看的是你每分鐘能叫幾次
  • TPM 看的是你每分鐘能送多少文字量
  • RPD 看的是你一天總共能用幾次

2. 為什麼這些數字很重要?

因為不同任務,看重的限制不一樣。

如果你做的是:

  • 即時翻譯
  • 語音轉文字後處理
  • 快速小任務
那你比較要看的是 RPM 跟 TPM。

因為這類工作通常要求快,而且短時間內可能會連續發很多次 request。

但如果你做的是:

  • Vibe Coding
  • AI Agent 自動化流程
  • 大型文件分析
  • 需要長上下文的任務
那你更要注意的,反而是 RPD,以及整體可用的 token 規模。

因為這些工作不一定每分鐘狂打 request,但會很吃上下文、很吃總量。

3. 選模型不是只看強不強,也要看划不划算

高階模型通常思考力比較強、編碼能力比較好、上下文也可能比較大。

但相對的,它能提供的免費量,通常也比較少。

反過來說,很多中階模型、開源模型,雖然不是最頂,但免費量大很多,也很適合拿來處理日常任務。

所以真正好的選法,不是永遠追最強,而是讓任務跟資源對得上。

你拿錯刀,不是刀不好,是你用錯地方。


我自己會怎麼分類這些服務

接下來,我整理成兩大類。

第一類,是完全免費或幾乎可當免費用的選項。
第二類,是我覺得小投資但體驗升級很多的高 CP 值選項。


一、完全免費的選項

1. NVIDIA NIM

NVIDIA 不用我多介紹,大家都知道它就是黃仁勳那家做高階顯示卡的公司。

它最大的優勢很簡單:
免費,而且很多大型模型也能用。

它官方明確標示的 API rate limit,是 最高 40 RPM,也就是每分鐘最多 40 次 request。而且它的另一個重點是,沒有每日總請求數上限,也就是沒有 daily limit。這件事很重要,因為它代表你雖然不能在單位時間內太高頻率地狂打 request,但只要你的使用型態不是那種短時間密集轟炸,它其實很適合拿來做長時間、穩定型的任務。

講白話,就是它不太適合拿來做那種網頁翻譯器類型、短時間內狂送很多 request 的工作;但如果你是做 AI Agent 備援、做中長型推理任務,或者當其他平台額度用完時的 backup plan,它就很好用。

而且它裡面可以用的開源模型也不少。像是 GLM5、Kimi K2.5、MiniMax M2.5、Nemotron 3 Super 120B,還有一些 Qwen 系列模型,對很多 AI Agent 或 coding 類任務來說,其實都很夠用。


2. Ollama 

Ollama 很多人熟悉的是本地模型,但它的雲端服務也有提供 API key,而且對一般使用者來說,免費額度其實算蠻寬裕。

它和有些平台不太一樣,官方不是直接丟一個死數字告訴你「你有幾萬 token」這麼簡單,而是採用動態配額機制。也就是說,它會根據模型大小和運算成本,去決定你的額度消耗速度。

目前比較值得注意的規則大概有幾個:

  • 雙重重置機制:分成單次會話用量與每週用量
- Session usage 每 5 小時會自動重置一次 - Weekly usage 每 7 天重置一次
  • 併發限制:免費版同一時間只能呼叫 1 個雲端模型
  • 社群實測經驗:如果是像 qwen3-coder 或 minimax-m2.7:cloud 這種等級的模型,每個 session 大約可負荷 20 到 25 萬 token 的輸入量
  • 90% 用量警告:當你接近額度上限時,官方會主動寄 email 提醒
  • 付費版差異:如果升級到 Pro,官方說雲端額度可達到免費版的 50 倍
所以我會怎麼看 Ollama ?

如果你是日常除錯、做輕量 agent 任務、跑一些文件整理、做測試,這個免費額度其實很有參考價值。它不一定適合拿來撐很重的生產環境,但如果你是正常使用量,真的算寬裕。


3. V-API

這個比較算是特定路線的免費資源。

它的優點是免費無上限,而且我自己的經驗裡,用來做翻譯其實蠻不錯。有些專有名詞的保留,甚至比某些普通翻譯工具還順。像在醫學領域裡,有些藥名如果直接被翻成音譯,讀起來反而很怪,但它有時候保留原文會更實用。

但它的來源屬於中國資源,所以這一點我會直接講清楚。如果你對隱私、資料來源比較敏感,那你就自己評估,甚至直接跳過都可以。

如果你沒有這層顧慮,而且用途是低敏感度內容,例如一般翻譯、公開資料整理、非機密文本處理,那它可以當一個很實用的補充工具。

它目前可免費使用的模型,參考資料裡有提到像 gpt-4o-minigpt-3.5-turbo 等幾個可用選項。


4. DeepL

如果你的重點是翻譯,那 DeepL 其實一直都很值得列進來。

它的翻譯品質本來就有一定口碑,而且免費方案每個月有 50 萬字元 額度,對很多一般使用者來說其實很夠。

另外它還有幾個細節值得補一下:

  • 免費方案可建立 最多 2 組 API keys
  • DeepL API Free 每月可翻譯 500,000 characters
  • 但免費版不包含 next-generation language model 與 DeepL Write for API
它的限制是免費註冊也需要綁信用卡。這點有些人會介意,所以我直接先講。

但如果你的主要需求真的就是翻譯,而且你希望品質穩、用起來省事,那 DeepL 很適合直接定位成「專職翻譯工具」。


5. Groq

如果你在意的是速度,那 Groq 很值得特別提一下。

我自己的使用感受很直接:
它真的是飛快。快到有點不可思議。

像我自己拿它搭配本地語音轉文字流程做後處理時,有時候是快到什麼程度?我是講完話,正準備按碼表,結果它已經轉完了。講白話,就是你想計時都來不及,因為它瞬間就秒做完了。

所以如果你的工作型態很在意即時反應,例如:


  • 語音轉文字後處理

  • 快速整理

  • 即時回應型工具

  • 節奏很快的工具串接


Groq 真的很適合。

而且它不是只有快,額度也不算小。根據我整理的資料,它常見會提供:

  • 每日用量大約 10 萬到 50 萬 token 等級
  • 每分鐘 token 量大約 6,000 到 3 萬 TPM
  • 每日 request 數大約 250 到 14,000 次
  • 每分鐘 request 數大約 30 或 60 RPM
所以如果你是拿來做日常小需求,像語音轉文字後處理,坦白說很多時候是綽綽有餘,甚至很難真的把它用完。

6. ElevenLabs

ElevenLabs 比較偏語音相關。如果你的工作流裡會碰到語音轉文字、文字轉語音,或者其他聲音相關應用,那它很值得先申請起來。

我自己會把它定位成「語音工具箱的一部分」。不是萬用主力,但在對的場景裡很好用。

至於額度部分,以它目前主力的語音轉文字模型,例如 scribe v1 或 scribe v2 來看,官方標示的 included hours 大約是 2 小時 30 分鐘 左右。從方案描述來看,這通常比較像是一個週期性的重置額度,實務上大致可以理解成月度等級的免費使用量。

不過以我自己的實測經驗來看,它的限制有時沒有表面上那麼死,超過之後似乎也不見得立刻完全不能用。這部分當然還是要以當下官方方案為準,但至少我的體感是,對一般用量來說,它還是有實用性。


二、小小投資,大大體驗的高 CP 值選項

1. OpenAI Codex OAuth

這個我很推薦給本來就有訂 ChatGPT Plus 或 Pro 的人。

原因很簡單。

你都已經付錢了,不用白不用。

很多人平常有訂 ChatGPT,但只把它拿來聊天,或者偶爾拿來問問題。其實如果官方允許透過 OAuth (Open Authorization)方式去呼叫 Codex 模型,那這個價值就不只是聊天而已。

你可以把它延伸到:

  • Vibe Coding
  • AI Agent 串接
  • 各種自動化工具流程
更重要的是,它消耗的不是另外計價的 API 帳單,而是你本來 ChatGPT 訂閱方案裡的配額。換句話說,如果你本來就有每月 20 美元以上的訂閱,這部分其實就是既有訂閱延伸出來的價值。

而且以我自己的使用經驗來看,它給的額度是相當寬裕的。我到目前為止,幾乎沒有真的把它用到上限過。也就是說,對一般使用者來講,這個方案很容易就能撐住日常的 Vibe Coding 與 AI Agent 串接需求。

所以這類服務如果能直接吃你原本就已經有的訂閱配額,對很多人來說 CP 值就很高。


2. Google AI Studio / Google AI Pro

Google AI Studio 以前之所以很多人很推,有一個很大原因,是它早期的免費額度真的很有感。

但現在如果你只停留在免費層,老實說,很多高階模型的量都已經很緊了。

例如你如果只是在 free tier:


  • 某些高階模型每天只有很少的 request 次數

  • 更高階的模型甚至可能直接是 0 次,也就是沒有使用資格


所以如果你還停留在免費層,Google 這條線現在比較適合拿來用一些開源模型,或者中低負載任務。

但如果你本來就有 Google AI Pro,或者你願意綁定信用卡進入付費 tier,那整體體驗會差很多。

因為它除了模型使用資格提高之外,還有一個很關鍵的優勢:每月會送 10 美元的 Google Cloud credits

這 10 美元如果用在一些像 Gemini 2.5 Flash 這種任務上,實際上可以跑出相當可觀的 input token 量。再加上 Gemini 系列的另一個優勢是 context window 很大,有些模型可以到 100 萬 context window 等級,所以如果你的工作型態很常碰到長文件、大量上下文,Google 這條線還是很值得保留。

另外,如果你有綁定 Google Cloud 的付費身分,還有機會拿到額外的雲端試用 credits。這部分我打算放到下一篇另外寫,因為細節比較多。


3. OpenRouter

OpenRouter 的優勢,是它像一個多模型入口。你可以在同一個平台上,接觸到很多不同模型,彈性很高。

如果你只是想試玩,它本來就有免費額度。但如果你願意往帳戶裡放個 10 美元,通常就能解鎖更實用的配額,使用體驗會順很多。

具體來說:

  • 免費使用者:每日上限大約 50 次 request
  • 帳戶餘額超過 10 美元:每日 request 上限可提高到 1,000 次
  • 兩者皆有 20 RPM 限制
但這裡有一個很重要的點,很多人第一次看會誤會。

這 10 美元是存在帳戶裡的餘額,不是說你一儲值就馬上被扣掉。更重要的是,如果你使用的是免費模型,這 10 美元不會被扣款。也就是說,它比較像是一個解鎖更高配額的門檻,而不是你存進去就一定會被吃掉。

所以如果你的使用型態是:


  • 主要跑免費模型

  • 偶爾需要更高的 request 額度

  • 需要一個多模型統一入口


那 OpenRouter 其實很不錯。


如果你是新手,我會怎麼建議你開始

如果你現在是剛開始,不知道從哪裡下手,我的建議如下。

建議做法一:不一定要一次申請太多

可先挑 2 到 3 個夠用的平台就好。

例如:

  • 一個高品質主力模型來源
  • 一個免費備援
  • 一個翻譯或語音專用平台
這樣其實就很夠你先開始了。

建議做法二:依任務分工

這件事很重要。

你不要所有事情都丟同一個模型。

比較合理的做法是:

  • 高階推理、coding:用高品質模型
  • 翻譯、語音、快速小任務:用速度快或免費量大的模型
  • 主力額度快用完時,備援方案立刻接上
這樣你才不會用著用著,突然整條流程停掉。

建議做法三:先把 API 申請起來,再談 AI Agent 部署

很多人以為自己卡在安裝。

其實不是。

很多人真正卡住的,是第一步根本不知道 provider、base URL、model、API key 要怎麼填。

所以我的建議很簡單。

你先不要急著把所有 AI Agent 都裝好。先把 API 帳號申請起來,先把常用的 key、provider、model、base URL 這些基本資料整理好。

這樣你後面不管是部署 OpenClaw、做 AI 自動化,還是玩 Vibe Coding,整個流程都會順很多。


    總結

    我幫大家收斂一下。

    做 AI 自動化,不一定要先砸高規硬體。做 AI Agent,也不一定要一開始就花很多 API 成本。

    真正的重點不是先追求最強,而是先把方向弄對。

    你要先知道:

    • 哪些任務適合本地
    • 哪些任務適合雲端
    • 哪些模型適合高階推理
    • 哪些平台適合做備援
    • 哪些免費額度值得先拿起來用
    這些先搞懂,你後面不管是要做 AI Agent、Vibe Coding,還是做各種個人化自動化,才會真的跑得順。

    如果你現在還卡在第一步,我的建議很簡單。

    先把幾個 API 帳號申請起來。

    等你把這些基礎資源先準備好,後面很多事情自然就接得上。

    至於下一篇,我再來分享 Google Cloud 每月免費 10 美元 credits 的申請與使用方式。

    如果你剛好也有這方面需求,可以先把 Google API 這條線準備起來!


    📌 您可能也會有興趣的其他文章

    留言

    熱門文章

    ChatGPT 專案對話打不開?「Unable to load conversation」教你一招解決!

    Notebook LM 語音轉文字完整教學:免費、快速又省力的最佳解法

    用AI一鍵生成簡報PPT投影片真的有那麼神?全網最詳細AI簡報工具彙整與實測心得

    從靜態簡報到全場互動:講師必備的 4 大即時投票系統推薦與使用技巧

    打造數位分身:F5-TTS 本地部署教學與語音克隆應用分享

    不是主持人也能做筆記!Otter.ai、Notta.ai 線上會議即時轉錄逐字稿完整教學

    G6PD 缺乏者的抗生素選擇指南|社區診所常見處方與藥師建議一次搞懂

    GLP-1 減重針安全嗎?瘦瘦針機轉、效果、副作用一次看懂

    提高職場回覆率!有效催辦、不讀不回的實戰解法與預防心法

    快速又免費的語音轉文字神器『Faster Whisper』,一鍵解決影音內容爆量時代的痛點!