PhotoScan Rectifier:把手機拍歪的投影片照片,在 Windows 上批次拉正成 PDF


去年,我寫過一篇文章:聽課神器!用 Microsoft 365 Copilot 將研討會投影片秒變完整簡報 PDF

那篇文章主要介紹的是手機上的 Microsoft 365 Copilot App。它可以把研討會現場拍下來的投影片照片,自動抓邊界、自動裁切、自動拉正,最後整理成圖片或 PDF。

簡單說就是,你在現場先用手機拍照,回頭再丟進 App,它會幫你把那些歪歪斜斜、旁邊還拍到牆壁、人頭、桌角的照片,整理成比較像正式簡報的 PDF。

這個流程到現在我還是覺得很好用。尤其在研討會現場,投影片換得很快,你不可能每一張都慢慢手動裁切。先拍下來,之後再批次整理,這個邏輯很合理。

可是用久之後,我也遇到另一個問題。

手機真的很方便,但手機螢幕就是小。

如果只是十幾張照片,手機處理還可以。可是如果是一場完整研討會、一整個下午的課程,照片可能一口氣累積到 50 張、100 張,甚至更多。這時候你要逐張檢查裁切邊界、調整順序、刪掉重複頁、確認 PDF,手機操作就會開始有點累,畢竟畫面很小,只能靠手指拉來來去還是多少有點狼狽。

所以我就開始想:有沒有一個 Windows 電腦版工具,可以做類似的事情?


我真正想要的不是單張修圖工具

一開始我想得很簡單。

既然手機 App 可以做到自動裁切、自動拉正,那 Windows 上應該也有類似工具吧?

後來實際查了一輪,才發現事情可沒有想的那麼單純。

我要的其實不是一般修圖軟體,也不是一般 PDF 合併工具。我真正想要的是這個流程:

  1. 多張照片一次匯入
  2. 批次自動偵測投影片或文件邊界
  3. 自動做梯形校正與透視拉正
  4. 縮圖可以直接標示哪些頁面可能有問題
  5. 我只需要點開少數偵測失敗的頁面手動修正
  6. 最後批次匯出成圖片或 PDF

這件事在手機掃描 App 上很常見。

可是到了 Windows 免費本機工具,反而很難找到一個完整符合的。


試了幾個工具後,發現缺口很明顯

我先測了幾個看起來最接近的工具。

第一個是 Magick Crop & Measure。它的核心功能其實不錯,可以做透視校正,也能處理手機拍歪的文件照片。可是實際用在大量投影片照片時,問題就出來了:一次處理多張並不順。它比較像單張校正工具,不太像我想要的批次工作台。

第二個是 YASW。它可以批次匯入,看起來方向比較接近。但我實測時沒有看到符合需求的自動邊界偵測功能,每一張都還是要自己手動調整。假設只有三五張還好,如果有一百張照片,這就很痛苦。

另外像 NAPS2 這類工具,很適合掃描、排序、合併 PDF,但它主要是掃描器工作流,不太適合直接處理「手機拍攝後尚未裁切的投影片照片」。它可以當最後 PDF 組裝工具,但不符合我這次想要的批次校正流程。

還有一些像 ScanTailorBook Scan WizardPaperScan,或 ToScanned Online Cam ScannerPerspectiveFix 這類網頁版工具,也都各有問題。有些偏舊、有些操作門檻高、有些免費版限制多,有些雖然是網頁工具,但我對研討會照片這種可能包含未公開資訊的資料,還是比較希望能留在本機處理。

所以經過一連串的搜尋之後,我的發現是:現成工具雖然可以做透視校正,但我沒有找到一個同時具備免費、本機、批次處理、批次自動偵測、少數頁面快速手動修正這幾個條件的工具。


那就自己做一個最小可行版本

既然問題已經很清楚,我就決定自己開發一個。

這個工具叫做:

PhotoScan Rectifier

中文名稱是:

照片掃描校正器

它的定位很簡單:

把手機拍歪、還沒裁切的照片,在 Windows 電腦上批次整理成乾淨的掃描影像或 PDF。

雖然我自己的主要使用情境是針對大量的研討會投影片照片,但我不想把它寫死成「投影片工具」。因為同樣的需求也可能會出現在很多地方。

例如:

  • 課程投影幕照片
  • 紙本文件
  • 合約、表單、收據
  • 白板、黑板
  • 公告、海報
  • 書本或講義頁面
  • 電腦螢幕或展示螢幕照片

這些東西本質上都一樣:照片裡有一個你真正想保留的矩形區域,但拍照角度可能是歪的,邊界可能不平行,背景還有很多干擾。

所以重點不是「投影片」,重點是「把照片裡的文件區域抓出來,拉正,整理好」。


PhotoScan Rectifier 目前可以做什麼?

PhotoScan Rectifier 是 Windows 本機可攜式小工具。它不用安裝,不需要 API key,也不會把照片上傳到雲端。

專案放在 GitHub:

https://github.com/taoyutsun/photoscan-rectifier


Windows 版可以從 GitHub Releases 下載:

PhotoScan Rectifier v0.1.0 Release


目前第一版的功能重點如下。

1. 多張照片與資料夾匯入

你可以一次加入多張圖片,也可以直接把整個資料夾拖進視窗。

支援格式包含 JPG、JPEG、PNG、WEBP。匯入後會建立縮圖,不會一開始就把所有大圖全部塞進記憶體。

如果照片是手機拍的,也會自動處理 EXIF 方向,避免明明直拍卻顯示成橫的。

2. 批次自動偵測邊界

按下「批次自動偵測全部頁」後,工具會用 OpenCV 去分析每張照片,尋找最可能的頁面或文件區域。

目前使用的是傳統影像處理,不需要 AI 模型,所以也沒有 API 成本或連網的需求,完全在本地斷網都能快速處理。流程包含灰階、局部對比增強、邊緣偵測、輪廓分析、長直線候選與四邊形評分。

每張照片會有偵測狀態:

  • 綠色:自動偵測成功
  • 黃色:建議檢查
  • 紅色:需要手動修正
  • 灰色:尚未偵測

這個設計的重點是降低你的檢查成本。

你不用每一張都從頭調整。先讓工具跑一輪,再從縮圖列表裡挑黃紅頁面檢查就好。

3. 手動四角與四邊修正

這是我自己很重視的功能。

很多工具都有四角拖曳,但如果你只是想把某一整條邊往內或往外移,用四個角慢慢調其實很煩。

所以目前預覽畫面上有兩種控制點:

  • 黃色點:調整四個角
  • 青色點:平移整條邊

這樣如果自動偵測只差一點點,你可以直接拖動某一條邊,修正速度會快很多。

修正完之後,可以切換到「校正後照片」確認結果。


4. 影像增強與濾鏡

工具也提供一些基本影像增強設定,例如亮度、對比、飽和度、銳利度,以及幾種濾鏡:

  • Original
  • Enhance
  • High contrast
  • Whiteboard style
  • Dark room slide style
  • Document clean

我的原則很簡單:不要把照片修得很假,先讓文字、圖表、頁面內容更容易閱讀。

尤其投影片照片常常會遇到光線不均、投影顏色偏暗、白板文字太淡這類問題。這些情境不一定需要大修,但有一點點可調空間會方便很多。



5. 匯出圖片或 PDF

整理完之後,可以批次匯出 JPG / PNG,也可以合併成單一 PDF。

預設檔名像這樣:

  • page_001.jpg
  • page_002.jpg
  • photoscan_rectifier_output.pdf

如果使用情境選的是投影片,也可以把前綴改成 slide



6. 專案儲存

如果一次處理很多照片,中途不一定會一次完成。

所以工具可以儲存 .psrproj 專案檔。它會記錄每張照片路徑、頁面順序、四角座標、偵測狀態、影像設定與匯出設定。

下次再開啟專案,就不用全部重新偵測一次。


基本使用流程

目前最典型的使用方式是這樣:

  1. 下載並開啟 PhotoScan Rectifier
  2. 拖入一整個照片資料夾
  3. 選擇使用情境,例如「投影片 / 投影幕」或「紙本文件」
  4. 按「批次自動偵測全部頁」
  5. 從左側縮圖看綠、黃、紅狀態
  6. 只打開黃色或紅色頁面檢查
  7. 用黃色角點或青色邊點快速修正
  8. 切換到校正後照片確認結果
  9. 匯出圖片或 PDF

講白話就是,先讓電腦做 95% 的苦工,人只處理剩下那不到 5% 比較需要判斷修正的地方。


目前還不是完美工具,但已經能解決我的痛點

當然,這不是商業級掃描軟體,也不是什麼萬能 AI,這軟體本來就沒有用到 AI 的功能,也不需要。

如果照片反光很嚴重、投影幕邊界不清楚、背景太複雜,或者畫面裡有很多類似矩形的干擾,它還是可能抓錯。(不過這不是廢話嗎🤣)

但這也是為什麼我一開始就把「快速手動修正」放進核心功能。

我的目標很清楚:

大多數頁面自動完成,少數異常頁面可以快速修。

這樣就很夠用了。

因為真實工作流裡,最浪費時間的是每一張都要從零開始手動裁切。只要大部分頁面先自動完成,剩下幾張再人工修,就能省下很多時間。



為什麼要自己做這個小工具?

這件事其實也呼應我平常很常講的一個觀念:

不需要一開始就搞一個很大的系統。

先把你自己最常遇到、最浪費時間、最容易重複發生的問題抓出來。然後做一個最小可行版本,讓它先替你省時間。

PhotoScan Rectifier 對我來說就是這樣。

我做它的出發點很單純:

我已經有一堆手機拍下來的投影片照片,我想在電腦上快速整理成乾淨可讀的 PDF。

如果你也常常需要整理研討會投影片、課程照片、白板照片或紙本資料,也許這個工具會剛好適合你。

科技始終來自於人性,密技始終來自於惰性。

很多小工具會被做出來,原因通常很簡單:我們真的不需要花時間做那些重複又無聊的事情。


📌 您可能也會有興趣的其他文章:

相關連結

留言

熱門文章

Notebook LM 語音轉文字完整教學:免費、快速又省力的最佳解法

ChatGPT 專案對話打不開?「Unable to load conversation」教你一招解決!

從靜態簡報到全場互動:講師必備的 4 大即時投票系統推薦與使用技巧

打造數位分身:F5-TTS 本地部署教學與語音克隆應用分享

用AI一鍵生成簡報PPT投影片真的有那麼神?全網最詳細AI簡報工具彙整與實測心得

不是主持人也能做筆記!Otter.ai、Notta.ai 線上會議即時轉錄逐字稿完整教學

用手機接續操作電腦版 Codex:codexUI 與 Windows 快速啟動器實作

G6PD 缺乏者的抗生素選擇指南|社區診所常見處方與藥師建議一次搞懂

GLP-1 減重針安全嗎?瘦瘦針機轉、效果、副作用一次看懂

快速又免費的語音轉文字神器『Faster Whisper』,一鍵解決影音內容爆量時代的痛點!