PhotoScan Rectifier:把手機拍歪的投影片照片,在 Windows 上批次拉正成 PDF
去年,我寫過一篇文章:聽課神器!用 Microsoft 365 Copilot 將研討會投影片秒變完整簡報 PDF。
那篇文章主要介紹的是手機上的 Microsoft 365 Copilot App。它可以把研討會現場拍下來的投影片照片,自動抓邊界、自動裁切、自動拉正,最後整理成圖片或 PDF。
簡單說就是,你在現場先用手機拍照,回頭再丟進 App,它會幫你把那些歪歪斜斜、旁邊還拍到牆壁、人頭、桌角的照片,整理成比較像正式簡報的 PDF。
這個流程到現在我還是覺得很好用。尤其在研討會現場,投影片換得很快,你不可能每一張都慢慢手動裁切。先拍下來,之後再批次整理,這個邏輯很合理。
可是用久之後,我也遇到另一個問題。
手機真的很方便,但手機螢幕就是小。
如果只是十幾張照片,手機處理還可以。可是如果是一場完整研討會、一整個下午的課程,照片可能一口氣累積到 50 張、100 張,甚至更多。這時候你要逐張檢查裁切邊界、調整順序、刪掉重複頁、確認 PDF,手機操作就會開始有點累,畢竟畫面很小,只能靠手指拉來來去還是多少有點狼狽。
所以我就開始想:有沒有一個 Windows 電腦版工具,可以做類似的事情?
我真正想要的不是單張修圖工具
一開始我想得很簡單。
既然手機 App 可以做到自動裁切、自動拉正,那 Windows 上應該也有類似工具吧?
後來實際查了一輪,才發現事情可沒有想的那麼單純。
我要的其實不是一般修圖軟體,也不是一般 PDF 合併工具。我真正想要的是這個流程:
- 多張照片一次匯入
- 批次自動偵測投影片或文件邊界
- 自動做梯形校正與透視拉正
- 縮圖可以直接標示哪些頁面可能有問題
- 我只需要點開少數偵測失敗的頁面手動修正
- 最後批次匯出成圖片或 PDF
這件事在手機掃描 App 上很常見。
可是到了 Windows 免費本機工具,反而很難找到一個完整符合的。
試了幾個工具後,發現缺口很明顯
我先測了幾個看起來最接近的工具。
第一個是 Magick Crop & Measure。它的核心功能其實不錯,可以做透視校正,也能處理手機拍歪的文件照片。可是實際用在大量投影片照片時,問題就出來了:一次處理多張並不順。它比較像單張校正工具,不太像我想要的批次工作台。
第二個是 YASW。它可以批次匯入,看起來方向比較接近。但我實測時沒有看到符合需求的自動邊界偵測功能,每一張都還是要自己手動調整。假設只有三五張還好,如果有一百張照片,這就很痛苦。
另外像 NAPS2 這類工具,很適合掃描、排序、合併 PDF,但它主要是掃描器工作流,不太適合直接處理「手機拍攝後尚未裁切的投影片照片」。它可以當最後 PDF 組裝工具,但不符合我這次想要的批次校正流程。
還有一些像 ScanTailor、Book Scan Wizard、PaperScan,或 ToScanned Online Cam Scanner、PerspectiveFix 這類網頁版工具,也都各有問題。有些偏舊、有些操作門檻高、有些免費版限制多,有些雖然是網頁工具,但我對研討會照片這種可能包含未公開資訊的資料,還是比較希望能留在本機處理。
所以經過一連串的搜尋之後,我的發現是:現成工具雖然可以做透視校正,但我沒有找到一個同時具備免費、本機、批次處理、批次自動偵測、少數頁面快速手動修正這幾個條件的工具。
那就自己做一個最小可行版本
既然問題已經很清楚,我就決定自己開發一個。
這個工具叫做:
中文名稱是:
照片掃描校正器
它的定位很簡單:
把手機拍歪、還沒裁切的照片,在 Windows 電腦上批次整理成乾淨的掃描影像或 PDF。
雖然我自己的主要使用情境是針對大量的研討會投影片照片,但我不想把它寫死成「投影片工具」。因為同樣的需求也可能會出現在很多地方。
例如:
- 課程投影幕照片
- 紙本文件
- 合約、表單、收據
- 白板、黑板
- 公告、海報
- 書本或講義頁面
- 電腦螢幕或展示螢幕照片
這些東西本質上都一樣:照片裡有一個你真正想保留的矩形區域,但拍照角度可能是歪的,邊界可能不平行,背景還有很多干擾。
所以重點不是「投影片」,重點是「把照片裡的文件區域抓出來,拉正,整理好」。
PhotoScan Rectifier 目前可以做什麼?
PhotoScan Rectifier 是 Windows 本機可攜式小工具。它不用安裝,不需要 API key,也不會把照片上傳到雲端。
專案放在 GitHub:
https://github.com/taoyutsun/photoscan-rectifier
Windows 版可以從 GitHub Releases 下載:
PhotoScan Rectifier v0.1.0 Release
目前第一版的功能重點如下。
1. 多張照片與資料夾匯入
你可以一次加入多張圖片,也可以直接把整個資料夾拖進視窗。
支援格式包含 JPG、JPEG、PNG、WEBP。匯入後會建立縮圖,不會一開始就把所有大圖全部塞進記憶體。
如果照片是手機拍的,也會自動處理 EXIF 方向,避免明明直拍卻顯示成橫的。
2. 批次自動偵測邊界
按下「批次自動偵測全部頁」後,工具會用 OpenCV 去分析每張照片,尋找最可能的頁面或文件區域。
目前使用的是傳統影像處理,不需要 AI 模型,所以也沒有 API 成本或連網的需求,完全在本地斷網都能快速處理。流程包含灰階、局部對比增強、邊緣偵測、輪廓分析、長直線候選與四邊形評分。
每張照片會有偵測狀態:
- 綠色:自動偵測成功
- 黃色:建議檢查
- 紅色:需要手動修正
- 灰色:尚未偵測
這個設計的重點是降低你的檢查成本。
你不用每一張都從頭調整。先讓工具跑一輪,再從縮圖列表裡挑黃紅頁面檢查就好。
3. 手動四角與四邊修正
這是我自己很重視的功能。
很多工具都有四角拖曳,但如果你只是想把某一整條邊往內或往外移,用四個角慢慢調其實很煩。
所以目前預覽畫面上有兩種控制點:
- 黃色點:調整四個角
- 青色點:平移整條邊
這樣如果自動偵測只差一點點,你可以直接拖動某一條邊,修正速度會快很多。
修正完之後,可以切換到「校正後照片」確認結果。
4. 影像增強與濾鏡
工具也提供一些基本影像增強設定,例如亮度、對比、飽和度、銳利度,以及幾種濾鏡:
- Original
- Enhance
- High contrast
- Whiteboard style
- Dark room slide style
- Document clean
我的原則很簡單:不要把照片修得很假,先讓文字、圖表、頁面內容更容易閱讀。
尤其投影片照片常常會遇到光線不均、投影顏色偏暗、白板文字太淡這類問題。這些情境不一定需要大修,但有一點點可調空間會方便很多。
5. 匯出圖片或 PDF
整理完之後,可以批次匯出 JPG / PNG,也可以合併成單一 PDF。
預設檔名像這樣:
page_001.jpgpage_002.jpgphotoscan_rectifier_output.pdf
如果使用情境選的是投影片,也可以把前綴改成 slide。
6. 專案儲存
如果一次處理很多照片,中途不一定會一次完成。
所以工具可以儲存 .psrproj 專案檔。它會記錄每張照片路徑、頁面順序、四角座標、偵測狀態、影像設定與匯出設定。
下次再開啟專案,就不用全部重新偵測一次。
基本使用流程
目前最典型的使用方式是這樣:
- 下載並開啟 PhotoScan Rectifier
- 拖入一整個照片資料夾
- 選擇使用情境,例如「投影片 / 投影幕」或「紙本文件」
- 按「批次自動偵測全部頁」
- 從左側縮圖看綠、黃、紅狀態
- 只打開黃色或紅色頁面檢查
- 用黃色角點或青色邊點快速修正
- 切換到校正後照片確認結果
- 匯出圖片或 PDF
講白話就是,先讓電腦做 95% 的苦工,人只處理剩下那不到 5% 比較需要判斷修正的地方。
目前還不是完美工具,但已經能解決我的痛點
當然,這不是商業級掃描軟體,也不是什麼萬能 AI,這軟體本來就沒有用到 AI 的功能,也不需要。
如果照片反光很嚴重、投影幕邊界不清楚、背景太複雜,或者畫面裡有很多類似矩形的干擾,它還是可能抓錯。(不過這不是廢話嗎🤣)
但這也是為什麼我一開始就把「快速手動修正」放進核心功能。
我的目標很清楚:
大多數頁面自動完成,少數異常頁面可以快速修。
這樣就很夠用了。
因為真實工作流裡,最浪費時間的是每一張都要從零開始手動裁切。只要大部分頁面先自動完成,剩下幾張再人工修,就能省下很多時間。
為什麼要自己做這個小工具?
這件事其實也呼應我平常很常講的一個觀念:
不需要一開始就搞一個很大的系統。
先把你自己最常遇到、最浪費時間、最容易重複發生的問題抓出來。然後做一個最小可行版本,讓它先替你省時間。
PhotoScan Rectifier 對我來說就是這樣。
我做它的出發點很單純:
我已經有一堆手機拍下來的投影片照片,我想在電腦上快速整理成乾淨可讀的 PDF。
如果你也常常需要整理研討會投影片、課程照片、白板照片或紙本資料,也許這個工具會剛好適合你。
科技始終來自於人性,密技始終來自於惰性。
很多小工具會被做出來,原因通常很簡單:我們真的不需要花時間做那些重複又無聊的事情。
📌 您可能也會有興趣的其他文章:
- 聽課神器!用 Microsoft 365 Copilot 將研討會投影片秒變完整簡報 PDF
- PDF 也能像 PowerPoint 一樣簡報?pdf-presenter for Windows 實測與部署教學
- 多格講義 PDF 轉單頁投影片工具升級版:Split PDF Handout to Image Slide 正式開源上架 GitHub
相關連結
- GitHub 專案:PhotoScan Rectifier
- Windows 下載:PhotoScan Rectifier v0.1.0 Release
留言
張貼留言