免費的OCR神器(光學字元辨識)：輕鬆搞定PDF文字，Snipping Tool與CapCap，主要適用於Windows

因為最近在製作Anki筆記，需要由PDF擷取出文字，彙總使用的方法。

1. Google文件、LibreOffice

將PDF檔存入Google需端硬碟，再使用Google文件開啟。

內容較複雜或內容太多時，經常會轉換成圖片。

LibreOffice Writer也能開啟簡單的PDF，但會轉換成LibreOffice Draw。

如果使用的Windows 11版本是23H2，那麼內建的剪取工具(SnippingTool.exe)會有「文字動作」按鈕，能執行文字辨識的功能，辨識率還不錯。按Win+Shift+S開始擷取。

▼ 複製的文字，順序有誤，但皆有辨識出正確的文字

撒了滿天的珍珠和一枚又大又亮的銀幣」
生機(D)溫暖氣息。

主要營造夏夜何種氛圍?(A)光明希望(B)富麗之感(C)盎然

測試到一款來自日本的擷取工具，剛好符合簡單、易用的目標。

▼ 來源與目的語言皆是繁體中文。

An image to describe post

▼ Copy original後的內容，會多出空白

「 撒 了 滿 天 的 珍 珠 和 一 枚 又 大 又 亮 的 銀 幣 」 主 要 營 造 夏 夜 何 種 氛 圍 ? ( A ) 光 明 希 望 ( B ) 富 麗 之 感 ( C ) 盎 然 生 機 ( D ) 溫 暖 乿 息

勾選右下角的Sample時，會出現ID 1、2、3的三個預設設定，分別是Google Apps Script、DeepL API Free與ChatGPT API，點擊右方的Advanced settings後可輸入連線的網址等資料，屆時提供即時翻譯的功能。

預設設定共供參考，要使用的話必須點擊Sample右方的複製圖示，在產生出的個人設定裡修改。

▼ 範圍視窗擷取

▼ 雙擊Grab的內容視窗可彈出編輯視窗

＃＃

#OCR #PDF文字提取 #Windows工具