Breezy Dream™: 2024

2024年11月2日

利用 Python + EasyOCR 實現圖片轉文字辨識

最近剛好有個需求寫點小程式把圖片裡頭的文字抽出來，所以就稍微研究了一下 OCR 的部份。

目前幾個常見的 OCR Library 包含 easyocr 以及 tesseract ，其中 tesseract 的速度比較快，但是我自己試用過後覺得中文辨識的成功率偏低，尤其當你來源的圖片背景和顏色比較雜的時候。我自己覺得 tesseract 可能比較適合拿來辨識一些基礎版 CAPTCHA 的圖片。而 Easy OCR 不論是使用上還是成功率我都覺得高出許多。

(more)