2024年11月2日

利用 Python + EasyOCR 實現圖片轉文字辨識

最近剛好有個需求寫點小程式把圖片裡頭的文字抽出來,所以就稍微研究了一下 OCR 的部份。 

目前幾個常見的 OCR Library 包含 easyocr 以及 tesseract ,其中 tesseract 的速度比較快,但是我自己試用過後覺得中文辨識的成功率偏低,尤其當你來源的圖片背景和顏色比較雜的時候。 我自己覺得 tesseract 可能比較適合拿來辨識一些基礎版 CAPTCHA 的圖片。而 Easy OCR 不論是使用上還是成功率我都覺得高出許多。

Site Meter