最近剛好有個需求寫點小程式把圖片裡頭的文字抽出來,所以就稍微研究了一下 OCR 的部份。
目前幾個常見的 OCR Library 包含 easyocr 以及 tesseract ,其中 tesseract 的速度比較快,但是我自己試用過後覺得中文辨識的成功率偏低,尤其當你來源的圖片背景和顏色比較雜的時候。 我自己覺得 tesseract 可能比較適合拿來辨識一些基礎版 CAPTCHA 的圖片。而 Easy OCR 不論是使用上還是成功率我都覺得高出許多。
Linux, Android, Free Software and misc stuff.
最近剛好有個需求寫點小程式把圖片裡頭的文字抽出來,所以就稍微研究了一下 OCR 的部份。
目前幾個常見的 OCR Library 包含 easyocr 以及 tesseract ,其中 tesseract 的速度比較快,但是我自己試用過後覺得中文辨識的成功率偏低,尤其當你來源的圖片背景和顏色比較雜的時候。 我自己覺得 tesseract 可能比較適合拿來辨識一些基礎版 CAPTCHA 的圖片。而 Easy OCR 不論是使用上還是成功率我都覺得高出許多。