Linux, Android, Free Software and misc stuff.
最近剛好有個需求寫點小程式把圖片裡頭的文字抽出來,所以就稍微研究了一下 OCR 的部份。
目前幾個常見的 OCR Library 包含 easyocr 以及 tesseract ,其中 tesseract 的速度比較快,但是我自己試用過後覺得中文辨識的成功率偏低,尤其當你來源的圖片背景和顏色比較雜的時候。 我自己覺得 tesseract 可能比較適合拿來辨識一些基礎版 CAPTCHA 的圖片。而 Easy OCR 不論是使用上還是成功率我都覺得高出許多。