TessearctNotFoundError
Python pytesseract 패키지
안녕하세요! 파이썬으로 이미지에서 텍스트를 인식하는 OCR을 위해서는 pytesseract 패키지를 설치해주어야 합니다. pytesseract 패키지를 설치하고 나면 OCR을 간단한 코드로 실행할 수 있는데요. pip를 통해 pytesseract 패키지를 설치했음에도 해당 패키지를 쓰려는 순간 “[winerror 2] 액세스가 거부되었습니다” 혹은 “TessearctNotFoundError: tesseract is not installed or it’s not in you PATH” 에러가 뜰 수 있습니다. tessearact가 직접 설치되지 않아 발생하는 문제로 아래 방법을 통해 쉽게 해결 할 수 있어요.
pytesseract 설치 방법
1. 아래 링크에 접속하여 32bit 혹은 64bit 중 맞는 버전으로 tesseract.exe를 다운로드
링크: https://github.com/UB-Mannheim/tesseract/wiki
저는 64bit 다운받았어요!
2. 설치 진행
아래 이미지들을 따라 설치를 진행해주세요.
위의 단계에서 Additional script data 체크한 후 [+] 버튼을 눌러 언어 확장하여 Korean 체크하고 Next 눌러주세요!
다운로드 폴더 경로를 C:\Users\사용자명\AppData\Local로 변경한 후 Next를 눌러줍니다.
3. 설치 완료 후 실행 방법
마지막으로 가장 중요한 단계입니다! 설치 후 코드를 실행할 때, 경로를 미리 추가해주어야 해요. tesseract.exe 파일의 경로를 pytesseract.pytesseract.tesseract_cmd
변수에 할당해줍니다.
import pytesseract
from PIL import Image
#경로 추가
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\Username\AppData\Local\tesseract.exe'
#이미지 읽기
image_f = Image.open('./image/sample.png')
config = ('-l kor+eng --oem 3 --psm 11')
pytesseract.image_to_string(image_f, config=config)
이제 이미지를 잘 인식해오는 걸 확인하실 수 있을 거에요.😊 감사합니다.