[Python/OCR] TessearactNotFoundError: tesseract is not installed 해결 방법

TessearctNotFoundError

안녕하세요! 파이썬으로 이미지에서 텍스트를 인식하는 OCR을 위해서는 pytesseract 패키지를 설치해주어야 합니다. pytesseract 패키지를 설치하고 나면 OCR을 간단한 코드로 실행할 수 있는데요. pip를 통해 pytesseract 패키지를 설치했음에도 해당 패키지를 쓰려는 순간 “[winerror 2] 액세스가 거부되었습니다” 혹은 “TessearctNotFoundError: tesseract is not installed or it’s not in you PATH” 에러가 뜰 수 있습니다. tessearact가 직접 설치되지 않아 발생하는 문제로 아래 방법을 통해 쉽게 해결 할 수 있어요.

1. 아래 링크에 접속하여 32bit 혹은 64bit 중 맞는 버전으로 tesseract.exe를 다운로드

링크: https://github.com/UB-Mannheim/tesseract/wiki
저는 64bit 다운받았어요!

tesseract.exe 다운로드

2. 설치 진행

아래 이미지들을 따라 설치를 진행해주세요.

1. 언어 선택
2. Next 클릭
3. I agree 클릭
4. Next 클릭
5. Korean 체크 후 Next 클릭

위의 단계에서 Additional script data 체크한 후 [+] 버튼을 눌러 언어 확장하여 Korean 체크하고 Next 눌러주세요!

다운로드 경로 수정
6. 다운로드 경로 수정

다운로드 폴더 경로를 C:\Users\사용자명\AppData\Local로 변경한 후 Next를 눌러줍니다.

7. Intall 클릭
8. Next 클릭 후 설치 완료

마지막으로 가장 중요한 단계입니다! 설치 후 코드를 실행할 때, 경로를 미리 추가해주어야 해요. tesseract.exe 파일의 경로를 pytesseract.pytesseract.tesseract_cmd 변수에 할당해줍니다.

import pytesseract
from PIL import Image

#경로 추가
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\Username\AppData\Local\tesseract.exe'

#이미지 읽기
image_f = Image.open('./image/sample.png')
config = ('-l kor+eng --oem 3 --psm 11') 
pytesseract.image_to_string(image_f, config=config)

이제 이미지를 잘 인식해오는 걸 확인하실 수 있을 거에요.😊 감사합니다.

Leave a Comment