반응형
안녕하세요,
윈도우 환경에서 Tesseract OCR을 설치하고 파이썬에서 이를 활용하는 방법을 소개하려고 합니다.
Tesseract OCR은 오픈 소스 광학 문자 인식 엔진으로, 이미지에서 텍스트를 추출하는 데 매우 유용합니다.
파이썬과 함께 사용하면 다양한 자동화 및 데이터 추출 작업을 손쉽게 수행할 수 있습니다.
Tesseract OCR 설치하기
1단계: 설치 파일 다운로드
- Tesseract OCR을 설치하기 위해, UB Mannheim의 Tesseract GitHub 페이지로 이동합니다.
- 페이지에서 윈도우용 Tesseract OCR 설치 파일을 찾아 다운로드합니다.
2단계: 설치 프로세스 진행
- 다운로드한 설치 파일을 실행합니다.
- 설치 마법사의 지시에 따라 설치를 진행합니다.
- 설치 중 'Additional language data' 부분에서 필요한 언어를 선택할 수 있습니다.
- 설치는 끝입니다.
파이썬에서 Tesseract OCR 사용하기
1단계: 파이썬 코드 작성
import pytesseract
from PIL import Image
# Tesseract 경로 설정 (필요한 경우)
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
# 이미지에서 텍스트 추출
image = Image.open('example_image.png')
text = pytesseract.image_to_string(image, lang='eng')
print(text)
참고로 파이썬에서 Tesseract OCR을 사용하기 위해, pytesseract 라이브러리가 필요하니 주의해주시기 바랍니다.
(없으면 모듈 설치 고고)
반응형
'IT 전산 > 개발' 카테고리의 다른 글
[파워앱스/PowerApps] 쉐어포인트 리스트로 DB 만들기 (0) | 2024.04.03 |
---|---|
파이썬으로 메이플 랜드 게임의 자동 물약 사용 기능 만들기 (0) | 2024.01.16 |
파이썬에서 keyboard와 mouse 모듈 설치하기 (0) | 2024.01.16 |
파이썬에서 pyautogui 모듈 설치하기 (0) | 2024.01.16 |
윈도우 10에서 파이썬 간단 설치 방법 (0) | 2024.01.16 |