IT

Tesseract와 OpenCV 중에서 무엇을 선택합니까?

lottoking 2020. 9. 14. 21:24
반응형

Tesseract와 OpenCV 중에서 무엇을 선택합니까? [닫은]


나는 최근에 TesseractOpenCV를 만났습니다 . Tesseract는 본격적인 OCR 엔진이며 OpenCV를 프레임 워크로 사용하여 OCR 애플리케이션 / 서비스를 만들 수 있습니다.

내 이미지 중 일부에 Tesseract를 사용하는 것이 괜찮은 것입니다. 나중에 OpenCV를 사용하여 Python을 사용하여 OCR을 수행하는 방법에 대한 매우 간단한 안내 를 보았습니다. 몇 분 만에 시스템 훈련을 마쳤고 좋았습니다. 하지만 실제로는 물론이 방식이 방식을 취한다는 것입니다.

내 구체적인 질문은 다음과 가변합니다.

  • Tesseract와 OpenCV를 사용하여 OCR 앱을 구축하는 방법은 무엇입니까?
  • 다양한 언어로 Tesseract에 사용할 수있는 교육 데이터 세트가 있습니다. OpenCV는 OCR을 달성하기 위해 처음부터 시작할 필요가 있습니다.
  • Wanna-be 상업용 응용 프로그램에 더 많은 것은 무엇입니까?

어떤 제안?


  • Tesseract는 OCR 엔진입니다. 특정 이미지 입력 ​​(단어, 줄, 특히 단락, 페이지, 전역 ​​등)에서 작동하기 위해 Google에서 사용, 작업 및 자금을 지원합니다.

  • 반면 OpenCV는 일부 기능 추출 및 데이터 분류를 수행 할 수있는 기능을 포함하는 컴퓨터 비전 라이브러리입니다. 기본적인 OCR을 수행하는 간단한 문자 분할기와 분류기를 만들 수는 매우 좋은 OCR 엔진은 아닙니다 (예전에 Python에서 만들었습니다. 훈련 데이터에서 벗어나는 입력에는 정말 그렇습니다).

OCR이 얼마나 어려운지에 대한 기본적인 이해를 광범위하게 사용합니다. Tesseract는 실제 OCR 용입니다.


나는 당신이 언급 한 숫자 인식 튜토리얼의이며 , 이것은 tesseract를 대체 할 방법이 말할 것이라고 말할 것입니다.

Tesseract는 정말 좋은 OCR 엔진이며 최고의 OpenSource OCR 엔진입니다.

OCR의 가장 간단한 작업을 이해하기위한 시도 일뿐입니다.

따라서 OCR 앱을 소유 한 권한 OpenCV를 사용하여 이미지를 전처리 한 다음 tesseract 엔진을 적용하는 것이 좋습니다.


두 보완 보완적일 수 있습니다. OpenCV에 대한 논문을 읽는 경우 : https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

"HP가 제품에 사용 된 페이지 레이아웃 분석 기술을 독자적으로 개발하고 있기 때문에 (오픈 소스 용으로 출시되지 않았 음) Tesseract는 자체 페이지 레이아웃 분석이 필요하지 않습니다. 따라서 Tesseract는 입력이 다음과 같은 이진 이미지입니다. 정의 된 다각형 텍스트 영역. "

이러한 유형의 작업은 OpenCV에서 수행 할 수있는 결과 이미지는 Tesseract에 전달됩니다. Git 리포지토리 에서이 유형의 코드 샘플을 사용할 수 있습니다. https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples 샘플은 Tesseract API를 사용하여 이미지를 텍스트로 변환합니다.


OpenCV는 일반적으로 이미지를 분석하고 처리하는 데 사용되는 CV 용 라이브러리입니다 . Tesseract는 이미지에서 텍스트를 추출하는 전용 CV의 특수 하위 집합 인 OCR 용 라이브러리입니다 .

에서 OpenCV.org

..... 감지 및 인식, 이미지 이미지, 비디오에서 인간의 행동 분류, 카메라 움직임 추적, 움직이는 추적, 존재의 3D 모델 추출, 스테레오 카메라에서 3D 포인트 클라우드 생성, 이미지를 결합하여 높은 이미지 생성 장면의 해상도 이미지, 이미지 데이터베이스에서 놀이 이미지 찾기, 플래시를 사용하여 촬영 한 이미지에서 적목 제거, 눈의 움직임 추적, 풍경 인식 및를 설정하여 증강 현실 장치 등

에서 정팔 포체 Github에서 :

..... 직접 사용하거나 (프로그래머의 경우) API를 사용하여 이미지에서 타이핑, 손글씨 또는 인쇄 된 텍스트를 추출 할 수 있습니다. 다양한 언어를 지원합니다.

참고 URL : https://stackoverflow.com/questions/11489824/how-do-i-choose-between-tesseract-and-opencv

반응형