2016년 1월 4일 월요일

OCR(텍스트 인식) 인식시키는 방법


다운 받으신 도서 중에 OCR(텍스트 인식)이 안된 도서의 경우 아래의 방법을 이용하시면 텍스트 인식 기능을 추가하실 수 있습니다.

단일 문서에서 텍스트 인식

  1. 스캔한 PDF를 엽니다.
  2. [도구] > [텍스트 인식] > [이 파일에서]를 선택합니다.
  3. [텍스트 인식] 대화 상자에서 [페이지] 아래 옵션을 선택합니다.
  4. 또는 [편집]을 클릭하여 [텍스트 인식 - 일반 설정] 대화 상자를 열고 필요한 옵션을 지정합니다.

여러 문서에서 텍스트 인식

  1. Acrobat에서 [도구] > [텍스트 인식] > [여러 파일에서]를 선택합니다.
  2. [텍스트 인식] 대화 상자에서 [파일 추가]를 클릭하고 [파일 추가], [폴더 추가] 또는 [열린 파일 추가]를 선택합니다. 그런 다음 파일이나 폴더를 선택합니다.
  3. [출력 옵션] 대화 상자에서 출력 파일에 대한 대상 폴더와 파일 이름 기본 설정을 지정합니다.
  4. [텍스트 인식 - 일반 설정] 대화 상자에서 옵션을 지정한 다음 [확인]을 클릭합니다.

[텍스트 인식 - 일반 설정] 대화 상자

기본 OCR 언어
 
문자를 식별하는 데 사용할 OCR 엔진의 언어를 지정합니다.

PDF 출력 스타일
 
작성할 PDF 유형을 결정합니다. 모든 옵션에 72dpi 이상의 입력 해상도가 필요합니다(권장). 모든 형식은 텍스트 이미지에 OCR과 글꼴 및 페이지 인식을 적용하여 일반 텍스트로 변환합니다.
검색할 수 있는 이미지
 
텍스트를 검색하고 선택할 수 있습니다. 이 옵션을 선택하면 원본 이미지를 보존하고 필요에 따라 기울임을 보정하고 이미지 위에 보이지 않는 텍스트 레이어를 놓습니다. 이 대화 상자에서 선택한 [이미지 다운샘플링] 옵션에 따라 이미지의 다운샘플링 여부와 정도가 결정됩니다.

검색할 수 있는 이미지(압축 안함)
 
텍스트를 검색하고 선택할 수 있습니다. 이 옵션을 선택하면 원본 이미지를 보존하고 이미지 위에 보이지 않는 텍스트 레이어를 놓습니다. 원본 이미지를 최대로 보존해야 할 경우에 권장됩니다.

ClearScan
 
원본과 아주 비슷한 Type 3 글꼴을 새로 합성하고 저해상도 사본을 사용하여 페이지 배경을 유지합니다.


다운샘플링
 
OCR이 완료된 후에는 컬러, 회색 음영 및 단색 이미지의 픽셀 수가 감소합니다. 적용할 다운샘플링 수준을 선택합니다. 숫자가 높은 옵션일수록 다운샘플링 수준은 낮아지고 PDF 해상도는 높아집니다.

댓글 없음:

댓글 쓰기

참고: 블로그의 회원만 댓글을 작성할 수 있습니다.