OCR (Optical Character Recognition) 이라는 것은 이미지에서 문자만을 추출해 내는 기술입니다. 흔히 스캔한 이미지에서 글자를 추출하는 방식으로 많이 사용을 합니다.

 

웹서핑을 하다보면 카탈로그 이미지나 PDF로 제작된 문서를 보는 경우가 있습니다. 이런 경우 실린 내용 일부만을 가져오고 싶지만 문자만을 선택할 수가 없습니다.


JOCR 은 우리나라의 개인분이 제작한 무료 프로그램으로 이미지에서 문자만 추출해 줄 수 있는 아주 유용한 프로그램입니다. 한글, 영어, 중국어, 일본어 뿐만 아니라 총 20개국의 문자를 인식합니다. 실행파일 크기는 82KB 에 불과하며, 'recognize'버튼을 클릭하면 간단한 설치 과정이 진행됩니다.

 사용법은 프로그램을 실행한 후

  • 이미지나 PDF 파일을 컴퓨터에 띄워놓고 컴퓨터 화면을 캡쳐합니다.
  • 이미지 속에 포함 된 언어의 종류를 선택합니다.
  • ‘recognize’버튼을 클릭합니다.

 

JOCR 을 이용해 아래 이미지에서 문자만 추출하면

텍스트 파일로 변환 바로 메모장으로 불러옵니다. 내용을 편집하고 새이름으로 저장하면 됩니다.


손으로 쓴 필기 문자의 경우 인식율이 떨어지지만 일반적인 폰트 형식으로 타이핑 된 문자의 인식율은 상당히 뛰어납니다. 가벼운 무료 OCR 프로그램으로 강력 추천하는 프로그램입니다.

ps)  Microsoft Office 2003 or higher version. If JCOR does not work, please manually install "Micorosoft Office Document Imaging" (MODI) that is included in the setup file of Microsoft Office. You can find MODI under "Office Tools" of the setup file.


JOCR 다운로드

지원하는 언어

Chinese, Czech, Danish, Dutch, English, Finnish, French, German, Greek, Hungarian, Italian, Japanese, Korean, Norwegian, Polish, Portuguese, Russian, Spanish, Swedish, Turkish.



이 블로그는 더 이상 업데이트 하지 않습니다. 질문이나 기타 문의 사항은 DRCHOI BLOG 시즌 2를 방문해 주세요.
DRCHOI BLOG 시즌 2
DRCHOI BLOG 편하게 보기
Google Reader or Homepage

댓글을 달아 주세요

  1. Favicon of http://www.ziwoogae.com 지우개닷컴 2009/03/25 11:24  댓글주소  수정/삭제  댓글쓰기

    으압!
    정말 쥑이는 프로그램이네요~

    감사합니다^^

  2. sumy 2009/03/30 16:39  댓글주소  수정/삭제  댓글쓰기

    저는 이런 에러가 나는데요?

    ---------------------------
    JOCR
    ---------------------------
    The error message is ActiveX component can't create object



    Is it proper string image?

    Or, confirm your available language by executing

    [MS Office > MS Office Tools > MS Office Document Imaging]

    and selecting [Tools > Options > OCR tab > OCR Language]
    ---------------------------
    확인
    ---------------------------

    다른 프로그램에 의존성이 있는 건가봐요..

    • Favicon of http://drchoi.or.kr drchoi 2009/03/31 14:55  댓글주소  수정/삭제

      오피스2003 이상이 필요합니다. 오피스가 설치 되었다면 이미지 종류나 언어선택에 따라 에러가 날 수 있습니다. 다른 이미지를 캡쳐해보거나 언어를 잘 선택해 보세요..

  3. 김민우 2009/03/31 14:03  댓글주소  수정/삭제  댓글쓰기

    recognize 눌르면 구성요소 설치 어쩌고뜨다가 오피스 2003설치 씨디나 원본폴더를 찾아서 오케이눌르래는대 눌러도안대여 ~

    • Favicon of http://drchoi.or.kr drchoi 2009/03/31 14:52  댓글주소  수정/삭제

      위에 내용 추가했습니다. Micorosoft Office Document Imaging" (MODI) 을 오피스파일에서 매뉴얼로 인스톨해보세요..MODI 파일은 오피스셋업파일 tool 폴더에 들어있습니다.

  4. 정문규 2009/04/02 18:26  댓글주소  수정/삭제  댓글쓰기

    어째서 영어는 인식되는데 한글을 인식하려 하면 오류가 날까요?
    도와주세요.

  5. 정문규 2009/04/02 18:33  댓글주소  수정/삭제  댓글쓰기

    오피스 환경에 영향을 받기도 할까요?
    시험 삼아 한글 문서를 pdf 파일로 만들어 보고 pdf 파일을 인식해보았습니다.
    english 는 잘 인식되어서 영어를 추출했습니다.

    Korean 으로 인식시켜보니 오류를 보내자고 합니다.
    참고로 저는 오피스 2007을 사용중입니다.

    • Favicon of http://drchoi.or.kr drchoi 2009/04/02 20:42  댓글주소  수정/삭제

      오피스 2003 이상에서는 다 작동된다고 설명되어있는데요..본문 하단의 영어 설명처럼 MODI 를 재설치 해보세요..

  6. 정문규 2009/04/03 18:38  댓글주소  수정/삭제  댓글쓰기

    하하 MODI 재설치 해봤는데도 영어만 인식하고 한글을 인식시키면 오류가 나서 프로그램이 강제종료되네요.
    도와주시려고 하시는데 잘 안돼니 속상합니다. 도움에 감사드립니다.
    제 컴퓨터가 이상한가보네요..ㅠ.ㅠ

    • Favicon of http://drchoi.or.kr drchoi 2009/04/04 08:41  댓글주소  수정/삭제

      제대로 해결이 안되서 안타깝습니다..프로그램에 조예가 깊으면 더 조언해드리고 싶지만...그 이상은 지식이 없네여..ㅜㅜ

  7. 행인 2009/06/14 01:28  댓글주소  수정/삭제  댓글쓰기

    recognize클릭하니가ms오피스툴스들어가라는데그게어디잇음?

  8. aa 2009/07/22 08:19  댓글주소  수정/삭제  댓글쓰기

    저역시도 위와같은 액티브 어쩌구 하는 오류가 뜨고 안되네요.

  9. 나그네 2009/07/29 16:33  댓글주소  수정/삭제  댓글쓰기

    아래 사이트 참고 하세요.

    http://www.geckoandfly.com/tag/document/

    1. office 설치 cd 넣고
    2. 기능 추가.제거
    3. office 도구에서 "-"표시 눌러
    4. microsoft office document imaging
    5. 스캐닝, ocr 및 인덱싱 서비스 필터 활성화 하세요.

  10. 파란곰팅 2009/10/16 12:20  댓글주소  수정/삭제  댓글쓰기

    [어째서 영어는 인식되는데 한글을 인식하려 하면 오류가 날까요?
    도와주세요.]
    윗분의 이 댓글을 캡쳐하면 [* ^ 1 ?rIr 섐??eerlrLlee ?? *痘^ 1뼔 뿶- 였? 섐?oI. * ol. *??菰*?삃* 쒃?]
    이런식으로 나옵니다.
    위의 다른 댓글 영어뜨는거는 켭쳐하면 영어로 잘 나오는데 한글만 이상하게 나오네요.

    • Favicon of http://drchoi.or.kr drchoi 2009/10/16 17:34  댓글주소  수정/삭제

      한글 인식 코드에 문제가 있는 것 같은데 명쾌하게 답변을 드리면 좋겠지만 모든 컴퓨터의 에러를 확인할 수는 없어서요.. 정확히 답변드리기가 어렵습니다.. 죄송..ㅡ,ㅡ;;...

  11. 감사합니다 2009/10/28 11:48  댓글주소  수정/삭제  댓글쓰기

    완전 좋은데요..감사합니다.오전내내 헤매서 겨우 설치완료했네요.
    팁이지만..참고로 2007 엑셀 엔터프라이즈 버젼은 설치가 안됩니다.ㅋㅋㅋ

  12. 하하하 2010/01/10 17:33  댓글주소  수정/삭제  댓글쓰기

    에러 해결하고 나서 프로그램을 공개하세요. 괜히 사람들 시간낭비하게 하지 말고.

    • Favicon of http://drchoi.or.kr drchoi 2010/01/10 19:25  댓글주소  수정/삭제

      이 프로그램은 무료로 제공되는 프로그램입니다.. 에러가 있으면 개발자에게 직접 이메일로 정중히 부탁해 보시길..

    • 존나싸가지없네 2012/01/27 15:16  댓글주소  수정/삭제

      돈내고 쓰는 것도 아니고
      프리웨어 공짜로 쓰는 새끼가 존나 바라는게 많네
      그럼 니가 만들어써 씹새끼야

  13. 하하하 2010/01/10 17:35  댓글주소  수정/삭제  댓글쓰기

    ? esl ? esl ? esl ? esl ? esl ? esl ? esl ?? 」 ? ?? 」 ? 」 겭?겭」 겭 뿶뿶뿶뿶뿶뿶뿶 ? ? 0 0 0 ? ? ? wel ? sel ? wel ? wel ? wel ? wel ? wel 「??????耀跛跛跛跛跛跛

  14. JOCR 개발자 2010/01/21 02:25  댓글주소  수정/삭제  댓글쓰기

    JOCR 업데이트입니다. 제 블로그에 MS Office 2003용과 2007용 JOCR 올려 놓았습니다.
    http://blog.naver.com/woosikjung/10078950821

    • Favicon of http://drchoi.or.kr drchoi 2010/01/21 16:09  댓글주소  수정/삭제

      개발자님께서 직접 업그레이드 정보 알려주셔서 감사드립니다..유용하게 사용 중입니다...:)

  15. 이런 2010/02/22 12:17  댓글주소  수정/삭제  댓글쓰기

    프로그램 오류가 뜨면서 [오류보냄] 창이 뜹니다.
    왜 그런거죠? 오피스 파일도 다 지우고 다시 깔아봐도 안 되는데...
    어쩌다 영어만 되고 한글은 인식을 못하고 계속 [오류보냄] 창만 뜹니다.
    5시간째 이것만 잡고 있습니다. 도와주세요.

    • Favicon of http://drchoi.or.kr drchoi 2010/02/22 12:21  댓글주소  수정/삭제

      바로 위에 jocr 개발자 분이 업그레이드 버전을 소개해 주셨습니다. 해당 블로그를 방문해 보세요

  16. ㅠㅠ 2010/03/04 12:23  댓글주소  수정/삭제  댓글쓰기

    다운받으려고 하는데 어디서 다운받아야 하죠?ㅠㅠ문서가 산더미 같은데 컴퓨터도 일일이 치기 힘들어서 찾아봤더니 스캔으로 문서가 읽어진다 하던데;그 프로그램 맞나요?ㅠㅠ

    • Favicon of http://drchoi.or.kr drchoi 2010/03/04 14:44  댓글주소  수정/삭제

      위에 jocr 개발자님 블로그에 문의해보세요.. 다운로드를 이젠 지원안하는지도 모르겠습니다..구 버전은 포스트 하단의 jocr 다운로드 링크를 클릭하면 다운로드 받을 수 있습니다..ㅡ,ㅡ;

  17. 2011/07/28 11:41  댓글주소  수정/삭제  댓글쓰기

    MODI 문제 땜에 안되서 프로그램 추가/제거 들어가 modi추가 하니깐 되네요.

  18. john deere sickle mower parts diagram 2011/12/30 00:54  댓글주소  수정/삭제  댓글쓰기

    성된 것 I wonder if I can get information for this conference. It'll be more helpful if you can give me more details or contacts. I want to know where to find john deere sickle mower parts diagram, do you?

  19. Favicon of http://glbnews.com 김용대 2012/01/11 13:39  댓글주소  수정/삭제  댓글쓰기

    티끌모아 태산

  20. Favicon of http://inoline.com 원숭이 2012/01/13 17:31  댓글주소  수정/삭제  댓글쓰기

    사공이 많으면 배가 산으로 간다