Web

구글 문자인식(OCR) 텍스트 추출하기 / Cloud Vision API (OCR)

saltdoll 2019. 9. 11. 06:11
반응형

문듯 이런 제안이 들어왔답니다.

Invoice에 있는 Customer 이름별로 파일을 분류할 수 있는 프로그램을 만들 수 있는지?

보통 PDF파일 내용이 TEXT형태로 되어 있는 문서의 경우, TEXT의 내용을 뽑아서 정리하는 경우는 있어도,

 

이런 고차원(?)인 요구를 생각해 보지 못했다.

"이미지로 된 문자"를->"TEXT 문자인식"->"회사명 구분"->"파일별"로 분류

해당 내용은 말로써는 쉬운 일이지만, 컴퓨터로는 쉽지 않는 일입니다.

 

오래전부터, 책의 이미지 같은 경우, TEXT문자로 추출하는 프로그램이 있긴 했습니다..

심지어 스캐너 프로그램에서 OCR에 대한 기능을 추가한 버전도 있었죠.

 

 

 

이미지로 된 문자를 TEXT글자로 변환하기

 

간단한 한장의 글자 이미지(TEXT가 쓰여진) 파일을 TEXT로 추출하는게,

구글 드라이브에서 있다고 하네요.

구글 드라이브에서 글자 이미지에 마우스 오른쪽 클릭해서,

"연결 앱"에 Google Doc(Google 문서)으로 Open하면 해당 텍스트가 나오게 된다는 믿기지 않는 실화!!

그것도 무료로, 이미지를 TEXT로 추출하는 방법은 간단합니다.

 

 

(1) Google Drive(구글 드라이브)에서 문자를 추출할 이미지 업로드

구글 드라이브에 이미지 파일 업로드

 

 

(2) 업로드된 이미지에 마우스 오른쪽 클릭(Right Click)

      연결 앱(Open with) -> Google Docs(Google 문서)

업로드한 이미지 파일에 

 

 

(3) 변환 완료

상단에 원본 이미지, 하단에는 TEXT로 변환된 내용이 표시 됩니다.

 

참고: 구글 드라이브 이미지 파일에서 문자 인식(OCR) 텍스트 추출하기 

참고2: 사진에서 문자 인식(OCR), 추출 방법 - 구글 드라이브, 빅스비 비전, 알PDF등

 

 

 

 

 

 

 

 

추가로 구글의 문자 인식 API기술에 대해서 남겨봅니다.

 

 

Google Vision API를 이용한 "이미지의 텍스트 감지" 기술

진정 제가 필요한 부분은 이것이었습니다.

 

광 문자 인식(OCR)

Vision API는 이미지에서 텍스트를 감지하고 추출할 수 있습니다. 다음과 같은 두 가지 주석 특징에서 광 문자 인식을 지원합니다.

 

 

TEXT_DETECTION 임의의 이미지에서 텍스트를 감지하고 추출합니다. 간판이나 표지판이 찍힌 사진을 예로 들 수 있습니다. JSON은 추출된 전체 문자열과 함께 개별 단어와 해당 경계 상자를 포함합니다.

이미지의 문자를 인식 JSON으로 리턴갑을 줌.

DOCUMENT_TEXT_DETECTION도 이미지에서 텍스트를 추출하지만, 응답이 밀집된 텍스트와 문서에 맞게 최적화됩니다. JSON은 페이지, 블록, 단락, 단어, 줄바꿈 정보를 포함합니다

코드 샘플

다양한 프로그래밍 언어별 샘플은 다음 페이지를 참조하세요.

텍스트 감지 요청

GCP 프로젝트 및 인증 설정

Google Cloud Platform(GCP) 프로젝트와 서비스 계정 사용자 인증 정보를 만들지 않았다면 지금 만듭니다. 이 섹션을 펼쳐서 안내를 참조하세요.

 

 

텍스트 감지 샘플은 다양한 언어로 지원합니다.

TEXT_DETECTION (PHP샘플 링크)

https://cloud.google.com/vision/docs/detecting-text?hl=ko#vision-text-detection-php

 

 

전체 내용: https://cloud.google.com/vision/docs/ocr?hl=ko

 

텍스트 감지(OCR)  |  Cloud Vision API 문서  |  Google Cloud

참고: 최근에 문서 텍스트 감지에 새로운 기능과 필드가 추가되었습니다. 자세한 내용은 출시 노트를 참조하세요.참고: 이 API를 모바일 앱에서 사용하는 경우 Firebase용 ML 키트를 사용해 보세요. 이 키트는 Cloud Vision 서비스를 사용하기 위한 네이티브 Android 및 iOS SDK와 함께 커스텀 ML 모델을 사용하는 기기별 ML Vision API 및 기기별 추론을 제공합니다. 광 문자 인식(OCR) Vision API는 이미지에서 텍

cloud.google.com

 

 

Google Vision API를 사용한 글자 인식: 

https://ssungkang.tistory.com/entry/Google-Vision-API-%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%9C-%EA%B8%80%EC%9E%90-%EC%9D%B8%EC%8B%9D

 

 

반응형
도움이 되셨다면 하트모양의 "♡ 공감"을 눌러주시면 큰 격려가 됩니다.
(로그인하지 않으셔도 가능)