문듯 이런 제안이 들어왔답니다.
Invoice에 있는 Customer 이름별로 파일을 분류할 수 있는 프로그램을 만들 수 있는지?
보통 PDF파일 내용이 TEXT형태로 되어 있는 문서의 경우, TEXT의 내용을 뽑아서 정리하는 경우는 있어도,
이런 고차원(?)인 요구를 생각해 보지 못했다.
"이미지로 된 문자"를->"TEXT 문자인식"->"회사명 구분"->"파일별"로 분류
해당 내용은 말로써는 쉬운 일이지만, 컴퓨터로는 쉽지 않는 일입니다.
오래전부터, 책의 이미지 같은 경우, TEXT문자로 추출하는 프로그램이 있긴 했습니다..
심지어 스캐너 프로그램에서 OCR에 대한 기능을 추가한 버전도 있었죠.
이미지로 된 문자를 TEXT글자로 변환하기
간단한 한장의 글자 이미지(TEXT가 쓰여진) 파일을 TEXT로 추출하는게,
구글 드라이브에서 있다고 하네요.
구글 드라이브에서 글자 이미지에 마우스 오른쪽 클릭해서,
"연결 앱"에 Google Doc(Google 문서)으로 Open하면 해당 텍스트가 나오게 된다는 믿기지 않는 실화!!
그것도 무료로, 이미지를 TEXT로 추출하는 방법은 간단합니다.
(1) Google Drive(구글 드라이브)에서 문자를 추출할 이미지 업로드
(2) 업로드된 이미지에 마우스 오른쪽 클릭(Right Click)
연결 앱(Open with) -> Google Docs(Google 문서)
(3) 변환 완료
상단에 원본 이미지, 하단에는 TEXT로 변환된 내용이 표시 됩니다.
참고: 구글 드라이브 이미지 파일에서 문자 인식(OCR) 텍스트 추출하기
참고2: 사진에서 문자 인식(OCR), 추출 방법 - 구글 드라이브, 빅스비 비전, 알PDF등
추가로 구글의 문자 인식 API기술에 대해서 남겨봅니다.
Google Vision API를 이용한 "이미지의 텍스트 감지" 기술
진정 제가 필요한 부분은 이것이었습니다.
광 문자 인식(OCR)
Vision API는 이미지에서 텍스트를 감지하고 추출할 수 있습니다. 다음과 같은 두 가지 주석 특징에서 광 문자 인식을 지원합니다.
TEXT_DETECTION은 임의의 이미지에서 텍스트를 감지하고 추출합니다. 간판이나 표지판이 찍힌 사진을 예로 들 수 있습니다. JSON은 추출된 전체 문자열과 함께 개별 단어와 해당 경계 상자를 포함합니다.
DOCUMENT_TEXT_DETECTION도 이미지에서 텍스트를 추출하지만, 응답이 밀집된 텍스트와 문서에 맞게 최적화됩니다. JSON은 페이지, 블록, 단락, 단어, 줄바꿈 정보를 포함합니다
코드 샘플
다양한 프로그래밍 언어별 샘플은 다음 페이지를 참조하세요.
텍스트 감지 요청
GCP 프로젝트 및 인증 설정
Google Cloud Platform(GCP) 프로젝트와 서비스 계정 사용자 인증 정보를 만들지 않았다면 지금 만듭니다. 이 섹션을 펼쳐서 안내를 참조하세요.
텍스트 감지 샘플은 다양한 언어로 지원합니다.
TEXT_DETECTION (PHP샘플 링크)
https://cloud.google.com/vision/docs/detecting-text?hl=ko#vision-text-detection-php
전체 내용: https://cloud.google.com/vision/docs/ocr?hl=ko
Google Vision API를 사용한 글자 인식:
'Web' 카테고리의 다른 글
Proxima Nova폰트 (0) | 2019.12.31 |
---|---|
301 Moved Permanently - HTTP 상태 코드 (리다이렉트) (0) | 2019.10.23 |
구글 WebP 이미지 포멧 파일, PNG 이미지 포멧으로 저장하기 (0) | 2019.07.04 |
Google Maps Platform의 API Key 발급 및 InvalidKeyMapError 에러 - 결재 수단을 연결해 줘야 합니다. (0) | 2019.06.19 |
컬러 색상표 Pantone Color 찾기 (0) | 2019.04.25 |
구글 문서(docs) 웹 페이지로 공유하기 웹 게시 하기 (웹에 게시: Publish to the web)" (0) | 2019.02.19 |
웹메일 roundcube - open source webmail software (0) | 2018.10.04 |
티스토리 사이트맵 생성, 네이버 / 구글 웹마스터 도구에 제출하기 (SEO) (0) | 2018.09.14 |
(로그인하지 않으셔도 가능)