본문 바로가기
윈도우팁

이미지/영상에서 텍스트와 표, 템플릿을 추출하는 몇가지 팁

by 에디터_가을여행 2023. 6. 29.

안녕하세요. 에디터 가을여행입니다.

오늘 이 시간에는 윈도우에서 OCR(광학 문자 인식) 엔진을 활용한 텍스트 추출 기능을 자세히 알아보고, 다양한 프로그램 활용 예와 그 방법에 대해 포스팅 하겠습니다. OCR을 활용하여 업무 효율 증진과 편의성을 극대화 하는 방법을 한번 보여드리겠습니다. 

 OCR (광학 문자 인식) 이란?

OCR은 Optical Character Recognition의 약자로, 광학 문자 인식을 의미합니다. 이 기술은 이미지나 스캔된 문서에서 텍스트를 자동으로 인식하고 추출하는 엔진을 사용합니다. OCR은 다양한 분야에서 활용되며, 텍스트 추출, 문서 인식, 번역, 자동화 등 다양한 목적으로 사용됩니다. 특히, 윈도우 환경에서 OCR 엔진을 활용하면 이미지 파일이나 스캔한 문서에서 손쉽게 텍스트를 추출할 수 있습니다.

 

PowerToys의 텍스트 추출 기술 활용하기

  1. PowerToys는 윈도우에서 유용한 기능을 제공하는 도구 모음입니다. 텍스트 추출 기능을 활성화하기 위해서는 다음 단계를 따라해 주세요.
  2. PowerToys를 설치합니다. 다운로드 링크에서 최신 버전을 다운로드할 수 있습니다.
    설치 후, PowerToys 설정을 열어줍니다. 시작 메뉴에서 [PowerToys 설정]을 검색하거나 PowerToys 아이콘을 시스템 트레이에서 찾아 클릭합니다.
  3. 왼쪽 메뉴에서 [텍스트 추출기]를 선택하고, [텍스트 추출기] 활성화를 켜줍니다.
  4. 이제 스크린샷, 이미지 파일 등을 텍스트로 추출할 수 있습니다. PowerToys가 실행 중일 때, [Ctrl + Shift + M] 키조합을 누르고 추출하고자 하는 영역을 드래그하면 클립보드에 해당 영역의 텍스트가 그대로 저장이 됩니다.
  5. 참고로 아래 스크린 샷의 단축키는 제 설정이며 기본값은 [Ctrl + Shift + M] 으로 되어 있습니다.

텍스트 추출기 설정 화면
레오나르도 AI에서 명령 프롬프트 추출하기

위 영상을 멈추어놓고 단축키 [Ctrl + Shift + M] 을 누르면 드래그가 활성화 되고 영역을 드래그하고 나면 클립보드에 텍스트 내용이 그대로 저장이 됩니다. 해당 텍스트를 다른 응용프로그램에 붙여넣기 하거나 재사용 할 수 있습니다. 저 많은 문장을 그대로 입력하지 않아도 한번에 긁어올 수 있는 기능입니다.

a little girl in a spacesuit in a forest looking at the sunset, full bOdy, drawing a face in maximum quality,
high-quality drawing Of the face, character sheet, illustration for bOOk, children's bOOk, curly hair, blond
hair, watercolor clipart, full lllustration, 4k, sharp focus, watercolor, smooth soft skin, symmetrical, soft
lighting, detailed face, concept art, watercolor style, strybk, children's style fairy tales, chibi kawaii,
Octane rendering, 3d, perfect face, detailed face, delicate face, perfect sharp lips, detailed eyes. Craig
Davison, Aubrey Beardsley, Conrad Roset, Aikut Aidogdu, Agnes Cecil, watercolor style

위 구문을 그대로 긁어온 결과물입니다. 간혹 0(숫자 영)과 O(대문자 O), o (소문자 o)를 잘못 읽어오는 경우도 있고 100% 동작한다고 볼 수는 없지만 여러분의 시간을 많이 절약해 주는것은 사실입니다.

[윈도우팁] - 윈도우 최고의 무료 유틸리티 - 파워토이즈(MS 제공)

 

윈도우 최고의 무료 유틸리티 - 파워토이즈(MS 제공)

안녕하세요. 에디터 가을여행입니다. 오늘은 윈도우 사용자라면 무조건 사용해야하는 유틸리티 [파워토이즈]를 소개해 드리겠습니다. 파워토이즈는 마이크로소프트에서 제공하는 윈도우 운영

sensible-it-life.tistory.com

 

Excel에서 그림 데이터 기능으로 표 편집하기


Excel에서 그림 데이터 기능을 활용하여 표를 불러오고 편집하는 방법에 대해 알아보겠습니다.

  1. Excel을 열고 작업하고자 하는 문서를 생성해줍니다.
  2. 외부 소스로부터 표를 불러오기 위해 "데이터" 탭에 있는 "그림 데이터" 기능을 활용합니다.
  3. "데이터" 탭을 클릭한 후, "그림 데이터" 기능을 선택합니다.
  4. "사진 가져오기" 창이 나타나면 원하는 이미지 파일을 선택하고, "완료" 버튼을 눌러줍니다.
  5. Excel은 이미지 파일을 스캔하여 텍스트 추출을 시도하며, 표 형태로 변환된 데이터를 제공합니다. 이후 사용자는 이 표를 편집하고 데이터를 활용할 수 있습니다.

다른 사람이 올려놓은 엑셀시트 그림 파일

위 그림은 샘플 엑셀시트이며 위 설명대로 단계를 진행하면 다음 결과를 얻으실 수 있습니다. 

새로이 생성된 엑셀시트 파일

위와 같이 클릭 몇번이면 20분 가량의 작업을 한번에 해결해 줄 수 있습니다. 간혹 읽어오지 못하거나 오타자를 입력하기도 하지만 정확하지 않은 텍스트에 대해서는 검토할 것인지 확인하는 인터페이스가 제공이 되고 단계별로 스탭을 넘길 수 있습니다.

그림에서 데이터를 읽고 잘못 읽은 텍스트가 없는지 검토 요청을 하는 과정

위 기능은 마이크로소프트에서(www.office.com ) 제공하는 무료 소프트웨어이며 인터넷만 되면 누구나 사용할 수 있는 기능임을 알려 드립니다.

[IT인터넷] - MS 오피스 365 무료 사용 방법

 

MS 오피스 365 무료 사용 방법

안녕하세요. 에디터 가을여행입니다. 오늘은 윈도우 사용자라면 누구나 사용하고 있는 MS OFFICE 365를 무료로 사용할 수 있는 방법에 대해 알아보겠습니다. 학생용 또는 교육용 버전을 다루거나

sensible-it-life.tistory.com

 

Adobe Acrobat DC에서 PDF 텍스트 인식

Adobe Acrobat DC는 강력한 PDF 편집 도구로 유명합니다. 이 프로그램을 활용하여 OCR을 통해 PDF 파일의 텍스트를 추출하고 편집할 수도 있습니다.

  1. Adobe Acrobat DC를 실행하고, 편집하고자 하는 PDF 파일을 엽니다.
  2. 상단 메뉴에서 [도구] → [PDF 편집]을 선택합니다.
  3. [텍스트 추가]를 클릭하고, PDF 파일에서 원하는 텍스트의 영역을 클릭하여 텍스트를 추가하거나 편집할 수 있습니다.
  4. 추출된 텍스트를 자유롭게 변경하거나 삭제할 수 있습니다. 필요에 따라 텍스트의 크기, 서체, 색상 등을 조정할 수도 있습니다.

 

OneNote에서 OCR 기능 사용하기

OneNote 는 Microsoft Office 스위트에 속하는 노트북 앱입니다. 이미지 파일을 삽입하고 OCR 기능을 사용하여 이미지 내 텍스트를 추출하고 검색할 수 있습니다.

  1. OneNote를 실행하고 메모를 작성합니다.
  2. 이미지를 삽입하려는 위치에 커서를 놓고, 파일 탐색기에서 이미지 파일을 드래그하여 해당 위치에 놓습니다.
  3. 이미지를 클릭하여 선택한 다음, [이미지] 탭에서 [설명을 추가]를 선택합니다.
  4. "설명을 추가" 대화상자에서 "이미지 내 텍스트로 변환" 옵션을 선택하고, 끝까지 진행합니다.
  5. OCR이 적용된 텍스트를 검색할 수 있습니다.

 

 마치면서...

이렇게 PowerToys, Excel 그리고 Adobe Acrobat DC를 활용하여 윈도우에서 제공하는 OCR 엔진을 활용한 다양한 텍스트 추출 기능을 살펴보았습니다. 텍스트 추출은 문서 편집, 데이터 분석, 정보 관리 등 다양한 용도로 활용될 수 있으니, 필요에 따라 이러한 기능을 적극적으로 활용해보시기 바랍니다. 추가로 궁금한 점이 있으면 언제든지 물어보세요!

댓글