본문 바로가기

좋아하는 것_매직IT/96.IT 핫이슈

Tesseract.js v3.0 릴리즈를 소개합니다. (github.com/naptha)

반응형

Tesseract.js v3.0 릴리즈를 소개합니다.

Tesseract.js 는 이미지에서 거의 모든 언어로 된 단어를 가져오는 자바스크립트 라이브러리라고 머릿속에 넣어두시면 되고요..

설치는 아래와 같이 진행하시면 됩니다.

Installation

Tesseract.js works with a <script> tag via local copy or CDN, with webpack via npm and on Node.js with npm/yarn.

CDN

<!-- v2 -->
<script src='https://unpkg.com/tesseract.js@v2.1.0/dist/tesseract.min.js'></script>

<!-- v1 -->
<script src='https://unpkg.com/tesseract.js@1.0.19/src/index.js'></script>

After including the script the Tesseract variable will be globally available.

Node.js

Tesseract.js v3 requires Node.js v14 or higher

# For v3
npm install tesseract.js
yarn add tesseract.js

# For v2
npm install tesseract.js@2
yarn add tesseract.js@2

아래는 주요 내용입니다. 

  • 100개 이상의 언어에 대해서 동작하는 C++로 작성된 Tesseract OCR의 JS 포팅 버전
  • V3 의 개선 사항
    • 엄청 빨라짐 : 브라우저에서는 84%, Node.js에서는 96% 런타임 시간 감소
    • SIMD 지원 장비를 위한 빌드 추가
    • Tesseract v5.1.0 적용(emscripten 3.1.18 사용)
  • V2 의 개선 사항
    • 한번 인식할때 여러개의 언어 동시 지원
    • PNG,JPG,BMP,PBM 지원
    • WebAssembly와 TypeScript 도 지원

좀 더 자세한 내용은 아래 웹페이지를 방문해보시면 좋을것 같네요...

오늘의 블로그는 여기까지고요..
항상믿고 봐주셔서 감사합니다 

728x90
300x250