<html>
    <head>
      <base href="https://issues.openmandriva.org/">
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_UNCONFIRMED "
   title="UNCONFIRMED - Package request: ocrmypdf"
   href="https://issues.openmandriva.org/show_bug.cgi?id=2101#c3">Comment # 3</a>
              on <a class="bz_bug_link 
          bz_status_UNCONFIRMED "
   title="UNCONFIRMED - Package request: ocrmypdf"
   href="https://issues.openmandriva.org/show_bug.cgi?id=2101">bug 2101</a>
              from <span class="vcard"><a class="email" href="mailto:blackcrack@blackysgate.de" title="blackcrack <blackcrack@blackysgate.de>"> <span class="fn">blackcrack</span></a>
</span></b>
        <pre>Optical character recognition (OCR)
von Janis Koehr (agpl-lizensiert)
Description

Nextcloud OCR (optical character recoginition) processing for images and PDF
with tesseract-ocr and OCRmyPDF brings OCR capability to your Nextcloud 10. The
app uses tesseract-ocr, OCRmyPDF and a php internal message queueing service in
order to process images (png, jpeg, tiff) and PDF (currently not all PDF-types
are supported, for more information see here) asynchronously and save the
output file to the same folder in nextcloud, so you are able to search in it.
The source data won't get lost. Instead: - in case of a PDF a copy will be
saved with an extra layer of the processed text, so that you are able to search
in it. - in case of a image the result of the OCR processing will be saved in a
.txt file next to the image (same folder).

One big feature is the asynchronous ocr processing brought by the internal php
message queueing system (Semaphore functions), which supports workers to handle
tasks asynchronous from the rest of nextcloud.
Prerequisites, Requirements and Dependencies

The OCR app has some prerequisites: - Nextcloud 10 or higher - Linux server as
environment. (tested with Debian 8, Raspbian and Ubuntu 14.04 (Trusty)) -
OCRmyPDF >v2.x (tested with v4.1.3 (v4 is recommended)) - tesseract-ocr
<span class="quote">>v3.02.02 with corresponding language files (e.g. tesseract-ocr-eng)</span >

Please consider: The app will not work with any activated encryption. Also the
OCRWorker has to be present as an active process (see wiki for details).</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are watching all bug changes.</li>
      </ul>
    </body>
</html>