सभी विषयों

+
Home > संसाधन > PDF > ऑप्टिकल वर्ण पहचान (OCR) का ज्ञान

ऑप्टिकल वर्ण पहचान (OCR) का ज्ञान

OCR क्या है?

ऑप्टिकल वर्ण पहचान, आमतौर पर करने के लिए ओसीआर, संक्षिप्त, हस्तलिखित, सॉफ या मुद्रित पाठ की स्कैन की गई छवियों के यांत्रिक या इलेक्ट्रॉनिक अनुवाद मशीन एन्कोडेड पाठ में है।

ओसीआर का उपयोग क्यों?

OCR व्यापक रूप से विभिन्न प्रकार के दस्तावेज़, जैसे स्कैन किए गए पेपर दस्तावेजों, PDF फ़ाइलों या डेटा में संपादन योग्य और खोज करने योग्य एक डिजिटल कैमरे द्वारा कब्जा कर लिया छवियों में कनवर्ट करने के लिए उपयोग किया जाता है। (जैसे कि पुस्तकालयों, कार्यालयों) कुछ व्यावसायिक परिवेशों में, पुस्तकों और दस्तावेजों के हजारों नियमित रूप से बैक अप और पुरालेख के लिए स्कैन कर रहे हैं। एक स्कैनर मात्र मूल पेपर दस्तावेजों, PDF प्रारूप में स्कैन किए गए दस्तावेज़ छवि-आधारित में जिसके परिणामस्वरूप की तस्वीरें लेता है। प्रमुख मुद्दे के प्रसंस्करण और भंडारण के स्कैन किए गए दस्तावेज़ों की इतनी बड़ी मात्रा के साथ एक विशिष्ट वाक्यांश या किसी फ़ाइल के अंदर नाम के लिए खोज करने में असमर्थता है। भी कोई पाठ कर सकते हो पर प्रकाश डाला, की प्रतिलिपि बनाई या संशोधित किया, क्योंकि दस्तावेज़ में एक बड़ा छवि फ़ाइल विरोध अलग-अलग पाठ वर्णों के रूप में नहीं हैं।

OCR Sample

OCR का पालन करने, करने से पहले पृष्ठ पर संपूर्ण क्षेत्र का चयन किया और डाला है और कोई पाठ खोजा और संपादित किया जा सकता।

ओसीआर, पाठ पृष्ठ पर प्रदर्शन कर उपकरण का चयन करने के साथ चुना जा सकता है के बाद, आप खोज और वर्ण, शब्द, और अनुच्छेदों को आसानी से संपादित कर सकते हैं।

कैसे Wondershare पीडीएफ ओसीआर उपकरण आपको मदद करते हैं?

Wondershare पीडीएफ ओसीआर उपकरण आप स्कैन किए गए पीडीएफ़ से पाठ को तेजी से और सही पहचान और कई संपादन योग्य स्वरूप में मान्यता प्राप्त परिणामों को संरक्षित मदद कर सकते हैं।

Wondershare PDF Editor Pro for Mac: बकाया ओसीआर सटीकता और स्वरूप के संरक्षण के साथ, आप खोज, को सही और किसी स्कैन किए गए या छवि-आधारित PDF मैक पर सीधे में पाठ की प्रतिलिपि बनाने के लिए सक्षम करें यह भी आप स्कैन किए गए पीडीएफ़ स्वरूपित पाठ को निर्यात करने के लिए आधारित Word, Excel, PowerPoint, EPUB, HTML, और पाठ स्वरूपित करता है की अनुमति देता है।

Wondershare PDF Converter Pro: स्कैन किए गए पीडीएफ़ से पाठ को बकाया ओसीआर शुद्धता के साथ पहचान और स्कैन किए गए एकाधिक PDFs Word, Excel, PowerPoint, EPUB, HTML, और पाठ दस्तावेज़ पाठ-आधारित Windows पर परिवर्तित कर सकते हैं।


Wondershare PDF Converter Pro for Mac: स्कैन किए गए पीडीएफ़ से पाठ को बकाया ओसीआर शुद्धता के साथ पहचान और स्कैन किए गए एकाधिक PDFs Word, Excel, PowerPoint, EPUB, HTML, और पाठ दस्तावेज़ पाठ-आधारित मैक पर परिवर्तित कर सकते हैं

OCR मान्यता की गुणवत्ता में सुधार करने के लिए कैसे?

OCR मान्यता गुणवत्ता छवि है, जो बहुत दस्तावेज स्कैनिंग की प्रक्रिया के दौरान उपयोग की गई सेटिंग्स पर निर्भर करता है की गुणवत्ता पर काफी हद तक निर्भर करता है। आपके स्कैन किए गए दस्तावेज़ों के लिए बेहतर ओसीआर मान्यता गुणवत्ता प्राप्त करने के लिए, यहाँ दस्तावेज़ को स्कैन करने के लिए कुछ सुझाव हैं:

फ़ॉन्ट भी छोटा है
इष्टतम मान्यता परिणामों के लिए, उच्च संकल्प पर बहुत छोटे फ़ॉन्ट में मुद्रित दस्तावेज़ स्कैन करें।
आप में संकल्प संपत्ति ScanSourceSettings वस्तु का वांछित संकल्प निर्दिष्ट कर सकते हैं।


स्रोत छवि अनुशंसित समाधान
Reader ठेठ ग्रंथों के लिए 300 dpi (आकार के फोंट में छपी 10 pt या बड़े)
Reader छोटे फ़ॉन्ट में मुद्रित ग्रंथों के लिए 400-600 dpi (9pt या छोटे)

चमक ट्यूनिंग
आप जब श्वेत-श्याम मोड में स्कैनिंग चमक सेटिंग समायोजित करने के लिए पड़ सकता है। आप में चमक संपत्ति ScanSourceSettings वस्तु का वांछित चमक निर्दिष्ट कर सकते हैं। एक मध्यम मान लगभग 50% की ज्यादातर मामलों में पर्याप्त होना चाहिए।
यदि जिसके परिणामस्वरूप छवि बहुत सारे "फटे" या एक साथ अक्षर "अटक" होता है, निम्न तालिका का उपयोग कर समस्या निवारण।

आपकी छवि इस तरह दिखता है अनुशंसाएँ
Good Quality इस छवि को मान्यता के लिए उपयुक्त है
Very Light
अक्षर हैं "फटे" या बहुत हल्का
  • छवि गहरा बनाने के लिए चमक कम।
  • ग्रेस्केल में स्कैन करें। चमक स्वचालित रूप से tuned किया जाएगा।
  • Very Dark
    अक्षर बहुत विकृत कर रहे हैं एक साथ अटक, या बाहर भरा
  • छवि को उज्ज्वल बनाने के लिए चमक बढ़ाने
  • ग्रेस्केल में स्कैन करें। चमक स्वचालित रूप से tuned किया जाएगा।
  • मुद्रण गुणवत्ता
    गरीब गुणवत्ता धुंधला और असमान पत्र "शोर के साथ" (यानी यादृच्छिक काले डॉट्स या speckles), दस्तावेज़, या विषम रेखाओं और स्थानांतरित तालिका बॉर्डर्स स्कैनिंग की विशिष्ट सेटिंग्स की आवश्यकता हो सकती है। उदाहरण के लिए, इस फ़ैक्स और अखबार:

    Print Quality

    गरीब गुणवत्ता दस्तावेज सर्वोत्तम ग्रेस्केल में स्कैन कर रहे हैं। जब ग्रेस्केल में स्कैन कर रहा है, कार्यक्रम का इष्टतम चमक मान स्वचालित रूप से का चयन करेंगे।
    ग्रेस्केल मोड में जब गरीब गुणवत्ता के लिए माध्यम के दस्तावेजों को पहचानना बेहतर पहचान परिणामों को प्राप्त करने के लिए स्कैन किए गए पाठ अक्षरों के बारे में अधिक जानकारी बरकरार रखती है।


    संबंधित लेख

    उत्पाद से संबंधित सवाल? बोलो हमारे सहायता टीम को सीधे >>

    शीर्ष