पिछले दिनों फुरसतिया जी ने लिखा था कि क्या कोई ऐसा साफ्टवेयर या जुगाड़ नहीं है जिससे इमेज से टेक्स्ट को अलग कर सकें जिससे टाईपिंग का झंझट खत्म हो सके? आज जब नेट पर कुछ सर्च कर रहा था तो पता चला कि इस तरह के प्रोग्राम को OCR (Optical Character Recognition) कहते हैं। जब मैंने हिंदी के ओसीआर कि खोज की तो अपने भारत सरकार की साईट पर बहुत से काम के साफट्वेयर मिले जिनमें हिंदी ओसीआर भी मिल गया। हो सकता है कि पुराने चिट्ठाकारों को इसकी जानकारी भी हो।
इस प्रोग्राम में किसी भी इमेज में शामिल हिंदी टेक्स्ट को अलग करके टेक्स्ट फाईल में सेव कर सकते हैं। मैंने इसे डाउनलोड कर के चलाया तथा एक रागदरबारी के पेज से टेक्स्ट को अलग भी किया मगर नतीजे में जो नजर आ रहा है वह ठीक नहीं है। क्या कोई भाई इसके आगे का तरीका जानता है जिससे वाकई टाइपिंग के झंझट से छुटकारा मिल सके?









ye sachmuch bade kaam ki cheez hai.. zaroor yaad rakhonngi! Thank you.. aur naye varsha ki shubh kaamnaayein bhi!
इस चित्रांकन नामक OCR टूल के बारे में मैंने फुरसतिया जी की पोस्ट पर टिप्पणी में ही बता दिया था। आपने इस बारे में विस्तृत जानकारी दी धन्यवाद !
लेकिन खेद की बात है कि पहले तो इंग्लिश के ही OCR खास काम नहीं करते फिर हिन्दी वालों का तो कहना ही क्या। ये टूल मैंने आजमाया था खास कामयाब नहीं।
मैंने भी चित्रांकन को उपयोग करने की कोशिश करी थी मगर उसमें जितनी ग़लतियाँ आ रही थीं, वह देखकर मैंने सोचा कि इससे जल्दी तो मैं ख़ुद लेख को टाइप ही कर लूंगा। अभी ओ०सी०आर टेक्नॉलोजी को पूरी तरह से विकसित होनें में बहुत समय है।
इस बात की चर्चा मुझ से मितुल से हुई था कि इस तरह का जुगाड़ हो तो अच्छा है! बाद में आशीष ने भी देखने खोजने की बात कही थी। श्रीश जी ने भी बताया था।१० एमबी के चलते हमने प्रयास नहीं किया। लेकिन चलो यह तो पता चला कि अभी हिंदी में इस तरह का जुगाड़ नहीं है!
भारत सरकार द्वारा रिलीज़ किए गए इन सॉफ्टवेयरों पर विनय ने एक विस्तृत विवेचना निरन्तर पर लिखी थी जुलाई 2005 के अंक में, “दिल्ली अभी दूर है” शीर्षक के अन्तर्गत। वह अंक अब मिल नहीं रहा है, पर मुझे अपने ईमेल से एक ड्राफ्ट मिला है जिसे मैं ने फिलहाल यहाँ डाल दिया है। उन का भी चित्रांकन के साथ अनुभव सुहाना नहीं रहा था।
चित्रांकन समेत हिन्दी के अन्य सॉफ़्टवेयर का रीव्यू मैंने भी किया था - यह प्रविष्टि देखें:
http://raviratlami.blogspot.com/2006/01/05_113620373975929285.html
जितनी जल्दी इस दिशा में काम हो अच्छा है
हमें तो बहुत सी ई-बुक्स बनानी हैं