OCR (ওসিআর) কি?
ওসিআর হল ছবি থেকে লেখা গুলোকে টাইপ আকারে নিয়ে আসা। এতে লেখাগুলোকে Text ফরমেটে সংরক্ষন ও এডিট করা যায়। বিশাল স্পেস/এমবি বাঁচে। আর পুড়াতন দলিলগুলোকে ওয়েবে/ফাইলে সংরক্ষন করা যায়। সার্চ দেয়া যায়। ডাটা বেজে রাখা যায়। যা ছবি/স্কেন কপি তে করা অসম্ভব।
বাংলা OCR অনেক কঠিন। আজ থেকে ১৫-২০ আগেই উন্নত ইংরেজি ওসিয়ার চালু হলে বাংলায় এখনো ভাল কোন ওসিআর চালু নেই। কেন? যুক্তবর্ণ, শব্দের অপ্রতুলতা, জটিল লেখনী, গবেষনার অভাব। এজন্যই সরকার গত ১০-১৫ বছর যাবৎ এটা বানানো চেষ্টা করছে। আর এজন্য শত শত কোটি টাকা খরচ করছে।
বাংলাদেশ সরকারের বানানো বাংলা OCR
তথ্য ও যোগাযোগ প্রযুক্তি (আইসিটি) বিভাগের আওতাধীন বাংলাদেশ কম্পিউটার কাউন্সিলের (বিসিসি) একটি উদ্যোগ হচ্ছে ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ প্রকল্প, যা ‘বাংলা প্রজেক্ট’ নামে পরিচিত। এই প্রকল্পের ব্যয় প্রায় ১৫৯ কোটি টাকা এবং এর অধিকাংশ কাজ পেয়ে গেছে সাবেক প্রধানমন্ত্রী শেখ হাসিনার উপদেষ্টা সালমান এফ রহমানের বেক্সিমকো গ্রুপের বিভিন্ন প্রতিষ্ঠান।
বাংলা প্রজেক্ট’ নামে পরিচিত এই প্রকল্পের ব্যয় প্রায় ১৫৯ কোটি টাকা
প্রকল্পের ১৬টি কম্পোনেন্টের জন্য টেন্ডার ব্যয়ের ৩৩ শতাংশ অর্থাৎ এক-তৃতীয়াংশ কাজ পেয়েছে বেক্সিমকো ও তার সংশ্লিষ্ট প্রতিষ্ঠানগুলো। তবে, প্রকল্পের টেন্ডারের যৌক্তিকতা নিয়ে প্রশ্ন উঠেছে এবং প্রযুক্তি বিশেষজ্ঞরা এর ভবিষ্যৎ সফলতা নিয়ে উদ্বেগ প্রকাশ করেছেন। প্রকল্পের কর্মকর্তারা দাবি করছেন, বাংলা প্রজেক্ট বিদেশিনির্ভরতা কমাতে সহায়ক হবে।
এই ১০ বছরব্যাপী প্রকল্পটি ২০১৬ সালের জুনে শুরু হয় এবং ২০২৬ সালের জুনে শেষ হবে। প্রকল্পের প্রাক্কলিত ব্যয় ১৫৮ কোটি ৯৬ লাখ টাকা। বর্তমানে, ১৫টি দরপত্র থেকে প্রায় এক ডজন বেসরকারি প্রতিষ্ঠান বিভিন্ন কারিগরি কাজে নিয়োজিত রয়েছে, যার মোট দর ৭৫ কোটি ১১ লাখ ৭৯ হাজার ৪৪১ টাকা।
বিশেষত, অনুভূতি বিশ্লেষণী সফটওয়্যার তৈরির জন্য সিস্টেক, গিগাটেক, বেক্সিমকো কম্পিউটার্স এবং টিম ইঞ্জিন যৌথভাবে ৪ কোটি ৭৬ লাখ ৬৩৪ টাকার কাজ পেয়েছে, যার মধ্যে তারা ইতিমধ্যেই ৪ কোটি ৫২ লাখ ২০ হাজার ৬০৩ টাকা পেয়ে গেছে। এছাড়াও, ‘বাংলা সিনট্যাক্টিক ট্রিব্যাংক করপাস উইথ প্রসেসিং পাইপলাইন অ্যান্ড ডিস্ট্রিবিউশন প্ল্যাটফর্ম’ শীর্ষক একটি প্রকল্পে ১৯ কোটি ২২ লাখ ৮০ হাজার ৭৭৬ টাকার কাজ পেয়েছে ড্রিম ডোর, গিগাটেক, টিম ইঞ্জিন ও বেক্সিমকো কম্পিউটার্স, যার জন্য তারা ৩ কোটি ৭৫ লাখ ৪৬ হাজার ৫০৭ টাকার পেমেন্ট পেয়ে গেছে।
মোট মিলিয়ে, বেক্সিমকো ও তার সহযোগী প্রতিষ্ঠানগুলো ২৩ কোটি ৯৮ লাখ ৮১ হাজার ৪১০ টাকার কাজ পেয়েছে, যা ১৫টি দরপত্রের মোট মূল্যের ৩৩ শতাংশ। অর্থাৎ, প্রকল্পটির এক-তৃতীয়াংশ কাজই বেক্সিমকো নিয়েছে।
বাস্তবতা ও কাজের অবস্থা
বাস্তবতা হল ‘বাংলা প্রজেক্ট’ ও অতীতের আরো অনেক প্রজেক্টের দ্বারা বানানো বাংলা ভাষার এসব ওয়েব এপ্লিকেশন কোনটাই ঠিক মত কাজ করে না। অথচ এখন পর্যন্ত আমাদের জানা মতেই ২০০-৩০০ কোটি টাকা খরচ হয়ে গেছে।
অথচ এসব প্রজেক্ট উন্মুক্ত ভাবে করা হলে ১ কোটি টাকায় হয়ে যেত, সম্ভবত। অবশ্য বিক্রোত্তর সেবার জন্য প্রতি বছর ফি লাগবে।
করনীয়
- এসকল কাজ উন্মুক্ত দরপত্রে মাধ্যমে দেয়া। প্রয়োজনে অনলাইন ফ্রিল্যান্স সাইট গুলোকে ব্যবহার করা। ODESK, Freelancer, Guru, UpWork, LinkedIn সহ দেশীয় BDJobs এও বিজ্ঞপ্তি দেয়া। এগুলো সবগুলোতে বিজ্ঞপ্তি দিতে সরকারের খরচ হবে সর্বোচ্চ ১ লক্ষ টাকা।
- দেশীয় উদ্যোক্তাদের প্রাধান্য দেয়া। এটা খুবই সহজ। শর্তের মাঝে বলে দিলেই হবে।
- একাধিক প্রতিষ্ঠানকে কাজ দেয়া। কাজ দেয়ার শর্ত হিসেবে শধু রিলেটেড অভিজ্ঞতা ও অতীত পারফরমেন্স রেট শর্ত রাখা।
- কাজের আগে টাকা নয়। তবে ১০% সমাপ্তি হলে ১০,০০০৳ বা ১০০ ডলার দেয়া যেতে পারে।
- কাজ শেষে ২ বছরের ফ্রি বিক্রয়োত্তর সেবা নিশ্চিত করা। এজন্য কাজের ফির ২০% বাকি রাখা। পরবর্তি ৮ বছর স্বল্প ফিতে সেবা চালু রাখা।
- ১০০% আমলা মুক্ত রাখা
- বিজয় বাংলা টাইপিং সফটওয়্যার নিষিদ্ধ করে অভ্র ও ওপেনসোর্স সফটওয়্যার গুলোকে অনুমোদন দেয়া।