Header Top

তথ্যপ্রযুক্তিতে বাংলার ব্যবহারে আসছে ১৬ টুলস

টেক শহর কনটেন্ট কাউন্সিলর : ওয়েবে বাংলার ব্যবহার বাড়াতে এবং বাংলাকে আধিপত্যশীল ভাষা হিসেবে স্থান করে দিতে ১৬টি টুলস উন্নয়ন করছে সরকার।

সরকারের তথ্যপ্রযুক্তি বিভাগের অধীন বাংলাদেশ কম্পিউটার কাউন্সিল এই টুলসগুলো উন্নয়নে একটি প্রকল্প বাস্তবায়ন করছে। ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ নামের প্রকল্পটি বাস্তবায়ন করা হলেই ব্যবহার করা যাবে এসব টুলস।

প্রকল্পের পরিচালক মো. জিয়াউদ্দীন আহমদ বলেন, এসব টুল উন্নয়ন কিছুটা হলেও সময়সাপেক্ষ ও জটিল। কারণ, এখানে বাংলা ভাষার বিভিন্ন দিক ভেবে-চিন্তেই তা করতে হচ্ছে। তবে এটি বাস্তবায়ন হয়ে গেলেই বাংলা ভাষা তথ্যপ্রযুক্তি মাধ্যমে আধিপত্য প্রতিষ্ঠা করতে পারবে বলে মনে করেন তিনি।

যে ১৬ টুলস উন্নয়ন করা হচ্ছে সেগুলোর বিস্তারিত নিয়েই এই প্রতিবেদন।

১. বাংলা করপাস বা ভাষাংশ : বিশ্বের অন্যতম একটি ভাষা হলেও বাংলা এখনো তথ্যপ্রযুক্তির বিবেচনায় সমৃদ্ধশালী ভাষা হয়ে ওঠেনি। আর এ জন্য দরকার ভাষাংশ বা করপাস তৈরি করা। যেটি হবে প্রতিনিধিত্বমূলক ও ব্যালেন্সড। এটি তৈরিতে নানান প্রক্রিয়া জড়িত। সেগুলো করার কাজ চলছে।

২. বাংলা ওসিআর : কৃত্রিম বুদ্ধিমত্তার সাহায্যে মুদ্রিত বা হাতে লেখা বর্ণমালা শনাক্ত করা যায়। এই পদ্ধতিতে পিডিএফ থাকা বর্ণগুলোকে কম্পিউটারের মাধ্যমে দ্রুত শনাক্ত করা ও সেগুলোকে টেক্সটে রূপান্তর করার কাজও করা হবে।

৩. বাংলা স্পিচ টু টেক্সট এবং টেক্সট টু স্পিচ : এই কম্পোনেন্টের মাধ্যমে বাংলা কথাকে লেখায় এবং লেখাকে কথায় রূপান্তরের কাজ করা যাবে। রেকর্ড বা কারও কথাকে তাৎক্ষণিক লেখায় রূপান্তর করা যাবে। আবার কোন লেখাকে ডিজিটাল স্পিসে রূপান্তর করা যাবে। ফলে অনেক কাজ সময় কমে আসবে কোন কিছু লিখতে গিয়ে।

৪. জাতীয় কিবোর্ডের আধুনিকায়ন : কম্পিউটারে কম্পোজ আরও সহজ করতে জাতীয় কিবোর্ডকে আরও সহজ করা হবে এই প্রকল্পের মাধ্যমে। এর ফলে বিভিন্ন অপারেটিং সিস্টেম যেমন উইন্ডোজ, ম্যাক, অ্যান্ড্রয়েড, আইওএসে একই ধরনের কিবোর্ড ব্যবহার করা হবে।

৫. বাংলা স্টাইল গাইড : প্রযুক্তির সঙ্গে ভাষার সম্মিলনের প্রথম শর্ত হলো ভাষার রীতি এবং ভাষা ব্যবহারের মান ও নীতি ঠিক করা। ভাষার এই মান ও নীতির সংগ্রহ হলো স্টাইল গাউড। এটিও তৈরি করার কাজ করা হবে। যেখানে বর্ণ, প্রমিত বাংল সর্টিং অর্ডার প্রমিতকরণ, সাইন ল্যাঙ্গুয়েজ প্রমিতকরণ, বিরাম চিহ্ন প্রয়োগ নীতিমালা ঠিক করা হবে।

৬. বাংলা বানান ও ব্যকরণ সংশোধন : এতে যে সফটওয়্যার তৈরি হবে তার মাধ্যমে বাংলা ভাষার শব্দ, বানান, বাক্য স্বয়ংক্রিয়ভাবে সম্পাদনা করা যাবে। এটি যে শুধু ভুল বানান ধরবে তা নয়, বরং তা স্বয়ংক্রিয়ভাবে সংশোধন করার পরামর্শ দেবে। এটি দিয়ে মোবাইল, কম্পিউটার ও অন্যান্য মাধ্যমে বাংলা বানান সংশোধন করা সম্ভব হবে।

৭. বহুভাষা করপাস : মেশিন ট্রান্সলেশনের জন্য বাংলার সঙ্গে বিভিন্ন ভাষার সমান্তরাল অনূদিত করপাস প্রয়োজন রয়েছে। এই কম্পোনেন্টের মাধ্যমে বাংলার সঙ্গে দশটি ভাষার সমান্তরাল করপাস উন্নয়ন করা হবে।

৮. বাংলা থেকে আইপিএ কনভার্টার : বাংলা ইউনিকোড টেক্সটকে স্বয়ংক্রিয়ভাবে আইপিএতে প্রকাশ করবে এই কম্পোনেন্ট। সাধারণত এই কনভার্টার সূক্ষ্ম লিপান্তর রীতি অনুসরণ করে তৈরি হবে। আইপিএ আন্তর্জাতিক ধ্বনিমূলক বর্ণমালা মানুষের দ্বারা উচ্চারিত প্রায় সব ধ্বনি লিখিত রূপকে প্রকাশ করা যায়। সাধারণত অভিধান রচয়িতা, বিদেশি ভাষার শিক্ষার্থী-শিক্ষক, ভাষাবিদ, গায়ক, অনুবাদক এই বর্ণমালা ব্যবহার করে থাকে। এটি তৈরি হলে বাংলা ভাষার উচ্চারিত রূপকে আন্তর্জাতিক মান অনুসারে লেখা যাবে।

৯. বাংলা মেশিন ট্রান্সলেটর ডেভেলপমেন্ট : যান্ত্রিক অনুবাদের মাধ্যমে বাংলা ভাষাকে বিভিন্ন ভাষায় স্বয়ংক্রিয়ভাবে অনুবাদ করা। এর অনুবাদকের মাধ্যমে তথ্যমূলক বাংলা, দৈনিন্দন বাংলা, প্রাতিষ্ঠানিক রচনা, সংবাদ বিজ্ঞপ্তি, আবহাওয়া সংবাদসহ আরও অনেককিছু দ্রুত নির্ভুলভাবে অনুবাদ করা সম্ভব হবে।

১০. দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার সফটওয়্যার : এর উন্নয়নের মাধ্যমে দৃষ্টি প্রতিবন্ধী বা স্বল্প দৃষ্টিসম্পন্ন ব্যক্তিরা কম্পিউটার বা মোবাইল ফোন ব্যবহার করতে পারবে। স্ক্রিনে ভেসে ওঠা প্যারাগ্রাফ পড়ে শোনাবে এই সফটওয়্যার।

১১. বাক ও শ্রবণ প্রতিবন্ধীদের জন্য ইশারা ভাষা : এটি মূলত সাইট টু স্পিচ সফটওয়্যার। এর মাধ্যমে কোন কম্পিউটার বা মোবাইলের ক্যামেরার সামনে হাত-পা নাড়িয়ে বা সাইন ল্যাংগুয়েজ বললে সেটি স্পিচ হিসেবে অনুবাদ হয়ে বলে দেবে। এটি এমনকি ইউনিকোড টেক্সটে রূপান্তর হবে।

১২. সেন্টিমেন্ট অ্যানালাইসিস টুলস উন্নয়ন : এর মাধ্যমে কোন ডকুমেন্ট বা প্যারাগ্রাফের টেক্সট বিশ্লেষণ করে বলে দিতে পারবে সেটি ইতিবাচক, নেতিবাচক নাকি নিরপেক্ষ। এর মাধ্যমে ওয়েবসাইটের মন্তব্য বিশ্লেষণ করা যাবে। যা যেকোন ধরনের জরিপের কাজে ব্যবহার করা যাবে।

১৩. বাংলা ফন্ট কনভার্টার : অনেক সময় আমরা বাংলা ফন্ট বিভিন্ন অপারেটিং সিস্টেমে স্থানান্তরের সময় ভেঙে যায়। এমনকি কখনো একটি অ্যাপ্লিকেশন থেকে অন্য অ্যাপ্লিকেশনে নিলেও ফন্ট ভেঙে যায়। সেটা থেকে মুক্তি দেবে এই সফটওয়্যার।

১৪. ক্ষুদ্র-নৃগোষ্ঠী ভাষার কিবোর্ড ও শব্দ ভাণ্ডার : দেশে ক্ষুদ্র-নৃগোষ্ঠীর ভাষাগুলো তথ্যপ্রযুক্তিক্ষেত্রে খুব একটা ব্যবহার হয় না। অধিকাংশ ক্ষেত্রে ভাষার মানসম্মত ডকুমেন্টেশন, রিসোর্স বা ম্যাটেরিয়াল নেই। আবার এদের মধ্যে কিছু বিপন্ন অবস্থায় রয়েছে। অনেক ভাষার পর্যাপ্ত ডেটা নেই, ফন্ট এনকোডিং নেই। সেগুলোকে লিপিতে রূপ দেয়া থেকে শুরু করে নানান ধরনের কাজ করা হবে।

১৫. বাংলা ইউনিকোড : ইউনিকোড লিপি কম্পিউটারে লিখন পদ্ধতির একটি আন্তর্জাতিকভাবে স্বীকৃত মান। বিশ্বের প্রায় সকল প্রধান ভাষায় কম্পিউটার লিপির জন্য কম্পিউটার ইন্ডাস্ট্রির বিজ্ঞানী, বিভিন্ন দেশের প্রতিনিধি ও বিজ্ঞানীদের সমন্বয়ে গঠিত কনসোর্টিয়াম এই মান নির্ধারণ করেন। এই কম্পোনেন্টের মাধ্যমে বাংলাদেশের পক্ষে বাংলা ও অন্যান্য ভাষার ইউনিকোড মান নির্ধারণে সকল প্রকার সমর্থন প্রদান করা হবে।

১৬. ভাষা প্রযুক্তির সমন্বিত প্লাটফর্ম : এই কম্পোনেন্টটি প্রকল্পের সবগুলো সার্ভিসের মিলনবিন্দু হিসেবে কাজ করবে। এখানে ওসিআর, হাতের লেখা শনাক্তরণ, যান্ত্রিক অনুবাদসহ অন্যান্য সব সার্ভিস একসঙ্গে থাকবে। একজন ব্যবহারকারী ব্রাউজারের মধ্যমে এই প্লাটফর্মে প্রবেশ করে উল্লিখিত সার্ভিস ব্যবহার করতে পারবেন। এছাড়াও এখানে থাকবে প্রোডাক্ট শোকেস, যা থেকে সার্ভিস ছাড়াও ডকুমেন্ট ডাউনলোড করা যাবে।

ইএইচ/ফেব্রু১১/২০১৯/১৩৪৩

*

*

আরও পড়ুন