অনার্স ১ম বর্ষের সকল বিভাগের "তথ্য ও যোগাযোগ প্রযুক্তি ইউনিট-০৮ উদীয়মান প্রযুক্তি: ডেটা বিশ্লেষণ, কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং গাইড পিডিএফ

জাতীয় বিশ্ববিদ্যালয়ের অনার্স ১ম বর্ষের সকল বিভাগের "তথ্য ও যোগাযোগ প্রযুক্তি " (ICT) কোর্সের ইউনিট-০৮ উদীয়মান প্রযুক্তি: ডেটা বিশ্লেষণ, কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং [Emerging Technologies : Data Analytics, Artifical Intelligence, Machine Learning] গাইড পিডিএফ PDF অত্যন্ত আধুনিক এবং গুরুত্বপূর্ণ একটি অধ্যায়।
আপনার পরীক্ষার প্রস্তুতিকে শতভাগ পূর্ণতা দিতে এই অধ্যায়ের গুরুত্বপূর্ণ সব রচনামূলক প্রশ্ন এবং বিগত বছরের প্রশ্নসমূহ পিডিএফ-এ যুক্ত করা হয়েছে। পোস্টের একদম নিচের অংশ থেকে পিডিএফ (PDF) ফাইলটি সংগ্রহ করে নিন।
প্রশ্ন ॥৮.০১৷৷ ডাটা কী?
উত্তর : ভূমিকা : মানবসভ্যতার অগ্রযাত্রায় তথ্য সংগ্রহ ও ব্যবহারের গুরুত্ব অপরিসীম। ডাটা মূলত কাঁচা উপাত্ত, যা বিশ্লেষণ ও প্রক্রিয়াজাত করলে তথ্য (Information)-এ পরিণত হয়। আধুনিক যুগে বিজ্ঞানীগণ গবেষণার ফলাফল লিপিবদ্ধ করতে ডাটার ওপর নির্ভর করেন। ব্যবসা প্রতিষ্ঠানগুলো সিদ্ধান্ত গ্রহণে, আর সরকার জনগণের কল্যাণমূলক কর্মকাণ্ড পরিচালনা করতে ডাটাকে ভিত্তি হিসেবে ব্যবহার করে। ডাটা শুধু ব্যক্তিগত নয়, বরং সামাজিক, অর্থনৈতিক ও প্রযুক্তিগত উন্নতির অপরিহার্য সম্পদ।
❑ ডাটা : Data হলো এমন তথ্যের সেট যা পর্যবেক্ষণ, পরিমাপ বা গবেষণার মাধ্যমে সংগ্রহ করা হয় এবং যেটি বিশ্লেষণ করে সিদ্ধান্ত গ্রহণ, সমস্যা সমাধান বা জ্ঞান অর্জন করা যায়। ডাটা হলো এমন একটি উপাত্ত, যা কোনো ঘটনার রেকর্ড বা পরিমাপিত মানকে প্রকাশ করে। এটি হতে পারে সংখ্যা, লেখা, প্রতীক, অডিও, ভিডিও কিংবা ছবি। ডাটা সরাসরি ব্যবহারযোগ্য নয়, তবে প্রক্রিয়াজাতকরণের মাধ্যমে এটি মানুষের জন্য অর্থবহ তথ্য হিসেবে কাজে লাগে। বর্তমান তথ্যপ্রযুক্তি নির্ভর পৃথিবীতে শিক্ষা, গবেষণা, ব্যবসা, চিকিৎসা, যোগাযোগসহ প্রতিটি ক্ষেত্রে ডাটা মৌলিক সম্পদে পরিণত হয়েছে। ডাটা ছাড়া আধুনিক সমাজের অগ্রগতি কল্পনাই করা যায় না।
❑ প্রামাণ্য সংজ্ঞা :
- W.H. Inmon (Father of Data Warehousing)-এর মতে, ডাটা হলো বিভিন্ন ঘটনা, পরিমাপ ও পরিসংখ্যানের একটি সংগ্রহ, যা অপরিশোধিত অবস্থায় থাকে এবং প্রসেসিংয়ের মাধ্যমে তা অর্থবহ তথ্য উৎপন্ন করতে পারে।
- Oxford English Dictionary অনুযায়ী, ডাটা হলো তথ্য ও পরিসংখ্যান, যা একত্রে সংগ্রহ করা হয় কোনো রেফারেন্স বা বিশ্লেষণের জন্য।
- Merriam-Webster Dictionary অনুযায়ী, ডাটা হলো বাস্তব তথ্য (যেমন পরিমাপ বা পরিসংখ্যান), যা যুক্তি, আলোচনা গণনার ভিত্তি হিসেবে ব্যবহৃত হয়।
উপসংহার : পরিশেষে বলা যায় যে, ডাটা মূলত কাঁচা উপাত্ত, যা তথ্য উৎপাদনের প্রধান উপকরণ। ডাটা একদিকে যেমন বাস্তব ঘটনা ও পরিমাপকে ধারণ করে, অন্যদিকে এটি বিশ্লেষণযোগ্য রূপে সংরক্ষিত হয়। এর প্রক্রিয়াজাতকরণের মাধ্যমেই জ্ঞান অর্জন, সিদ্ধান্ত গ্রহণ ও সমস্যা সমাধান সম্ভব হয়।
প্রশ্ন ॥৮.০২৷৷ ডাটার প্রধান ধরন বা প্রকারভেদ আলোচনা কর।
উত্তর : ভূমিকা : ডাটা হলো কতগুলো বর্ণ, সংখ্যা বা সাংকেতিক চিহ্ন। ডাটা বা উপাত্ত বলতে বুঝায় কোনো ঘটনা, ধারণা বা অসম্পূর্ণ বা এলোমেলো অবস্থায় সংরক্ষণ করা হয়। অন্যভাবে বলা যায় ডাটা হচ্ছে কাঁচামাল যা থেকে তথ্যের উপাত্ত হয়। তাই ডাটা বিভিন্ন ধরনের হয়ে থাকে। ডাটাকে প্রধানত ২ ভাগে ভাগ করা হয়েছে। যথা- ১. নিউমেরিক ডাটা ও ২. নন-নিউমেরিক ডাটা।
১. নিউমেরিক ডাটা : নিউমেরিক ডাটা বলতে বুঝায় ঐ সকল ডাটাকে যা অঙ্কের মাধ্যমে প্রকাশ করা হয়। অর্থাৎ যেসকল ডাটা নিউমেরিক ডিজিট বা অঙ্কের মাধ্যমে প্রকাশ করা হয় তাকে নিউমেরিক ডাটা বলে। নিউমেরিক ডাটা ব্যবহার করতে পূর্ণ সংখ্যা এবং দশমিক সংখ্যার প্রয়োজন হয়। নিউমেরিক ডাটা ৩, ২৯, ২৭ অথবা, ৩, ৫, ৭.৩ ইত্যাদি আকারে প্রকাশ করা হয়। নিউমেরিক ডাটাকে মূলত দুই ভাগে প্রকাশ করা হয়। যথা- (ক) ভগ্নাংশ ডাটা ও (খ) পূর্ণসংখ্যা ডাটা।
(ক) ভগ্নাংশ ডাটা : যেসব ডাটাকে ভগ্নাংশ আকারে প্রকাশ করা হয় তাকে ভগ্নাংশ ডাটা হিসেবে ধরা হয়। ভগ্নাংশ ডাটাকে আবার কয়েকভাগে বিভক্ত করা যায়। যথা- ১. ডাবল ডাটা; ২. লং ডাবল ডাটা এবং ৩. ফ্লোট ডাটা ইত্যাদি।
(খ) পূর্ণসংখ্যা ডাটা : যেসকল ডাটাকে ভগ্নাংশে প্রকাশ না করে পূর্ণসংখ্যায় প্রকাশ করা হয় তাকে পূর্ণসংখ্যা ডাটা বলে। পূর্ণসংখ্যা ডাটাকে নিম্নোক্তভাবে বিভক্ত করা হয়। যথা- ১. লং ডাটা; ২. বাইট ডাটা; ৩. সাইনড ডাটা এবং ৪. আনসাইনড ডাটা ইত্যাদি।
২. নন-নিউমেরিক ডাটা : নিউমেরিক ডাটার বিপরীত ডাটা হলো নন-নিউমেরিক ডাটা। যেসকল ডাটাকে সংখ্যায় প্রকাশ করা হয় না বরং বিভিন্ন চিহ্ন বা বর্ণের মাধ্যমে প্রকাশ করা হয় তাকে নন-নিউমেরিক ডাটা বলে। নন-নিউমেরিক ডাটাকে নিম্নোক্তভাবে বিভক্ত করা যায়। যথা- (ক) স্ট্রিং ডাটা; (খ) ক্যারেক্টার ডাটা এবং (গ) অবজেক্ট ডাটা ইত্যাদি।
(ক) স্ট্রিং ডাটা : স্ট্রিং ডাটা বলতে বুঝায় যেসকল ডাটা এক বা একাধিক ক্যারেক্টার মিলে তৈরি হয় বা প্রকাশ করা হয়। স্ট্রিং ডাটা আকারে অনেক বড় হয়।
(খ) ক্যারেক্টার ডাটা : ক্যারেক্টার ডাটা বলতে বুঝায় যেসকল ডাটাকে বিভিন্ন অক্ষর, বর্ণ, প্রতীক ও চিহ্নের সাহায্যে প্রকাশ করা হয়।
(গ) অবজেক্ট ডাটা : যে ধরনের ডাটাকে অডিও, ভিডিও ও ছবি ইত্যাদি এ ধরনের বিষয়াবলির সাহায্যে প্রকাশ করা হয় তাকে অবজেক্ট ডাটা বলা হয়।
উপসংহার : পরিশেষে বলা যায় যে, ডাটাকে পরিপূর্ণভাবে ফুটিয়ে তুলতে উপরিউক্ত ডাটার সাহায্যে প্রকাশ করলে বা বিভক্ত করলে উক্ত ডাটা পরিপূর্ণতা পায়। তাই ডাটাকে উক্তভাবে প্রকাশ করা হলো।
প্রশ্ন ॥৮.০৩৷৷ প্রাইমারি ও সেকেন্ডারি ডাটা কী?
উত্তর : গবেষণা বা তথ্য বিশ্লেষণে তথ্য সংগ্রহের পদ্ধতি বোঝা অত্যন্ত গুরুত্বপূর্ণ। তথ্য সংগ্রহের ধরন অনুযায়ী ডাটা প্রধানত দুটি ভাগে বিভক্ত- প্রাথমিক ডাটা (Primary data) এবং গৌণ/সহায়ক ডাটা (Secondary data)। এই দুটি ধরন আলাদা উৎস থেকে সংগৃহীত হয় এবং এদের ব্যবহার, সুবিধা ও সীমাবদ্ধতা ভিন্ন। গবেষণা বা রিপোর্ট তৈরিতে উভয়ের সমন্বয় কার্যকর ফলাফল পাওয়ার জন্য গুরুত্বপূর্ণ। প্রাথমিক ও গৌণ ডাটার সঠিক চয়ন গবেষণার নির্ভুলতা, সময় এবং খরচের দিক থেকে প্রভাব ফেলে। শিক্ষার্থী বা গবেষক উভয়েই আছে বৈশিষ্ট্য বোঝার মাধ্যমে তথ্য সংগ্রহ ও বিশ্লেষণে দক্ষতা অর্জন করতে পারে।
❑ প্রাইমারি ডাটা : American Psychological Association (APA) Dictionary of Psychology অনুযায়ী, প্রাইমারি ডাটা হলো এমন তথ্য যা সরাসরি গবেষক নিজেই মূল উৎস থেকে সংগ্রহ করেন; যেমন : সাক্ষাৎকার, জরিপ, পর্যবেক্ষণ, পরীক্ষা ইত্যাদি। এ ধরনের তথ্য সরাসরি পর্যবেক্ষণ, সাক্ষাৎকার, জরিপ, প্রশ্নাবলি বা পরীক্ষা মাধ্যমে সংগ্রহ করা হয়। যেমন, কোনো স্কুলে ছাত্রদের উচ্চতা মাপা, বাজারে পণ্যের মূল্য সংগ্রহ করা বা গ্রাহকের মতামত জানার জন্য সরাসরি প্রশ্ন করা। প্রাথমিক ডাটা সাধারণত নির্দিষ্ট গবেষণার উদ্দেশ্যে সংগৃহীত হয়।
❑ সেকেন্ডারি ডাটা : Randa Tantawi, PhD, EBSCO Research Starters অনুযায়ী, সেকেন্ডারি ডাটা হলো এমন তথ্য যা পূর্বে অন্য কোনো ব্যক্তি বা সংস্থা সংগ্রহ করেছে এবং বর্তমানে নতুন গবেষণার জন্য ব্যবহার করা হচ্ছে। গৌণ বা দ্বিতীয়ক ডাটা হলো এমন তথ্য যা আগে থেকে সংগৃহীত হয়েছে এবং যেকোনো গবেষক বা ব্যক্তি ব্যবহার করতে পারে। এই তথ্য মূল উৎসের পরিবর্তে বিভিন্ন প্রকাশনা, প্রতিবেদন, সরকারি ডাটাবেস, বই, আর্টিকেল বা অনলাইন উৎস থেকে সংগৃহীত হয়। যেমন, সরকারি জনসংখ্যা পরিসংখ্যান, ব্যাংকের বার্ষিক রিপোর্ট বা গবেষণাপত্রের তথ্য। এটি দ্রুত ও কম খরচে প্রাপ্ত হয়, তবে কখনও কখনও তথ্য প্রাসঙ্গিক বা আপডেটেড নাও হতে পারে।
উপসংহার : পরিশেষে বলা যায় যে, প্রাথমিক ডাটা এবং গৌণ ডাটার মধ্যে মূল পার্থক্য হলো সংগ্রহের উৎস ও প্রাসঙ্গিকতা। প্রাথমিক ডাটা সরাসরি মূল উৎস থেকে সংগৃহীত ও নির্ভুল, আর গৌণ ডাটা আগে থেকে সংগৃহীত এবং দ্রুত প্রাপ্তি সম্ভব। গবেষণায় উভয় ধরনের ডাটার সমন্বয় ব্যবহার করে সময়, খরচ এবং নির্ভুলতার মধ্যে সমতা রাখা যায়। সঠিক পদ্ধতিতে ডাটা নির্বাচন গবেষণার ফলাফলকে কার্যকর ও বিশ্বাসযোগ্য করে তোলে।
