প্রচ্ছদ

সর্বশেষ খবর :

মাসুদ রানা: স্ট্যাটিসটিক ও প্যারামিটার, পার্থক্য কী?

মাসুদ রানা: বিশ্ববিদ্যালয়ে পড়া শিক্ষিতরাও অনেক সময় কতিপয় মৌলিক বিষয়ের সংজ্ঞা না জানার কারণে এদের ভুল ব্যবহার করে থাকেন। এ-রকম একটি ভুলের উদাহরণ হচ্ছে স্ট্যাটিসটিক (Statistic) ও প্যারামিটার (Parameter) সংক্রান্ত।
স্ট্যাটিসটিক (Statistic) ও প্যারামিটার (Parameter) সম্পর্কে পার্থক্যমূলক ধারণা পেতে হলে আমাদের প্রথমেই বুঝতে হবে স্যাম্পল (Sample) ও পপুলেইশন (Population) কী।
পপুলেইশন হচ্ছে সমুদয়, সমগ্র বা সকল, যেখানে কেউ বাদ নেই। উদাহরণ স্বরূপ, বাংলাদেশের সকল মানুষ হচ্ছে তার পপুলেইশন। বাংলাদেশের সকল প্রাইমারী স্কুলের ছাত্র-ছাত্রী হচ্ছে দেশটির প্রাইমারী স্কুলের পপুলেইশন।
স্যাম্পল হচ্ছে সমগ্রের নমুনা, অর্থাৎ তার প্রতিনিধিত্বমূলক অংশ। বাংলাদেশের যে-কোনো একটি প্রাইমারী ছাত্র-ছাত্রী কিংবা বিভিন্ন প্রকারের প্রাইমারী স্কুলের কিছু ছাত্র-ছাত্রী হবে দেশটির প্রাইমারী স্কুলের পপুলেইশনের স্যাম্পল।
বাংলায় স্যাম্পলকে ‘নমুনা’ বলা হয়। পপুলেইশনকে সাধারণভাবে ‘জনসংখ্যা’ বলা হলেও পরিসংখ্যানের পপুলেইশনকে জনসংখ্যা না বলে ‘জনসমগ্র’ বলা উচিত হবে। একইভাবে, স্ট্যাটিসটিক (Statistic) শব্দের বাংলা হচ্ছে ‘পরিসংখ্যা’। আর, প্যারামিটার (Parameter) শব্দের বাংলা হওয়া উচিত ‘পরিমাত্রা’।
যখন আমরা একটি জনসমগ্রের কোনো বৈশিষ্ট্য প্রত্যেকের মধ্যে পরিমাপ করে নির্ণয় করি, সেই নির্ণীত পরিমাপটিক ঐ জনসমগ্রের (Population) ‘পরিমাত্রা’ (Parameter)বলা হয়। আর, আমরা যদি তা না করে বরং জনসমগ্রের একটি অংশকে নমুনা (Sample)হিসেবে নিয়ে সে-অংশের প্রত্যেকের মধ্যে সেই বৈশিষ্ট্যটি পরিমাপ করে ফল নির্ণয় করি, সেই নির্ণীত পরিমাপ-ফলকে বলা হয় ‘পরিসংখ্যা’ (Statistic).
পরিসংখ্যান প্রধনতঃ দুই প্রকারের। প্রথমটি হচ্ছে বর্ণনামূলক, যাকে ইংরেজীতে বলা হয় ডেস্ক্রিপটিভ স্ট্যাটিসটিক্স (Descriptive Statistics), যেখানে শুধু উপাত্ত সংগ্রহ, বিন্যাস, বিশ্লেষণ, পরিসংখ্যা নিরূপণ ও বর্ণন করা হয়। বাংলায় এর নাম হতে পারে ‘শুদ্ধ পরিসংখ্যান’।
কিন্তু বিজ্ঞানে আমরা নমুনার পরিসংখ্যা (Statistic) থেকে জনসমগ্রের পরিমাত্রা (Parameter) সম্পর্কে জেনারালাইজেশন বা সাধারণীকরণ করতে চাই। আর, এটি করতে গিয়ে যে-প্রকারের পরিসংখ্যান পদ্ধতির ব্যবহার করি, তাকে বলা হয় ইনফারেনশিয়াল স্ট্যাটিসটিক্স (Inferential Statistics). এর বাংলা নাম হতে পারে ‘সিদ্ধ পরিসংখ্যান’। কারণ, এতে আমরা অনুমানের ভিত্তিতে নমুনার পরিসংখ্যা থেকে সম্ভাবনা তত্ত্ব অনুসারে জনসমগ্রের পরিমাত্রা সম্পর্কে সিদ্ধান্ত টানি।
বাংলাদেশের প্রাপ্তবয়স্ক পুরুষের গড় উচ্চতা কতো? এটি নির্ণয় করার গাণিতিক পদ্ধতি হলো জনসমগ্রের প্রত্যকের উচ্চতার মাপ নিয়ে, সকলের উচ্চতাকে একত্রে যোগ করে প্রাপ্তবয়স্ক পুরুষ-জনসংখ্যা দিয়ে ভাগ করা। কিন্তু এই পদ্ধতি সময়সাধ্য ও ব্যয়সাধ্য বলে এর বাস্তব প্রয়োগ প্রায় অসম্ভব।
উপরের সমস্যা সমাধান করতে আমরা পরিসংখ্যানের শরণাপন্ন হই। আমরা জনসমগ্রের প্রত্যকের কাছে না গিয়ে তার একটি নমুনা সংগ্রহ করি।
বর্তমান উদাহরণের ক্ষেত্রে আমরা বাংলাদেশের প্রাপ্তবয়স্ক পুরুষ জনসমগ্রের প্রত্যেকের উচ্চতা পরিমাপ না করে বরং তাদের একটি অংশকে নমুনা হিসেবে নিয়ে সে-নমুনার প্রত্যেকের উচ্চতা মেপে গড় নির্ণয় করি, এবং দাবী করি যে, নির্ণিত নমুনার গড় উচ্চতার পরিসংখ্যাই হচ্ছে বাংলাদেশের প্রাপ্তবয়স্ক পুরুষ জনসমগ্রের গড় উচ্চতার পরিমাত্রা।
ধরাযাক, বাংলাদেশে প্রাপ্তবয়স্ক পুরুষের নমুনায় নির্ণীত উচ্চতার পরিসংখ্যাটি ৬৪.৫ ইঞ্চি এবং আমরা সিদ্ধান্ত টানতে চাই যে, সে-দেশের প্রাপ্তবয়স্ক পুরুষ জনসমগ্রেরর গড় উচ্চতার পরিমাত্রাও ৬৪.৫ ইঞ্চি। কিন্তু প্রশ্ন হলো, আমাদের এই সিদ্ধান্ত যে সঠিক, তার যুক্তি কী? সেখানে কি ভুল হতে পারে না?
ইনফারেনশিয়্যাল স্ট্যাটিসটিক্স বা সিদ্ধ পরিসংখ্যানে আসলে সেই ভুলের সম্ভাবনাটাই হিসেব করা হয় এবং একটি মাত্রা-পর্যন্ত ভুলের সম্ভাবনাকে সহ্য করে নমুনার পরিসংখ্যাকে জনসমগ্রের পরিমাত্রার হিসেবে ব্যবহার করা হয়।
সিদ্ধ পরিসংখ্যানে ব্যবহৃত পদ্ধতিসমূহের পেছেনে আছে কতিপয় তাত্ত্বিক পূর্বানুমান এবং কতিপয় গাণিতিক কৌশল। এ-দু’য়ের মধ্যে সমন্বয় না হলে পরিসংখ্যান তার বৈধতা হারায়।
আজকের যুগ সাংঘাতিক রকমের সংখ্যাবাচক। আসলে, আমার বলা উচিত পরিসংখ্যা বাচক। যেখানেই তাকানো যায়, সেখানেই শুধু পরিসংখ্যা আর পরিসংখ্যা। এ-পরিস্থিতি পরিসংখ্যার বিদ্যা – পরিসংখ্যান – সম্পর্কে জানতে হবে, শিখতে হবে।
২৫/১০/২০২০, লণ্ডন, ইংল্যাণ্ড
ফেসবুক থেকে

সর্বাধিক পঠিত