আমরা গত পর্বেই দেখেছি স্ট্যাটিস্টিক্সের পুরো ব্যাপারটাই ডেটার সাথে সম্পর্কিত । এই ডেটা নানাভাবে বিশ্লেষণ করে স্ট্যাটিস্টিক্স নানা ক্ষেত্রে ব্যবহার করা হয়। এটাকে প্রকাশ করা যায় অনেকটা এভাবে :

 

● অন্যান্য সব বিষয়ের মতো এর স্ট্যাটিস্টিক্সের নিজস্ব কিছু টার্ম আছে । মজার ব্যাপার হলো এই টার্মগুলো আমাদের কাছে অনেক পরিচিত এবং দৈনন্দিন কাজে ব্যবহৃতও বটে ।
যেমন :অনেক কাজেই সার্ভে বা জরিপ করা হয়, তখন তো ডেটাই মূলত সংগ্রহ করা হয়।
আর দোকানে গেলে কোন জিনিস কিনার আগে আমরা কি বলি,ভাই একটা স্যাম্পল দেখান!
হ্যাঁ, ডেটা,স্যাম্পল প্রভৃতিই হল স্ট্যাটিস্টিক্সের কিছু মৌলিক টার্ম।

এখন তাহলে আমরা টার্মগুলো দেখে নেই :
ডেটা নিয়ে । আর স্ট্যাটিস্টিকসের সবচেয়ে মৌলিক উপাদানটিই হচ্ছে ডেটা ।
২.চলক বা Variable: চলক হচ্ছে এমন পরিমাপযোগ্য বৈশিষ্ট্য ,যা এর ডোমেইনের মধ্যে ভিন্ন ভিন্ন হতে পারে ।
যেমনঃ কোনো ক্লাসের সকল শিক্ষার্থীর গ্রেড নিয়ে আলোচনা করলে দেখা যাবে গ্রেড একেকজনের জন্য একেক রকম,কিন্তু ক্লাস সবার জন্যে একই থাকছে ।সুতরাং এখানে গ্রেড চলক,কিন্তুক্লাস চলক না।
৩.পপুলেশনঃ জরিপ করার সময় স্ট্যাটিস্টিকস যে বিষয়টির উপর কাজ করে,তার সাথে সম্পর্কিত প্রতিটি উপাদানের সমষ্টি হলো পপুলেশন। সংজ্ঞা মনে হয় ব্যাপারটিকে অনেক জটিল করে দিচ্ছে!
কিন্তু ব্যাপারটা খুবই সাধারণ ।যদি বাংলাদেশের মানুষের গড় আয়ুর উপর জরিপ করা হয়,তাহলে বাংলাদেশের সকল মানুষ হবে ঐ জরিপের পপুলেশন।

৪.স্যাম্পলঃ পপুলেশনের ছোট কিন্তু প্রতিনিধিত্বকারী অংশটুকু হলো স্যাম্পল।
অনেক সময়ই দেখা যায় কোনো বিশ্ববিদ্যালয়ে জরিপ করার সময় সব শিক্ষার্থীর থেকে তথ্য না নিয়ে দৈবভাবে কিছু শিক্ষার্থীর কাছ থেকে তথ্য নেয়া হয় ।যা থেকে হিসাবনিকাশ করে গোটা পপুলেশনের অবস্থা বের করা যায়।হ্যাঁ ,অবশ্যই এটা কাজ করে ।এক্ষেত্রে অবশ্যই স্যাম্পল নির্বাচন করতে হবে দৈবভাবে।কোনোপ্রকার পক্ষপাত করা যাবে না।কিন্তু বাস্তবে এই স্যাম্পল নির্বাচন এতোই মনগড়া হয়ে স্ট্যাটিস্টিকসকে মিথ্যার সুপারলেটিভ ডিগ্রি বলা হইয়ে থাকে। একটা উক্তি আছে না-“মিথ্যা তিন প্রকারঃমিথ্যা,ডাহা মিথ্যা এবং পরিসংখ্যান।”এই কথার জন্য মূলত নিজের ইচ্ছামতো স্যাম্পল বাছাই করাই দায়ী।

●আমরা এখানে স্যাম্পল ও পপুলেশন নিয়ে কিছু পারস্পরিক আলোচনা করে নেই :
i) পপুলেশন থেকেই স্যাম্পলগুলো আসে।আর স্যাম্পলগুলো থেকে পপুলেশন সম্পর্কে অনেক যথার্থ অনুমান করা যায়।নিচের চিত্রটি দেখিঃ

ii) স্যাম্পল পপুলেশন থেকে দৈবভাবে বাছাই করতে হয় ।

iii) পপুলেশন এবং স্যাম্পলে উপাদানগুলোর অনুপাত অনেকটা কাছাকাছি থাকে।

৫.প্যারামিটার : পপুলেশনের যেকোনো বৈশিষ্ট্যই হলো প্যারামিটার ।
৬.স্ট্যাটিস্টিক(স্ট্যাটিস্টিকস কিন্তু না) : স্যাম্পলের যেকোনো জানা বৈশিষ্টই হলো স্ট্যাটিস্টিক।

ডেটা সংগ্রহের পদ্ধতিঃ  স্ট্যাটিস্টিকসের সব কাজই ডেটা নির্ভর । আবার সব ক্ষেত্রে একই পদ্ধতি ব্যবহার করাও যায় না।যেমনঃ জনমত যাচাইয়ের জন্যে জরিপ করতে হয়,কিন্তু বৈজ্ঞানিক কাজের জন্যে প্রয়োজন এক্সপেরিমেন্ট।এবার তাহলে ডেটা সংগ্রহের পদ্ধতিগুলো দেখা যাকঃ

১.Census: এর বাংলা কিন্তু আদমশুমারি । আদমশুমারিতে আমরা কি দেখি? দেখি যে এখানে কোনো স্যাম্পল নির্বাচন নেই ।সবার কাছ থেকেই তথ্য নেয়া হয়। অর্থাৎ যখন সমগ্র পপুলেশনের সবার কাছ থেকে ডেটা নেয়া হয়,তখন সেটা হয় সেনসাস।

 

২.Sampling:দৈবভাবে বাছাই করে ডেটা  সংগ্রহ হল স্যাম্পলিং।

 

৩.Observational Study: রিসার্চের সময় সাধারণত এ পদ্ধতি ব্যবহার করা হয়। 


৪.Experiment: পরীক্ষাগারে আমরা যে পদ্ধতিতে ডেটা নিয়ে কাজ করি।