การสุ่มตัวอย่างการแจกจ่าย

การสุ่มตัวอย่างการแจกจ่าย
การสุ่มตัวอย่างการแจกจ่าย
Anonim

การกระจายตัวอย่างคืออะไร

การสุ่มตัวอย่างเป็นการแจกแจงความน่าจะเป็นของสถิติที่ได้จากตัวอย่างจำนวนมากที่ดึงมาจากประชากรเฉพาะกลุ่ม การแจกแจงการสุ่มตัวอย่างของประชากรที่กำหนดคือการแจกแจงความถี่ของช่วงผลลัพธ์ที่ต่างกันซึ่งอาจเกิดขึ้นได้สำหรับสถิติของประชากร

BREAKING DOWN 'การสุ่มตัวอย่างการจัดจำหน่าย'

ข้อมูลที่นักวิชาการนักสถิตินักวิจัยนักการตลาดนักวิเคราะห์และอื่น ๆ จำนวนมากใช้เป็นตัวอย่างไม่ใช่ประชากร ตัวอย่างคือส่วนย่อยของประชากร ตัวอย่างเช่นนักวิจัยทางการแพทย์ที่ต้องการเปรียบเทียบน้ำหนักเฉลี่ยของทารกที่เกิดในอเมริกาเหนือตั้งแต่ปี 1995 ถึงปี 2005 ไปจนถึงผู้ที่คลอดในอเมริกาใต้ภายในระยะเวลาเดียวกันไม่สามารถใช้เวลาในการดึงข้อมูลทั้งหมดของประชากรทั้งหมด มากกว่าหนึ่งล้านคนที่เกิดขึ้นในช่วงเวลาสิบปี เขาจะใช้น้ำหนักเพียง 100 คนในแต่ละทวีปเพื่อสรุป น้ำหนักของทารกที่ใช้ 200 ตัวเป็นตัวอย่างและคำนวณน้ำหนักเฉลี่ยโดยเฉลี่ยตัวอย่าง

สมมติว่าแทนที่จะใช้ตัวอย่าง 100 น้ำหนักแรกเกิดจากแต่ละทวีปนักวิจัยทางการแพทย์จะสุ่มตัวอย่างซ้ำจากประชากรทั่วไปและคำนวณค่าเฉลี่ยตัวอย่างสำหรับกลุ่มตัวอย่างแต่ละกลุ่ม ดังนั้นสำหรับอเมริกาเหนือเขาดึงข้อมูลสำหรับน้ำหนักทารกแรกเกิดที่บันทึกไว้ในสหรัฐฯแคนาดาและเม็กซิโกดังนี้: สี่ตัวอย่างจากโรงพยาบาลบางแห่งในสหรัฐฯจำนวน 100 ตัวอย่าง 70 ตัวอย่างจากแคนาดาและอีก 150 รายจากเม็กซิโกสำหรับ น้ำหนักรวม 1200 ตัวของทารกแรกเกิดที่แบ่งออกเป็น 12 ชุด นอกจากนี้เขายังเก็บตัวอย่างข้อมูลเกี่ยวกับน้ำหนักที่เกิด 100 จาก 12 ประเทศในอเมริกาใต้ ตัวอย่างแต่ละตัวอย่างมีค่าเฉลี่ยของตัวอย่างและการแจกจ่ายตัวอย่างหมายถึงการกระจายตัวอย่าง

น้ำหนักเฉลี่ยที่คำนวณได้จากชุดตัวอย่าง 2400 คือการสุ่มตัวอย่างการแจกแจงของค่าเฉลี่ย ไม่ใช่แค่ค่าเฉลี่ยที่สามารถคำนวณได้จากตัวอย่างเท่านั้น สถิติอื่น ๆ เช่นค่าเบี่ยงเบนมาตรฐานความแปรปรวนสัดส่วนและช่วงสามารถคำนวณได้จากข้อมูลตัวอย่าง ส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนวัดความแปรปรวนของการแจกแจงการสุ่มตัวอย่าง จำนวนการสังเกตการณ์ในประชากรจำนวนการสังเกตการณ์ในตัวอย่างและขั้นตอนที่ใช้ในการวาดชุดตัวอย่างกำหนดความแปรปรวนของการแจกแจงการสุ่มตัวอย่าง ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงการสุ่มตัวอย่างเรียกว่าข้อผิดพลาดมาตรฐาน ในขณะที่ค่าเฉลี่ยของการแจกแจงการสุ่มตัวอย่างมีค่าเท่ากับค่าเฉลี่ยของจำนวนประชากรข้อผิดพลาดมาตรฐานขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานของประชากรขนาดของประชากรและขนาดของกลุ่มตัวอย่าง รู้ว่าค่าเฉลี่ยของแต่ละชุดตัวอย่างแตกต่างกันอย่างไรและจากค่าเฉลี่ยของประชากรจะเป็นตัวบ่งชี้ว่าค่าเฉลี่ยของตัวอย่างนั้นใกล้เคียงกับค่าเฉลี่ยของประชากรอย่างไรข้อผิดพลาดมาตรฐานของการแจกแจงการสุ่มตัวอย่างลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น

การกระจายและรูปร่างปกติ

ประชากรหรือชุดตัวอย่างหนึ่งชุดจะมีการกระจายตามปกติ อย่างไรก็ตามเนื่องจากการแจกแจงการสุ่มตัวอย่างมีหลายชุดการสังเกตจะไม่จำเป็นต้องมีรูปทรงโค้งมน ตามตัวอย่างของเราประชากรโดยเฉลี่ยของทารกในทวีปอเมริกาเหนือและในอเมริกาใต้มีการแจกแจงตามปกติเนื่องจากเด็กบางคนจะมีน้ำหนัก (ต่ำกว่าค่าเฉลี่ย) หรือมีน้ำหนักเกิน (สูงกว่าค่าเฉลี่ย) ส่วนใหญ่เด็กทารกตกอยู่ระหว่าง (เฉลี่ย) ถ้าน้ำหนักเฉลี่ยของทารกแรกเกิดในอเมริกาเหนือคือ 7 ปอนด์ตัวอย่างน้ำหนักเฉลี่ยในแต่ละ 12 ตัวอย่างที่บันทึกไว้สำหรับทวีปอเมริกาเหนือจะใกล้เคียงกับ 7 ปอนด์ด้วยเช่นกัน แต่ถ้าคุณคำนวณค่าเฉลี่ยแต่ละค่าที่คำนวณได้จากกลุ่มตัวอย่าง 1200 กลุ่มรูปร่างที่ได้อาจส่งผลให้มีการกระจายสม่ำเสมอ แต่เป็นการยากที่จะคาดเดาได้ด้วยความมั่นใจว่ารูปร่างที่แท้จริงจะกลายเป็นอย่างไร กลุ่มตัวอย่างที่นักวิจัยใช้จากประชากรมากกว่าหนึ่งล้านรายขึ้นกราฟจะเริ่มมีการกระจายตัวตามปกติ