Pantip-Cafe | Pantip-TechExchange | PantipMarket.com | Chat | PanTown.com | BlogGang.com  


 
[GT200] มาให้ความรู้ทางวิชาสถิติกันหน่อย ก่อนจะพูดถึงเรื่องต่อไป  

กระทู้นี้เหมาะสำหรับคนทั่วไปที่ไม่เคยเรียนวิชาสถิติ หรือไม่เข้าใจวิชาสถิติ (คนที่เข้าใจอยู่แล้วสามารถข้ามไปได้เลย แต่ถ้าเห็นว่าผมพูดผิดก็ชี้แนะได้นะครับ)

สองสามวันมานี่เรื่อง GT200 ดูจะเป็นประเด็นร้อนในสังคมและในห้องหว้ากอนี้เป็นอย่างมาก ในที่นี้ก็มีทั้งคนนห้าเดิมๆ ที่สนใจเรื่องนี้มาหลายเดือน หรือเกี่ยวข้องกับเจ้าเครื่องนี้อย่าง อ.เจษ, Deceptiocon, คนบ้านไร่ชายน้ำ, catwater, กกร่ม ฯลฯ และคนหน้าใหม่ๆ ที่เพิ่งเข้ามาดูได้ไม่กี่วันตามกระแสข่าว

ก็อยากฝากประเด็นทางสถิติพื้นฐานไว้ให้เข้าใจกันไว้ เพื่อให้ทุกคนเข้าใจตรงกัน เพื่อเวลาอ่านและตอบกระทู้จะได้เป็นไปในแนวหลักและเหตุผล มากกว่าการดูถูกดูแคลน ประชดประชัน หรือวิพากษ์วิจารณ์ในทางเสียหาย

โอกาส 50:50 หรือ 1:4 หรือ อะไรก็ตามคืออะไร

จริงๆหลายคนด้านล่างได้พูดไปแล้ว แต่ผมก็อาจจะพูดซ้ำ เพื่อให้คนใหม่ๆ ได้เข้ามาอ่าน

50:50 คือการตอบถูกหรือผิดโดยมีตัวเลือก 2 ตัวเลือก ถ้าเป็นการโยนเหรียญก็คือ "ออกหัว" หรือ "ออกก้อย" ถ้าเป็นการสอบก็ทำข้อสอบแบบเลือก กาถูก หรือ กาผิด

1:4 เช่นการทำข้อสอบปรนัย 4 ตัวเลือกโดยมีคำตอบที่ถูกต้องเพียงข้อเดียว ก ข ค ง ถ้าคุณตอบโดยไม่อ่านโจทย์หรืออ่านคำตอบเลย คุณมีโอกาสตอบถูก 1 ส่วนจาก 4 ส่วน (และในทางกลับกันเรามีโอกาสตอบผิด 3 ส่วนจาก 4 ส่วน)

ทำไมต้องทำซ้ำ 30 ครั้ง

เป็นเหมือน rule of thumb ของนักสถิติ ที่ทำต่อกันมาแล้วเชื่อมั่นว่า การสุ่มตัวอย่างใดๆ ก็ตาม หากเราทำการสุ่มตัวอย่างในประชากรนั้นๆ อย่างน้อย 30 ครั้งเราจะได้ค่าเฉลี่ยของกลุ่มตัวอย่างที่ใกล้เคียงกับค่าเฉลี่ยที่แท้จริงของประชากรนั้น

ถามว่าทำไมเราต้องการหาค่าเฉลี่ยตรงนั้น

เพราะในการอ้างอิงถึงกลุ่มของตัวเลขกลุ่มหนึ่ง เราต้องการตัวเลขจำนวนไหนก็ได้มาเป็นตัวแทนของกลุ่มตัวเลขกลุ่มนั้น ซึ่งส่วนใหญ่เราจะใช้ค่าเฉลี่ย ซึงมันจะไม่มากหรือน้อยเกินไป

การยกตัวอย่างน่าจะง่ายกว่า....

สมมติเราต้องการทราบอายุเฉลี่ยของคนที่เล่นห้องหว้ากอทั้งหมด

(ลืมบอกไปอีกอย่างว่าคนตอบทุกคนต้องตอบตามความจริงเท่านั้น ห้ามโกหก ลดหรือเพิ่มอายุของตัวเองเด็ดขาด)

ถ้าอยากรู้จริงๆ เราอาจจตั้งกระทู้แล้วให้คนที่เล่นห้องหว้ากอนี้มาตอบ เราก็จะได้อายุเฉลี่ยที่แท้จริง

แต่ในความเป็นจริง เราไม่สามารถบอกให้ทุกคนเข้ามาตอบกระทู้ได้ เพราะบางคนไม่ได้เ่นทุกวัน บางคนอาจเป็นอาทิตย์ๆ ถึงจะแวะมาอ่านทีนึง ซึ่งตอนนั้นกระทู้คงตกไปแล้ว

หรือจะโทรถามทีละคนก็ได้ ซึ่งใช้เงินจำนวนและความพยายามอย่างมาก ไม่ค่อยคุ้มที่จะทำ

ดังนั้นเราจึงลองสุ่มถามเป็นบางคน อาจจะ 10-20 คนก็พอ แล้วหาค่าเฉลี่ยของกลุ่มนั้น แล้วเราก็เอาตัวเลขตัวนั้นเป็นตัวแทนของอายุเฉลี่ยของคนที่เล่นห้องหว้ากอทั้งหมดได้เลย

เชื่อมั๊ย

นักสถิติบอกเชื่อถือได้ครับ แต่ไม่ 100% เพราะเราไม่ได้ถามทุกคนจริงๆ เลขที่ได้แค่ใกล้เคียงมีโอกาสถูก เป็น XX% แต่ไม่ใช่ 100% (จริงๆ นักสถิติก็ไม่เคยบอกหรอกครับว่ามีอะไรที่เป็น 100% นักสถิติเว้นที่ว่างไว้ให้ความผิดพลาดได้เสมอ)

เดี๋ยวตอนท้ายจะมีอะไรสนุกๆให้ทำ แล้วคุณจะทึ่งกับวิชาสถิติ

True, Positive False, Negative False

การสุ่มตัวอย่างหรือการตรวจสอบอะไรก็แล้วแต่ (ยกเว้นการตรวจบางอย่างข้อสอบหรือการบ้าน) คำตอบจะออกได้ 3 แบบ คือ

True ตรวจแล้วถูก และและจริงๆ มันก็ถูก
Positive False ตรวจแล้วถูก แต่จริงๆ มันผิด
Negative False ตรวจแล้วผิด แต่จริงๆ มันถูก

งงมั๊ย

เอาอย่างนี้ ยกตัวอย่างอีกง่ายกว่า

สมมติ ผมสั่งซื้อแจกันหยก 1000 ใบ โดยผมตกลงกับผู้ขายว่า ใน 1000 ใบนี้จะมีแจกันประเภทอื่นๆ ได้ไม่เกิน 1% (=10 ใบ) และก่อนจะรับของผมจะตรวจสอบก่อนว่าคุณส่งแจกันหยกมาให้ผมจริงอย่างน้อย 980 ใบหรือไม่

วิธีการตรวจสอบมีหลายวิธี ผมอาจจะเปิดตรวจสอบทุกใบ 1000 ใบก็ได้ แต่เสียเวลามาก ผมเลยเลือกตรวจเพียงบางส่วน โดยผมตั้งเกณฑ์ว่า ผมจะหยิกออกมาตรวจ 100 ใบ ถ้าผมพบว่าใน 100 ใบที่ผมยกออกมา มีอย่างน้อย 2 ใบที่ไม่ใช่แจกันหยก ผมไม่รับของทั้ง 1000 ใบ

ผลการตรวจจะออกได้ 3 ทางอย่างที่บอกข้างต้นคือ

True

คือพ่อค้าส่งแจกันหยกมา 990 ใบและปนแจกันอื่นๆมา 10 ใบ (พ่อค้าปฎิบัติตรงตามเงื่อนไขที่ตกลงกันข้างต้น) เมื่อผมตรวจ 100 ใบพบแจกันหยก 100 ใบ (หรือเป็นแจกันหยก 99 ใบอีก 1 ใบเป็นแจกันพลาสติก)

ผลก็คือผมยอมรับของทั้งหมดอย่างไม่มีเงื่อนไข เพราะผมตั้งเงื่อนไขแต่แรกแล้วว่า ถ้าพบว่ามีแจกันหยกอย่าน้อย 99 ใบผมรับได้ (ส่วนใบที่ผิดผมจะเคลมจากพ่อค้าได้รึเปล่านั่นเป็นอีกเรื่องหนึ่งซึ่งไม่เกี่ยวกันกับตรงนี้)

Positive False

คือพ่อค้าส่งแจกันหยกมา 980 ใบและปนแจกันอื่นๆมา 20 ใบ เมื่อผมตรวจ 100 ใบพบแจกันหยก 100 ใบ (หรือเป็นแจกันหยก 99 ใบอีก 1 ใบเป็นแจกันพลาสติก) ผมก็ต้องรับของโดยที่ไม่สนอีก 900 ใบที่ผมไม่ได้ตรวจ ซึ่งจริงๆ แล้วถ้าผมตรวจ 1000 ใบผมจะเจอแน่นอนและต้องไม่รับของ แต่ผมก็รับมาแล้วเพราะผมตรวจไม่เจอ

์Negative False

คือพ่อค้าส่งแจกันหยกมา 990 ใบและปนแจกันอื่นๆมา 10 ใบ เมื่อผมตรวจ 100 ใบพบแจกันหยก 98 ใบ ซึ่งมากกว่าเงื่อนไขที่ตกลงกัน ผมก็ต้องไม่รับของโดยที่ไม่สนอีก 900 ใบที่ผมไม่ได้ตรวจ ซึ่งจริงๆ แล้วถ้าผมตรวจ 1000 ใบผมจะพบว่าจริงๆ แล้วพ่อค้าทำถูกต้องตามเงื่อนไข แต่ผมดันตรวจผิดพลาดเอง

ดังนั้นถ้านำมาเปรียบเทียบกับการค้นหาระเบิดในตัวผู้ต้องสงสัยด้วยเครื่อง GT200 ก็คือ

ในการตรวจคน 1 คน หรือมีรถวิ่งผ่านเครื่องมือนี้ 1 คันหรือ จนท.เดินลาดตระเวนผ่านบ้าน 1 หลัง นับเป็นเกิดการตรวจ 1 ครั้งทั้งหมด และผลจะได้คือ

True - เครื่องบอกว่าผู้ต้องสงสัยมีระเบิดติดตัว และจนท. ค้นตัวแล้วพบระเบิดจริงๆ
Positive False - เครื่องบอกว่าผู้ต้องสงสัยมีระเบิดติดตัว แต่จนท. ค้นตัวแล้วไม่พบระเบิด
Negative False - เครื่องบอกว่าผู้ต้องสงสัยไม่มีระเบิดติดตัว ปล่อยผ่านไป แต่ผู้ต้องสงสัยมีระเบิดอยู่จริงๆ

ขอย้ำว่า ในการตรวจคน 1 คน หรือมีรถวิ่งผ่านเครื่องมือนี้ 1 คันหรือ จนท.เดินลาดตระเวนผ่านบ้าน 1 หลัง นับเป็นเกิดการตรวจ 1 ครั้งทั้งหมด

สุดท้ายก็ฝากเกมเล็กๆ ให้ไปลองทำดู ถ้าใครทำก็จะพบว่าวิชาสถิติมันน่ามหัศจรรย์จริงๆ

มีตัวเลขอยู่ 17 ตัว
เลข 1 จำนวน 5 ตัว
เลข 2 จำนวน 3 ตัว
เลข 3 จำนวน 1 ตัว
เลข 4 จำนวน 3 ตัว
เลข 5 จำนวน 5 ตัว

ถ้าเราหาค่าเฉลี่ยของเลขทั้งหมดนี้คือ 3 อย่างแน่นอน
แต่เราจะไม่หาค่าเฉลี่ยจากเลขทุกตัวครับ เราจะสุ่มเอาตัวเลข 5, 10, 12 ตัวจากทั้งหมด 17 ตัวนี้แล้วหาค่าเฉลี่ยจาก 5, 10, 12 ตัวนี้ดู โดยการทำอย่างน้อยแบบละ 30 ครั้ง (หาค่าเฉลี่ยจากการสุ่ม 5 ตัวเลข 30 รอบ, 10 ตัวเลข 30 รอบ, 12 ตัวเลข 30 รอบ รวม 90 รอบ) แล้วเรามาดูกันว่าจะเกิดอะไรขึ้น

คุณสามารถใช้วิธีการทำสลาก 17 ใบใส่ลงในโหล เขย่าแล้วจับขึ้นมาครั้งละ 5, 10, 12 ใบก็ได้ หรือจะลองใส่เลขมั่วๆ ลงในตาราง excel ก็ได้ครับ (แต่ระวังอย่าใส่ตัวเลขเกินจำนวนที่กำหนด ไม่งั้นผลอาจผิดพลาดได้)

สมัยผมเรียนวิชานี้ การบ้านข้อนี้โดนสั่งให้ทำอย่างละ 100 รอบ ผมไม่ต้องจำเลยครับ เข้าใจอย่างไม่มีข้อสงสัยเลย

แก้ไขเมื่อ 29 ม.ค. 53 01:30:36

แก้ไขเมื่อ 29 ม.ค. 53 01:26:57

จากคุณ : ascertain
เขียนเมื่อ : 29 ม.ค. 53 01:21:23




ข้อความหรือรูปภาพที่ปรากฏในกระทู้ที่ท่านเห็นอยู่นี้ เกิดจากการตั้งกระทู้และถูกส่งขึ้นกระดานข่าวโดยอัตโนมัติจากบุคคลทั่วไป ซึ่ง PANTIP.COM มิได้มีส่วนร่วมรู้เห็น ตรวจสอบ หรือพิสูจน์ข้อเท็จจริงใดๆ ทั้งสิ้น หากท่านพบเห็นข้อความ หรือรูปภาพในกระทู้ที่ไม่เหมาะสม กรุณาแจ้งทีมงานทราบ เพื่อดำเนินการต่อไป



Pantip-Cafe | Pantip-TechExchange | PantipMarket.com | Chat | PanTown.com | BlogGang.com