สถิติเป็นเครื่องมือที่มีประโยชน์ในการทำความเข้าใจรูปแบบต่างๆ ในโลกรอบตัวเรา แต่สัญชาตญาณของเรามักจะทำให้เราผิดหวังในการตีความรูปแบบเหล่านั้น ในชุดนี้ เราจะพิจารณาข้อผิดพลาดทั่วไปบางประการที่เราทำ และวิธีหลีกเลี่ยงเมื่อคิดถึงสถิติ ความน่าจะเป็น และความเสี่ยง
1. สมมติว่าความแตกต่างเล็กน้อยมีความหมาย
ความผันผวนรายวันหลายอย่างในตลาดหุ้นเป็นตัวแทนของโอกาสมากกว่าสิ่งที่มีความหมาย ความแตกต่างในการสำรวจความคิดเห็นเมื่อฝ่ายใดฝ่ายหนึ่งนำหน้าด้วยจุดหรือสองจุดมักจะเป็นเพียงเสียงทางสถิติ
คุณสามารถหลีกเลี่ยงการสรุปที่ผิดพลาดเกี่ยวกับสาเหตุของความผันผวนดังกล่าวได้โดยการเรียกร้องให้ดู "ระยะขอบของข้อผิดพลาด" ที่เกี่ยวข้องกับตัวเลข
หากความแตกต่างน้อยกว่าขอบของข้อผิดพลาด ไม่น่าจะมีความแตกต่างที่มีความหมาย และการแปรผันก็อาจเกิดจากการผันผวนแบบสุ่ม
แถบข้อผิดพลาดแสดงระดับความไม่แน่นอนในคะแนน เมื่อระยะขอบของข้อผิดพลาดเหลื่อมกัน ความแตกต่างน่าจะเกิดจากสัญญาณรบกวนทางสถิติ
2. เทียบนัยสำคัญทางสถิติกับนัยสำคัญในโลกแห่งความเป็นจริง
เรามักได้ยินแนวคิดทั่วไปเกี่ยวกับความแตกต่างของสองกลุ่มในด้านใดด้านหนึ่ง เช่น ผู้หญิงได้รับการเลี้ยงดูมากกว่าในขณะที่ผู้ชายมีร่างกายที่แข็งแรงขึ้น
ความแตกต่างเหล่านี้มักเกิดจากแบบแผนและภูมิปัญญาชาวบ้าน แต่มักจะละเลยความคล้ายคลึงกันของผู้คนระหว่างทั้งสองกลุ่ม และความแปรผันของคนภายในกลุ่ม
หากคุณสุ่มเลือกชายสองคน มีความเป็นไปได้ค่อนข้างมากในความแข็งแกร่งทางกายภาพของพวกเขา และถ้าคุณเลือกผู้ชายหนึ่งคนและผู้หญิงหนึ่งคน พวกเขาอาจจะมีความคล้ายคลึงกันมากในแง่ของการเลี้ยงดู หรือผู้ชายอาจได้รับการเลี้ยงดูมากกว่าผู้หญิง
คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยขอ "ขนาดเอฟเฟกต์" ของความแตกต่างระหว่างกลุ่ม นี่คือการวัดว่าค่าเฉลี่ยของกลุ่มหนึ่งแตกต่างจากค่าเฉลี่ยของกลุ่มอื่นมากเพียงใด
หากขนาดของเอฟเฟกต์มีขนาดเล็ก แสดงว่าทั้งสองกลุ่มนั้นคล้ายกันมาก แม้ว่าขนาดของเอฟเฟกต์จะมีขนาดใหญ่ แต่ทั้งสองกลุ่มก็มีแนวโน้มที่จะมีความแตกต่างกันอย่างมาก ดังนั้นไม่ใช่ว่าสมาชิกทุกคนในกลุ่มหนึ่งจะแตกต่างจากสมาชิกทุกคนในกลุ่มอื่น
3. ละเลยที่จะดูสุดขั้ว
ด้านกลับของขนาดเอฟเฟกต์มีความเกี่ยวข้องเมื่อสิ่งที่คุณกำลังโฟกัสอยู่ตามหลัง “การแจกแจงแบบปกติ” (บางครั้งเรียกว่า “โค้งระฆัง”) นี่คือจุดที่คนส่วนใหญ่อยู่ใกล้คะแนนเฉลี่ย และมีเพียงกลุ่มเล็กๆ เท่านั้นที่สูงกว่าหรือต่ำกว่าค่าเฉลี่ย
เมื่อสิ่งนั้นเกิดขึ้น การเปลี่ยนแปลงเล็กๆ น้อยๆ ในการทำงานของกลุ่มจะทำให้เกิดความแตกต่างที่ไม่มีความหมายอะไรกับคนทั่วไป (ดูจุดที่ 2) แต่นั่นเปลี่ยนลักษณะของความสุดโต่งไปอย่างสิ้นเชิง
หลีกเลี่ยงข้อผิดพลาดนี้โดยพิจารณาว่าคุณกำลังรับมือกับความสุดโต่งหรือไม่ เมื่อคุณต้องติดต่อกับคนทั่วไป ความแตกต่างของกลุ่มเล็ก ๆ มักจะไม่สำคัญ เมื่อคุณให้ความสำคัญกับความสุดโต่ง ความแตกต่างของกลุ่มเล็ก ๆ อาจเป็นเรื่องสำคัญ
เมื่อประชากรสองกลุ่มตามการแจกแจงแบบปกติ ความแตกต่างระหว่างประชากรทั้งสองจะชัดเจนขึ้นที่สุดขั้วมากกว่าค่าเฉลี่ย
4. เชื่อเรื่องบังเอิญ
รู้ไหมว่ามี ความสัมพันธ์ ระหว่างจำนวนคนที่จมน้ำในแต่ละปีในสหรัฐอเมริกาโดยตกลงไปในสระว่ายน้ำและจำนวนภาพยนตร์ที่ Nicholas Cage ปรากฏตัว?
แต่มีการเชื่อมโยงสาเหตุ? tylervigen.com
หากคุณดูให้หนักพอ คุณจะพบรูปแบบและความสัมพันธ์ที่น่าสนใจซึ่งเกิดจากความบังเอิญเท่านั้น
เพียงเพราะสิ่งสองสิ่งเกิดขึ้นพร้อมกันหรือในรูปแบบที่คล้ายคลึงกัน ไม่ได้หมายความว่าสิ่งเหล่านั้นเกี่ยวข้องกัน
หลีกเลี่ยงข้อผิดพลาดนี้โดยถามว่าการเชื่อมโยงที่สังเกตได้น่าเชื่อถือเพียงใด เป็นครั้งเดียวหรือเกิดขึ้นหลายครั้ง? สามารถทำนายความสัมพันธ์ในอนาคตได้หรือไม่? หากคุณเคยดูเพียงครั้งเดียว อาจเป็นเพราะความบังเอิญ
5. รับเหตุย้อนหลัง
เมื่อสองสิ่งมีความสัมพันธ์กัน กล่าวคือ การว่างงานและปัญหาสุขภาพจิต อาจเป็นการเย้ายวนที่จะเห็นเส้นทางของสาเหตุที่ "ชัดเจน" ว่าปัญหาสุขภาพจิตนำไปสู่การว่างงาน
แต่บางครั้งทางสาเหตุก็ไปในทางอื่น เช่น การว่างงานทำให้เกิดปัญหาสุขภาพจิต
คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยจำไว้ว่าให้นึกถึงเหตุที่ย้อนกลับเมื่อคุณเห็นความสัมพันธ์ อิทธิพลสามารถไปในทิศทางอื่นได้หรือไม่? หรือเป็นไปได้ทั้งสองทาง สร้างลูปการตอบรับหรือไม่
6. ลืมพิจารณาเหตุภายนอก
ผู้คนมักล้มเหลวในการประเมิน "ปัจจัยที่สาม" ที่เป็นไปได้ หรือสาเหตุภายนอก ที่อาจสร้างความเชื่อมโยงระหว่างสองสิ่งเพราะทั้งสองเป็นผลลัพธ์ของปัจจัยที่สามจริงๆ
ตัวอย่างเช่น อาจมีความสัมพันธ์ระหว่างการรับประทานอาหารที่ร้านอาหารกับสุขภาพหัวใจและหลอดเลือดที่ดีขึ้น นั่นอาจทำให้คุณเชื่อว่ามีความเกี่ยวข้องกันระหว่างคนทั้งสอง
อย่างไรก็ตาม อาจเป็นได้ว่าผู้ที่สามารถรับประทานอาหารที่ร้านอาหารเป็นประจำนั้นอยู่ในกลุ่มเศรษฐกิจและสังคมที่สูง และสามารถจ่ายค่ารักษาพยาบาลที่ดีขึ้นได้ และเป็นการดูแลสุขภาพที่ช่วยให้สุขภาพหัวใจและหลอดเลือดดีขึ้น
คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยจำไว้ว่าให้นึกถึงปัจจัยที่สามเมื่อคุณเห็นความสัมพันธ์ หากคุณกำลังติดตามสิ่งหนึ่งอย่างเป็นสาเหตุที่เป็นไปได้ ให้ถามตัวเองว่าอะไรคือสาเหตุของสิ่งนั้น ปัจจัยที่สามนั้นอาจทำให้เกิดผลลัพธ์ที่สังเกตได้ทั้งสองอย่างหรือไม่?
7. กราฟหลอกลวง
มีเรื่องร้ายเกิดขึ้นมากมายในการปรับขนาดและการติดฉลากของแกนตั้งบนกราฟ ป้ายกำกับควรแสดงช่วงที่มีความหมายทั้งหมดของสิ่งที่คุณกำลังดูอยู่
แต่บางครั้งผู้สร้างกราฟจะเลือกช่วงที่แคบกว่าเพื่อสร้างความแตกต่างเล็กน้อยหรือการเชื่อมโยงกันดูมีผลกระทบมากขึ้น ในระดับตั้งแต่ 0 ถึง 100 สองคอลัมน์อาจมีความสูงเท่ากัน แต่ถ้าคุณกราฟข้อมูลเดียวกันแสดงเฉพาะจาก 52.5 ถึง 56.5 ข้อมูลเหล่านั้นอาจดูแตกต่างอย่างมาก
คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยสังเกตป้ายกำกับของกราฟตามแกน ให้สงสัยเป็นพิเศษเกี่ยวกับกราฟที่ไม่มีป้ายกำกับ
กราฟสามารถบอกเล่าเรื่องราวได้ ทำให้ความแตกต่างดูใหญ่ขึ้นหรือเล็กลงขึ้นอยู่กับขนาด
เกี่ยวกับผู้เขียน
วินนิเฟรด หลุยส์ รองศาสตราจารย์ จิตวิทยาสังคม มหาวิทยาลัยควีนส์แลนด์ และ Cassandra Chapman ผู้สมัครระดับปริญญาเอกด้านจิตวิทยาสังคม มหาวิทยาลัยควีนส์แลนด์
บทความนี้ถูกเผยแพร่เมื่อวันที่ สนทนา. อ่าน บทความต้นฉบับ.
หนังสือที่เกี่ยวข้อง:
at ตลาดภายในและอเมซอน