วิธีหลีกเลี่ยงบาปมหันต์เจ็ดประการของการตีความผิดทางสถิติ

สถิติเป็นเครื่องมือที่มีประโยชน์ในการทำความเข้าใจรูปแบบต่างๆ ในโลกรอบตัวเรา แต่สัญชาตญาณของเรามักจะทำให้เราผิดหวังในการตีความรูปแบบเหล่านั้น ในชุดนี้ เราจะพิจารณาข้อผิดพลาดทั่วไปบางประการที่เราทำ และวิธีหลีกเลี่ยงเมื่อคิดถึงสถิติ ความน่าจะเป็น และความเสี่ยงสนทนา

1. สมมติว่าความแตกต่างเล็กน้อยมีความหมาย

ความผันผวนรายวันหลายอย่างในตลาดหุ้นเป็นตัวแทนของโอกาสมากกว่าสิ่งที่มีความหมาย ความแตกต่างในการสำรวจความคิดเห็นเมื่อฝ่ายใดฝ่ายหนึ่งนำหน้าด้วยจุดหรือสองจุดมักจะเป็นเพียงเสียงทางสถิติ

คุณสามารถหลีกเลี่ยงการสรุปที่ผิดพลาดเกี่ยวกับสาเหตุของความผันผวนดังกล่าวได้โดยการเรียกร้องให้ดู "ระยะขอบของข้อผิดพลาด" ที่เกี่ยวข้องกับตัวเลข

หากความแตกต่างน้อยกว่าขอบของข้อผิดพลาด ไม่น่าจะมีความแตกต่างที่มีความหมาย และการแปรผันก็อาจเกิดจากการผันผวนแบบสุ่ม

วิธีหลีกเลี่ยงบาปมหันต์เจ็ดประการของการตีความผิดทางสถิติแถบข้อผิดพลาดแสดงระดับความไม่แน่นอนในคะแนน เมื่อระยะขอบของข้อผิดพลาดเหลื่อมกัน ความแตกต่างน่าจะเกิดจากสัญญาณรบกวนทางสถิติ


กราฟิกสมัครสมาชิกภายในตัวเอง



2. เทียบนัยสำคัญทางสถิติกับนัยสำคัญในโลกแห่งความเป็นจริง

เรามักได้ยินแนวคิดทั่วไปเกี่ยวกับความแตกต่างของสองกลุ่มในด้านใดด้านหนึ่ง เช่น ผู้หญิงได้รับการเลี้ยงดูมากกว่าในขณะที่ผู้ชายมีร่างกายที่แข็งแรงขึ้น

ความแตกต่างเหล่านี้มักเกิดจากแบบแผนและภูมิปัญญาชาวบ้าน แต่มักจะละเลยความคล้ายคลึงกันของผู้คนระหว่างทั้งสองกลุ่ม และความแปรผันของคนภายในกลุ่ม

หากคุณสุ่มเลือกชายสองคน มีความเป็นไปได้ค่อนข้างมากในความแข็งแกร่งทางกายภาพของพวกเขา และถ้าคุณเลือกผู้ชายหนึ่งคนและผู้หญิงหนึ่งคน พวกเขาอาจจะมีความคล้ายคลึงกันมากในแง่ของการเลี้ยงดู หรือผู้ชายอาจได้รับการเลี้ยงดูมากกว่าผู้หญิง

คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยขอ "ขนาดเอฟเฟกต์" ของความแตกต่างระหว่างกลุ่ม นี่คือการวัดว่าค่าเฉลี่ยของกลุ่มหนึ่งแตกต่างจากค่าเฉลี่ยของกลุ่มอื่นมากเพียงใด

หากขนาดของเอฟเฟกต์มีขนาดเล็ก แสดงว่าทั้งสองกลุ่มนั้นคล้ายกันมาก แม้ว่าขนาดของเอฟเฟกต์จะมีขนาดใหญ่ แต่ทั้งสองกลุ่มก็มีแนวโน้มที่จะมีความแตกต่างกันอย่างมาก ดังนั้นไม่ใช่ว่าสมาชิกทุกคนในกลุ่มหนึ่งจะแตกต่างจากสมาชิกทุกคนในกลุ่มอื่น


3. ละเลยที่จะดูสุดขั้ว

ด้านกลับของขนาดเอฟเฟกต์มีความเกี่ยวข้องเมื่อสิ่งที่คุณกำลังโฟกัสอยู่ตามหลัง “การแจกแจงแบบปกติ” (บางครั้งเรียกว่า “โค้งระฆัง”) นี่คือจุดที่คนส่วนใหญ่อยู่ใกล้คะแนนเฉลี่ย และมีเพียงกลุ่มเล็กๆ เท่านั้นที่สูงกว่าหรือต่ำกว่าค่าเฉลี่ย

เมื่อสิ่งนั้นเกิดขึ้น การเปลี่ยนแปลงเล็กๆ น้อยๆ ในการทำงานของกลุ่มจะทำให้เกิดความแตกต่างที่ไม่มีความหมายอะไรกับคนทั่วไป (ดูจุดที่ 2) แต่นั่นเปลี่ยนลักษณะของความสุดโต่งไปอย่างสิ้นเชิง

หลีกเลี่ยงข้อผิดพลาดนี้โดยพิจารณาว่าคุณกำลังรับมือกับความสุดโต่งหรือไม่ เมื่อคุณต้องติดต่อกับคนทั่วไป ความแตกต่างของกลุ่มเล็ก ๆ มักจะไม่สำคัญ เมื่อคุณให้ความสำคัญกับความสุดโต่ง ความแตกต่างของกลุ่มเล็ก ๆ อาจเป็นเรื่องสำคัญ

วิธีหลีกเลี่ยงบาปมหันต์เจ็ดประการของการตีความผิดทางสถิติเมื่อประชากรสองกลุ่มตามการแจกแจงแบบปกติ ความแตกต่างระหว่างประชากรทั้งสองจะชัดเจนขึ้นที่สุดขั้วมากกว่าค่าเฉลี่ย


4. เชื่อเรื่องบังเอิญ

รู้ไหมว่ามี ความสัมพันธ์ ระหว่างจำนวนคนที่จมน้ำในแต่ละปีในสหรัฐอเมริกาโดยตกลงไปในสระว่ายน้ำและจำนวนภาพยนตร์ที่ Nicholas Cage ปรากฏตัว?

วิธีหลีกเลี่ยงบาปมหันต์เจ็ดประการของการตีความผิดทางสถิติแต่มีการเชื่อมโยงสาเหตุ? tylervigen.com

หากคุณดูให้หนักพอ คุณจะพบรูปแบบและความสัมพันธ์ที่น่าสนใจซึ่งเกิดจากความบังเอิญเท่านั้น

เพียงเพราะสิ่งสองสิ่งเกิดขึ้นพร้อมกันหรือในรูปแบบที่คล้ายคลึงกัน ไม่ได้หมายความว่าสิ่งเหล่านั้นเกี่ยวข้องกัน

หลีกเลี่ยงข้อผิดพลาดนี้โดยถามว่าการเชื่อมโยงที่สังเกตได้น่าเชื่อถือเพียงใด เป็นครั้งเดียวหรือเกิดขึ้นหลายครั้ง? สามารถทำนายความสัมพันธ์ในอนาคตได้หรือไม่? หากคุณเคยดูเพียงครั้งเดียว อาจเป็นเพราะความบังเอิญ


5. รับเหตุย้อนหลัง

เมื่อสองสิ่งมีความสัมพันธ์กัน กล่าวคือ การว่างงานและปัญหาสุขภาพจิต อาจเป็นการเย้ายวนที่จะเห็นเส้นทางของสาเหตุที่ "ชัดเจน" ว่าปัญหาสุขภาพจิตนำไปสู่การว่างงาน

แต่บางครั้งทางสาเหตุก็ไปในทางอื่น เช่น การว่างงานทำให้เกิดปัญหาสุขภาพจิต

คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยจำไว้ว่าให้นึกถึงเหตุที่ย้อนกลับเมื่อคุณเห็นความสัมพันธ์ อิทธิพลสามารถไปในทิศทางอื่นได้หรือไม่? หรือเป็นไปได้ทั้งสองทาง สร้างลูปการตอบรับหรือไม่


6. ลืมพิจารณาเหตุภายนอก

ผู้คนมักล้มเหลวในการประเมิน "ปัจจัยที่สาม" ที่เป็นไปได้ หรือสาเหตุภายนอก ที่อาจสร้างความเชื่อมโยงระหว่างสองสิ่งเพราะทั้งสองเป็นผลลัพธ์ของปัจจัยที่สามจริงๆ

ตัวอย่างเช่น อาจมีความสัมพันธ์ระหว่างการรับประทานอาหารที่ร้านอาหารกับสุขภาพหัวใจและหลอดเลือดที่ดีขึ้น นั่นอาจทำให้คุณเชื่อว่ามีความเกี่ยวข้องกันระหว่างคนทั้งสอง

อย่างไรก็ตาม อาจเป็นได้ว่าผู้ที่สามารถรับประทานอาหารที่ร้านอาหารเป็นประจำนั้นอยู่ในกลุ่มเศรษฐกิจและสังคมที่สูง และสามารถจ่ายค่ารักษาพยาบาลที่ดีขึ้นได้ และเป็นการดูแลสุขภาพที่ช่วยให้สุขภาพหัวใจและหลอดเลือดดีขึ้น

คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยจำไว้ว่าให้นึกถึงปัจจัยที่สามเมื่อคุณเห็นความสัมพันธ์ หากคุณกำลังติดตามสิ่งหนึ่งอย่างเป็นสาเหตุที่เป็นไปได้ ให้ถามตัวเองว่าอะไรคือสาเหตุของสิ่งนั้น ปัจจัยที่สามนั้นอาจทำให้เกิดผลลัพธ์ที่สังเกตได้ทั้งสองอย่างหรือไม่?


7. กราฟหลอกลวง

มีเรื่องร้ายเกิดขึ้นมากมายในการปรับขนาดและการติดฉลากของแกนตั้งบนกราฟ ป้ายกำกับควรแสดงช่วงที่มีความหมายทั้งหมดของสิ่งที่คุณกำลังดูอยู่

แต่บางครั้งผู้สร้างกราฟจะเลือกช่วงที่แคบกว่าเพื่อสร้างความแตกต่างเล็กน้อยหรือการเชื่อมโยงกันดูมีผลกระทบมากขึ้น ในระดับตั้งแต่ 0 ถึง 100 สองคอลัมน์อาจมีความสูงเท่ากัน แต่ถ้าคุณกราฟข้อมูลเดียวกันแสดงเฉพาะจาก 52.5 ถึง 56.5 ข้อมูลเหล่านั้นอาจดูแตกต่างอย่างมาก

คุณสามารถหลีกเลี่ยงข้อผิดพลาดนี้ได้โดยสังเกตป้ายกำกับของกราฟตามแกน ให้สงสัยเป็นพิเศษเกี่ยวกับกราฟที่ไม่มีป้ายกำกับ

วิธีหลีกเลี่ยงบาปมหันต์เจ็ดประการของการตีความผิดทางสถิติกราฟสามารถบอกเล่าเรื่องราวได้ ทำให้ความแตกต่างดูใหญ่ขึ้นหรือเล็กลงขึ้นอยู่กับขนาด

เกี่ยวกับผู้เขียน

วินนิเฟรด หลุยส์ รองศาสตราจารย์ จิตวิทยาสังคม มหาวิทยาลัยควีนส์แลนด์ และ Cassandra Chapman ผู้สมัครระดับปริญญาเอกด้านจิตวิทยาสังคม มหาวิทยาลัยควีนส์แลนด์

บทความนี้ถูกเผยแพร่เมื่อวันที่ สนทนา. อ่าน บทความต้นฉบับ.

หนังสือที่เกี่ยวข้อง:

at ตลาดภายในและอเมซอน