การรักษาทางการแพทย์เพียงหนึ่งในสิบเท่านั้นที่ได้รับการสนับสนุนจากหลักฐานคุณภาพสูง
Towfiqu ahamed barbhuiya / Shutterstock

เมื่อคุณไปพบแพทย์คุณอาจคิดว่าการรักษาที่แพทย์สั่งนั้นมีหลักฐานที่ชัดเจนในการสำรองข้อมูล แต่คุณคิดผิด การรักษาทางการแพทย์มีเพียงหนึ่งในสิบเท่านั้นที่ได้รับการสนับสนุนโดยหลักฐานคุณภาพสูง งานวิจัยล่าสุดของเราแสดงให้เห็น.

ผลการวิเคราะห์ซึ่งตีพิมพ์ใน Journal of Clinical Epidemiology รวม 154 บทวิจารณ์ที่เป็นระบบของ Cochrane ที่ตีพิมพ์ระหว่างปี 2015 ถึง 2019 มีเพียง 15 (9.9%) ที่มีหลักฐานคุณภาพสูง วิธีมาตรฐานทองคำ สำหรับการพิจารณาว่าพวกเขาให้หลักฐานคุณภาพสูงหรือต่ำที่เรียกว่า GRADE (การให้คะแนนคำแนะนำการประเมินการพัฒนาและการประเมินผล) ในจำนวนนี้มีเพียงสองรายการเท่านั้นที่มีผลลัพธ์ที่มีนัยสำคัญทางสถิติซึ่งหมายความว่าผลลัพธ์ไม่น่าจะเกิดขึ้นเนื่องจากข้อผิดพลาดแบบสุ่มและผู้เขียนบทวิจารณ์เชื่อว่าจะเป็นประโยชน์ในการปฏิบัติทางคลินิก การใช้ระบบเดียวกัน 37% มีระดับปานกลาง 31% ต่ำและ 22% มีหลักฐานคุณภาพต่ำมาก

ระบบ GRADE มองไปที่สิ่งต่างๆเช่นความเสี่ยงของอคติ ตัวอย่างเช่นการศึกษาที่“ ตาบอด” ซึ่งผู้ป่วยไม่รู้ว่าตนเองได้รับการรักษาจริงหรือยาหลอกให้หลักฐานที่มีคุณภาพสูงกว่าการศึกษาแบบ“ ไม่บอด” การพูดไม่ชัดเป็นสิ่งสำคัญเพราะคนที่รู้ว่าพวกเขาได้รับการรักษาแบบใดจะได้รับประสบการณ์ ผลของยาหลอกมากขึ้น มากกว่าผู้ที่ไม่รู้ว่าตนเองได้รับการรักษาอะไร

เหนือสิ่งอื่นใด GRADE ยังพิจารณาด้วยว่าการศึกษาไม่ชัดเจนเนื่องจากความแตกต่างในวิธีการรักษาหรือไม่ ในการทบทวนปี 2016 นักวิจัยพบว่า 13.5% - ประมาณหนึ่งในเจ็ดรายงานว่าการรักษาได้รับการสนับสนุนจากหลักฐานคุณภาพสูง การขาดหลักฐานคุณภาพสูงตาม GRADE หมายความว่าการศึกษาในอนาคตอาจพลิกผลลัพธ์

การศึกษา 154 ชิ้นได้รับเลือกเนื่องจากเป็นการปรับปรุงก่อนหน้านี้ ทบทวน 608 บทวิจารณ์อย่างเป็นระบบดำเนินการในปี 2016 ซึ่งช่วยให้เราตรวจสอบได้ว่าบทวิจารณ์ที่ได้รับการอัปเดตด้วยหลักฐานใหม่มีหลักฐานที่มีคุณภาพสูงกว่าหรือไม่ พวกเขาไม่ได้ ในการศึกษาปี 2016 13.5% รายงานว่าการรักษาได้รับการสนับสนุนจากหลักฐานคุณภาพสูงดังนั้นจึงมีแนวโน้มที่จะมีคุณภาพต่ำลงเนื่องจากมีการรวบรวมหลักฐานมากขึ้น


กราฟิกสมัครสมาชิกภายในตัวเอง


การศึกษามีข้อ จำกัด บางประการ ประการแรกขนาดตัวอย่างในการศึกษาอาจไม่ได้เป็นตัวแทนและการศึกษาอื่น ๆ พบว่า มากกว่า 40% ของการรักษาทางการแพทย์น่าจะได้ผล. นอกจากนี้กลุ่มตัวอย่างในการศึกษายังไม่มากพอที่จะตรวจสอบว่ามีการรักษาทางการแพทย์บางประเภท (ทางเภสัชวิทยาการผ่าตัดทางจิตวิทยา) ที่ดีกว่าแบบอื่นหรือไม่ นอกจากนี้ยังเป็นไปได้ว่า“ มาตรฐานทองคำ” สำหรับหลักฐานการจัดอันดับ (GRADE) นั้นเข้มงวดเกินไป

การศึกษาคุณภาพต่ำมากเกินไป

มีการเผยแพร่การทดลองคุณภาพต่ำจำนวนมากและการศึกษาของเราสะท้อนให้เห็นเพียงเรื่องนี้ เพราะความดันไป “ เผยแพร่หรือพินาศ” เพื่อความอยู่รอดในวงการวิชาการมีการศึกษามากขึ้นเรื่อย ๆ ใน PubMed เพียงอย่างเดียว - ฐานข้อมูลของเอกสารทางการแพทย์ที่เผยแพร่ - มีการเผยแพร่การทดลองทางคลินิกใหม่ ๆ มากกว่า 12,000 ครั้งทุกปี นั่นแหละ เผยแพร่การทดลอง 30 ครั้งทุกวัน. บทวิจารณ์ที่เป็นระบบได้รับการออกแบบมาเพื่อสังเคราะห์สิ่งเหล่านี้ แต่ตอนนี้มีจำนวนมากเกินไปเช่นกัน: มากกว่า 2,000 ต่อปี เผยแพร่ใน PubMed เพียงอย่างเดียว

การเคลื่อนไหวของยาตามหลักฐานได้ตีกลองเกี่ยวกับความจำเป็นในการปรับปรุงคุณภาพของการวิจัยมานานกว่า 30 ปี แต่ในทางตรงกันข้ามไม่มีหลักฐานว่า สิ่งต่างๆดีขึ้น แม้จะมี การเพิ่มจำนวนแนวทาง และคำแนะนำ

ในปี 1994 ดั๊กอัลท์แมนศาสตราจารย์ด้านสถิติการแพทย์ที่มหาวิทยาลัยอ๊อกซฟอร์ดขอร้อง น้อย แต่ดีกว่าการวิจัย. สิ่งนี้จะดี แต่สิ่งที่ตรงกันข้ามก็เกิดขึ้น อย่างหลีกเลี่ยงไม่ได้การทดลองสึนามิที่ตีพิมพ์ทุกปีรวมกับความจำเป็นในการเผยแพร่เพื่อให้อยู่รอดในสถาบันการศึกษาทำให้มีการเผยแพร่ขยะจำนวนมากและสิ่งนี้ไม่ได้เปลี่ยนแปลงไปตามกาลเวลา

หลักฐานคุณภาพต่ำเป็นเรื่องร้ายแรง: หากไม่มีหลักฐานที่ดีเราก็ไม่สามารถแน่ใจได้ว่าการรักษาที่เราใช้นั้นได้ผล

การรักษาทางการแพทย์เพียงหนึ่งในสิบเท่านั้นที่ได้รับการสนับสนุนจากหลักฐานคุณภาพสูงมันเป็นเรื่องตลก Twitter

ระบบ GRADE รุนแรงเกินไป

ช่างไม้ควรตำหนิเครื่องมือของตนเป็นทางเลือกสุดท้ายเท่านั้นดังนั้นควรใช้ข้ออ้างที่ GRADE ใช้ไม่ได้ผลเท่านั้น แต่อาจเป็นเรื่องจริงที่ระบบ GRADE นั้นรุนแรงเกินไปสำหรับบางบริบท ตัวอย่างเช่นแทบจะเป็นไปไม่ได้เลยที่การทดลองใด ๆ ที่ประเมินว่าระบอบการออกกำลังกายโดยเฉพาะจะมีคุณภาพสูง

การทดลองออกกำลังกายไม่สามารถทำให้“ ตาบอด” ได้ทุกคนที่ออกกำลังกายจะรู้ว่าตนอยู่ในกลุ่มออกกำลังกายส่วนผู้ที่อยู่ในกลุ่มควบคุมจะรู้ว่าตนไม่ได้ออกกำลังกาย นอกจากนี้ยังเป็นการยากที่จะทำให้คนกลุ่มใหญ่ออกกำลังกายแบบเดียวกันทั้งหมดในขณะที่ทำให้ทุกคนทานยาเม็ดเดียวกันได้ง่ายขึ้น ปัญหาโดยธรรมชาติเหล่านี้ประณามการทดลองออกกำลังกายที่ถูกตัดสินว่ามีคุณภาพต่ำลงไม่ว่าการออกกำลังกายจะมีประโยชน์เพียงใด

นอกจากนี้วิธีการของเราก็เข้มงวด ในขณะที่บทวิจารณ์ที่เป็นระบบมีผลลัพธ์มากมาย (แต่ละรายการอาจมีคุณภาพสูง) เรามุ่งเน้นไปที่ผลลัพธ์หลัก ตัวอย่างเช่นผลลัพธ์หลักในการทบทวนยาแก้ปวดคือการลดความเจ็บปวด จากนั้นพวกเขายังอาจวัดผลรองต่างๆเช่นการลดความวิตกกังวลไปจนถึงความพึงพอใจของผู้ป่วย

การมุ่งเน้นไปที่ผลลัพธ์หลักจะช่วยป้องกันการค้นพบที่ปลอมแปลง หากเราดูผลลัพธ์หลาย ๆ อย่างอาจมีอันตรายที่หนึ่งในนั้นจะมีคุณภาพสูง โดยบังเอิญ. เพื่อลดปัญหานี้เราได้พิจารณาว่าผลลัพธ์ใด ๆ - แม้ว่าจะไม่ใช่ผลลัพธ์หลักก็ตาม เราพบว่าหนึ่งในห้าของการรักษามีหลักฐานคุณภาพสูงสำหรับผลลัพธ์ใด ๆ

โดยเฉลี่ยแล้วการรักษาทางการแพทย์ส่วนใหญ่ที่ได้รับการทดสอบประสิทธิผลในการทบทวนอย่างเป็นระบบไม่ได้รับการสนับสนุนจากหลักฐานคุณภาพสูง เราต้องการการวิจัยน้อยลง แต่ดีกว่าเพื่อจัดการกับความไม่แน่นอนเพื่อให้เรามั่นใจมากขึ้นว่าการรักษาที่เราใช้นั้นได้ผลสนทนา

เกี่ยวกับผู้เขียน

Jeremy Howick ผู้อำนวยการโครงการ Oxford Empathy University of Oxford

บทความนี้ตีพิมพ์ซ้ำจาก สนทนา ภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ อ่าน บทความต้นฉบับ.

หนังสือ_วิทยาศาสตร์