Towfiqu ahamed barbhuiya / Shutterstock
เมื่อคุณไปพบแพทย์คุณอาจคิดว่าการรักษาที่แพทย์สั่งนั้นมีหลักฐานที่ชัดเจนในการสำรองข้อมูล แต่คุณคิดผิด การรักษาทางการแพทย์มีเพียงหนึ่งในสิบเท่านั้นที่ได้รับการสนับสนุนโดยหลักฐานคุณภาพสูง งานวิจัยล่าสุดของเราแสดงให้เห็น.
ผลการวิเคราะห์ซึ่งตีพิมพ์ใน Journal of Clinical Epidemiology รวม 154 บทวิจารณ์ที่เป็นระบบของ Cochrane ที่ตีพิมพ์ระหว่างปี 2015 ถึง 2019 มีเพียง 15 (9.9%) ที่มีหลักฐานคุณภาพสูง วิธีมาตรฐานทองคำ สำหรับการพิจารณาว่าพวกเขาให้หลักฐานคุณภาพสูงหรือต่ำที่เรียกว่า GRADE (การให้คะแนนคำแนะนำการประเมินการพัฒนาและการประเมินผล) ในจำนวนนี้มีเพียงสองรายการเท่านั้นที่มีผลลัพธ์ที่มีนัยสำคัญทางสถิติซึ่งหมายความว่าผลลัพธ์ไม่น่าจะเกิดขึ้นเนื่องจากข้อผิดพลาดแบบสุ่มและผู้เขียนบทวิจารณ์เชื่อว่าจะเป็นประโยชน์ในการปฏิบัติทางคลินิก การใช้ระบบเดียวกัน 37% มีระดับปานกลาง 31% ต่ำและ 22% มีหลักฐานคุณภาพต่ำมาก
ระบบ GRADE มองไปที่สิ่งต่างๆเช่นความเสี่ยงของอคติ ตัวอย่างเช่นการศึกษาที่“ ตาบอด” ซึ่งผู้ป่วยไม่รู้ว่าตนเองได้รับการรักษาจริงหรือยาหลอกให้หลักฐานที่มีคุณภาพสูงกว่าการศึกษาแบบ“ ไม่บอด” การพูดไม่ชัดเป็นสิ่งสำคัญเพราะคนที่รู้ว่าพวกเขาได้รับการรักษาแบบใดจะได้รับประสบการณ์ ผลของยาหลอกมากขึ้น มากกว่าผู้ที่ไม่รู้ว่าตนเองได้รับการรักษาอะไร
เหนือสิ่งอื่นใด GRADE ยังพิจารณาด้วยว่าการศึกษาไม่ชัดเจนเนื่องจากความแตกต่างในวิธีการรักษาหรือไม่ ในการทบทวนปี 2016 นักวิจัยพบว่า 13.5% - ประมาณหนึ่งในเจ็ดรายงานว่าการรักษาได้รับการสนับสนุนจากหลักฐานคุณภาพสูง การขาดหลักฐานคุณภาพสูงตาม GRADE หมายความว่าการศึกษาในอนาคตอาจพลิกผลลัพธ์
รับล่าสุดทางอีเมล
การศึกษา 154 ชิ้นได้รับเลือกเนื่องจากเป็นการปรับปรุงก่อนหน้านี้ ทบทวน 608 บทวิจารณ์อย่างเป็นระบบดำเนินการในปี 2016 ซึ่งช่วยให้เราตรวจสอบได้ว่าบทวิจารณ์ที่ได้รับการอัปเดตด้วยหลักฐานใหม่มีหลักฐานที่มีคุณภาพสูงกว่าหรือไม่ พวกเขาไม่ได้ ในการศึกษาปี 2016 13.5% รายงานว่าการรักษาได้รับการสนับสนุนจากหลักฐานคุณภาพสูงดังนั้นจึงมีแนวโน้มที่จะมีคุณภาพต่ำลงเนื่องจากมีการรวบรวมหลักฐานมากขึ้น
การศึกษามีข้อ จำกัด บางประการ ประการแรกขนาดตัวอย่างในการศึกษาอาจไม่ได้เป็นตัวแทนและการศึกษาอื่น ๆ พบว่า มากกว่า 40% ของการรักษาทางการแพทย์น่าจะได้ผล. นอกจากนี้กลุ่มตัวอย่างในการศึกษายังไม่มากพอที่จะตรวจสอบว่ามีการรักษาทางการแพทย์บางประเภท (ทางเภสัชวิทยาการผ่าตัดทางจิตวิทยา) ที่ดีกว่าแบบอื่นหรือไม่ นอกจากนี้ยังเป็นไปได้ว่า“ มาตรฐานทองคำ” สำหรับหลักฐานการจัดอันดับ (GRADE) นั้นเข้มงวดเกินไป
การศึกษาคุณภาพต่ำมากเกินไป
มีการเผยแพร่การทดลองคุณภาพต่ำจำนวนมากและการศึกษาของเราสะท้อนให้เห็นเพียงเรื่องนี้ เพราะความดันไป “ เผยแพร่หรือพินาศ” เพื่อความอยู่รอดในวงการวิชาการมีการศึกษามากขึ้นเรื่อย ๆ ใน PubMed เพียงอย่างเดียว - ฐานข้อมูลของเอกสารทางการแพทย์ที่เผยแพร่ - มีการเผยแพร่การทดลองทางคลินิกใหม่ ๆ มากกว่า 12,000 ครั้งทุกปี นั่นแหละ เผยแพร่การทดลอง 30 ครั้งทุกวัน. บทวิจารณ์ที่เป็นระบบได้รับการออกแบบมาเพื่อสังเคราะห์สิ่งเหล่านี้ แต่ตอนนี้มีจำนวนมากเกินไปเช่นกัน: มากกว่า 2,000 ต่อปี เผยแพร่ใน PubMed เพียงอย่างเดียว
การเคลื่อนไหวของยาตามหลักฐานได้ตีกลองเกี่ยวกับความจำเป็นในการปรับปรุงคุณภาพของการวิจัยมานานกว่า 30 ปี แต่ในทางตรงกันข้ามไม่มีหลักฐานว่า สิ่งต่างๆดีขึ้น แม้จะมี การเพิ่มจำนวนแนวทาง และคำแนะนำ
ในปี 1994 ดั๊กอัลท์แมนศาสตราจารย์ด้านสถิติการแพทย์ที่มหาวิทยาลัยอ๊อกซฟอร์ดขอร้อง น้อย แต่ดีกว่าการวิจัย. สิ่งนี้จะดี แต่สิ่งที่ตรงกันข้ามก็เกิดขึ้น อย่างหลีกเลี่ยงไม่ได้การทดลองสึนามิที่ตีพิมพ์ทุกปีรวมกับความจำเป็นในการเผยแพร่เพื่อให้อยู่รอดในสถาบันการศึกษาทำให้มีการเผยแพร่ขยะจำนวนมากและสิ่งนี้ไม่ได้เปลี่ยนแปลงไปตามกาลเวลา
หลักฐานคุณภาพต่ำเป็นเรื่องร้ายแรง: หากไม่มีหลักฐานที่ดีเราก็ไม่สามารถแน่ใจได้ว่าการรักษาที่เราใช้นั้นได้ผล
มันเป็นเรื่องตลก Twitter
ระบบ GRADE รุนแรงเกินไป
ช่างไม้ควรตำหนิเครื่องมือของตนเป็นทางเลือกสุดท้ายเท่านั้นดังนั้นควรใช้ข้ออ้างที่ GRADE ใช้ไม่ได้ผลเท่านั้น แต่อาจเป็นเรื่องจริงที่ระบบ GRADE นั้นรุนแรงเกินไปสำหรับบางบริบท ตัวอย่างเช่นแทบจะเป็นไปไม่ได้เลยที่การทดลองใด ๆ ที่ประเมินว่าระบอบการออกกำลังกายโดยเฉพาะจะมีคุณภาพสูง
การทดลองออกกำลังกายไม่สามารถทำให้“ ตาบอด” ได้ทุกคนที่ออกกำลังกายจะรู้ว่าตนอยู่ในกลุ่มออกกำลังกายส่วนผู้ที่อยู่ในกลุ่มควบคุมจะรู้ว่าตนไม่ได้ออกกำลังกาย นอกจากนี้ยังเป็นการยากที่จะทำให้คนกลุ่มใหญ่ออกกำลังกายแบบเดียวกันทั้งหมดในขณะที่ทำให้ทุกคนทานยาเม็ดเดียวกันได้ง่ายขึ้น ปัญหาโดยธรรมชาติเหล่านี้ประณามการทดลองออกกำลังกายที่ถูกตัดสินว่ามีคุณภาพต่ำลงไม่ว่าการออกกำลังกายจะมีประโยชน์เพียงใด
นอกจากนี้วิธีการของเราก็เข้มงวด ในขณะที่บทวิจารณ์ที่เป็นระบบมีผลลัพธ์มากมาย (แต่ละรายการอาจมีคุณภาพสูง) เรามุ่งเน้นไปที่ผลลัพธ์หลัก ตัวอย่างเช่นผลลัพธ์หลักในการทบทวนยาแก้ปวดคือการลดความเจ็บปวด จากนั้นพวกเขายังอาจวัดผลรองต่างๆเช่นการลดความวิตกกังวลไปจนถึงความพึงพอใจของผู้ป่วย
การมุ่งเน้นไปที่ผลลัพธ์หลักจะช่วยป้องกันการค้นพบที่ปลอมแปลง หากเราดูผลลัพธ์หลาย ๆ อย่างอาจมีอันตรายที่หนึ่งในนั้นจะมีคุณภาพสูง โดยบังเอิญ. เพื่อลดปัญหานี้เราได้พิจารณาว่าผลลัพธ์ใด ๆ - แม้ว่าจะไม่ใช่ผลลัพธ์หลักก็ตาม เราพบว่าหนึ่งในห้าของการรักษามีหลักฐานคุณภาพสูงสำหรับผลลัพธ์ใด ๆ
โดยเฉลี่ยแล้วการรักษาทางการแพทย์ส่วนใหญ่ที่ได้รับการทดสอบประสิทธิผลในการทบทวนอย่างเป็นระบบไม่ได้รับการสนับสนุนจากหลักฐานคุณภาพสูง เราต้องการการวิจัยน้อยลง แต่ดีกว่าเพื่อจัดการกับความไม่แน่นอนเพื่อให้เรามั่นใจมากขึ้นว่าการรักษาที่เราใช้นั้นได้ผล
เกี่ยวกับผู้เขียน
Jeremy Howick ผู้อำนวยการโครงการ Oxford Empathy University of Oxford
บทความนี้ตีพิมพ์ซ้ำจาก สนทนา ภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ อ่าน บทความต้นฉบับ.
หนังสือ_วิทยาศาสตร์