เราต้องการทราบอัลกอริทึมที่รัฐบาลใช้ในการตัดสินใจเกี่ยวกับเรา

ในระบบยุติธรรมทางอาญา ตลาดสินเชื่อ เวทีการจ้างงาน กระบวนการรับเข้าศึกษาระดับอุดมศึกษาและแม้กระทั่ง เครือข่ายโซเชียลมีเดีย, อัลกอริธึมที่ขับเคลื่อนด้วยข้อมูล ตอนนี้ขับเคลื่อนการตัดสินใจ ในรูปแบบที่สัมผัสชีวิตทางเศรษฐกิจ สังคม และพลเมืองของเรา ระบบซอฟต์แวร์เหล่านี้จัดอันดับ จำแนก เชื่อมโยง หรือกรองข้อมูล โดยใช้กฎที่มนุษย์สร้างขึ้นหรือเกิดจากข้อมูล ซึ่งช่วยให้ปฏิบัติต่อกลุ่มประชากรจำนวนมากได้อย่างสม่ำเสมอ

แต่ในขณะที่เทคนิคเหล่านี้อาจมีประสิทธิภาพเพิ่มขึ้น พวกเขาก็สามารถ ปิดบังอคติต่อกลุ่มผู้ด้อยโอกาส or เสริมสร้างการเลือกปฏิบัติเชิงโครงสร้าง. ในแง่ของกระบวนการยุติธรรมทางอาญา การตัดสินทัณฑ์บนของปัจเจกบุคคลโดยพิจารณาจากแนวโน้มทางสถิติที่วัดจากคนกลุ่มใหญ่ๆ เป็นเรื่องที่ยุติธรรมหรือไม่ การเลือกปฏิบัติอาจเกิดขึ้นจากการใช้แบบจำลองทางสถิติ พัฒนาสำหรับประชากรของรัฐหนึ่งไปสู่อีกรัฐหนึ่ง ประชากรที่แตกต่างกันทางประชากรศาสตร์?

ประชาชนจำเป็นต้องเข้าใจอคติและพลังของอัลกอริธึมที่ใช้ในที่สาธารณะ รวมถึงโดยหน่วยงานของรัฐ ความพยายามที่ฉันมีส่วนร่วมเรียกว่า ความรับผิดชอบของอัลกอริทึมพยายามทำให้อิทธิพลของระบบเหล่านั้นชัดเจนขึ้นและเข้าใจในวงกว้างมากขึ้น

เทคนิคความโปร่งใสที่มีอยู่ เมื่อนำไปใช้กับอัลกอริธึม สามารถทำให้ผู้คนติดตาม ตรวจสอบ และวิพากษ์วิจารณ์ว่าระบบเหล่านั้นทำงานอย่างไร - หรือไม่ แล้วแต่กรณี น่าเสียดายที่หน่วยงานของรัฐดูเหมือนไม่พร้อมสำหรับการสอบถามเกี่ยวกับอัลกอริธึมและการใช้งานในการตัดสินใจที่ส่งผลกระทบอย่างมีนัยสำคัญทั้งต่อบุคคลและสาธารณะโดยรวม

การเปิดอัลกอริธึมสู่การตรวจสอบสาธารณะ

เมื่อปีที่แล้ว รัฐบาลกลางเริ่มเรียน ข้อดีและข้อเสียของการใช้การวิเคราะห์ข้อมูลด้วยคอมพิวเตอร์เพื่อช่วยกำหนดความเป็นไปได้ที่ผู้ต้องขังในเรือนจำจะถูกกระทำความผิดเมื่อได้รับการปล่อยตัว การให้คะแนนบุคคลที่มีความเสี่ยงต่ำ ปานกลาง หรือสูงสามารถช่วยในการตัดสินใจเรื่องที่พักและการรักษา ระบุบุคคลที่สามารถส่งไปยังเรือนจำที่มีความปลอดภัยขั้นต่ำได้อย่างปลอดภัย หรือแม้แต่ "บ้านกลางทาง" หรือผู้ที่จะได้รับประโยชน์จากประเภทใดประเภทหนึ่งโดยเฉพาะ การดูแลด้านจิตใจ


กราฟิกสมัครสมาชิกภายในตัวเอง


ข้อมูลดังกล่าวสามารถทำให้กระบวนการยุติธรรมมีประสิทธิภาพมากขึ้นและมีต้นทุนที่ต่ำลง และยังช่วยลดความแออัดในคุกอีกด้วย มีการแสดงการปฏิบัติต่อผู้กระทำความผิดที่มีความเสี่ยงต่ำเช่นผู้กระทำความผิดที่มีความเสี่ยงสูง ในการศึกษาบางอย่าง เพื่อนำไปสู่พวกเขาภายในเป็นอาชญากร "ป่วย" และต้องการการรักษาพฤติกรรมเบี่ยงเบนของพวกเขา การแยกจากกันสามารถลดการพัฒนาพฤติกรรมเชิงลบที่จะนำไปสู่การกระทำผิดซ้ำเมื่อได้รับการปล่อยตัว

ข้อมูลและอัลกอริธึมในการให้คะแนนความเสี่ยงในการทำผิดซ้ำของผู้ต้องขังมีอยู่แล้ว ใช้กันอย่างแพร่หลายโดยรัฐ สำหรับการจัดการกักขัง คุมประพฤติ ทัณฑ์บน และแม้กระทั่งการพิจารณาคดี แต่มันง่ายสำหรับพวกเขาที่จะไม่มีใครสังเกตเห็น พวกเขามักจะดูเหมือนเอกสารราชการที่ไม่โอ้อวด

โดยปกติอัลกอริธึมจะถูกนำไปต้มจนใบคะแนนแบบง่ายซึ่งกรอกโดยข้าราชการที่มีความเข้าใจเพียงเล็กน้อยเกี่ยวกับการคำนวณพื้นฐาน ตัวอย่างเช่น พนักงานคดีอาจประเมินนักโทษโดยใช้แบบฟอร์มที่พนักงานคดีทำเครื่องหมายว่าผู้ต้องขังเคยถูกตัดสินว่ามีความผิดฐานก่ออาชญากรรมรุนแรง อายุยังน้อยในการจับกุมครั้งแรก และยังไม่สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายหรือได้รับ กศน. ปัจจัยเหล่านั้นและลักษณะอื่น ๆ เกี่ยวกับบุคคลและอาชญากรรมส่งผลให้คะแนนที่แสดงให้เห็นว่าผู้ต้องขังอาจมีสิทธิ์ได้รับการพิจารณาทัณฑ์บนหรือไม่

แบบฟอร์มเอง และระบบการให้คะแนน มักจะเปิดเผยคุณลักษณะสำคัญเกี่ยวกับอัลกอริทึม เช่น ตัวแปรที่อยู่ระหว่างการพิจารณา และวิธีที่พวกมันมารวมกันเพื่อสร้างคะแนนความเสี่ยงโดยรวม แต่สิ่งที่สำคัญสำหรับความโปร่งใสของอัลกอริทึมก็คือต้องรู้ว่ารูปแบบดังกล่าวได้รับการออกแบบ พัฒนา และประเมินผลอย่างไร สาธารณะเท่านั้นที่จะทราบได้ว่าปัจจัยและการคำนวณที่เกี่ยวข้องกับการได้คะแนนนั้นยุติธรรมและสมเหตุสมผล หรือไม่มีข้อมูลและลำเอียง

การใช้พระราชบัญญัติเสรีภาพในการให้ข้อมูล

เครื่องมือหลักของเราในการรับมือกับแบบฟอร์มเหล่านั้นและเอกสารประกอบ คือ กฎหมาย และโดยเฉพาะอย่างยิ่ง กฎหมายว่าด้วยเสรีภาพในการให้ข้อมูล กลไกเหล่านี้เป็นหนึ่งในกลไกที่ทรงพลังที่สุดที่สาธารณชนมีอยู่เพื่อให้เกิดความโปร่งใสในรัฐบาล ในระดับสหพันธรัฐ พระราชบัญญัติเสรีภาพในการให้ข้อมูล (FOIA) อนุญาตให้ประชาชนร้องขออย่างเป็นทางการและคาดว่าจะได้รับเอกสารตอบแทนจากรัฐบาลกลาง มีกฎเกณฑ์ที่คล้ายคลึงกัน สำหรับแต่ละรัฐ.

มีผลบังคับใช้ในปี 1966 FOIA ถูกสร้างขึ้นก่อนการใช้คอมพิวเตอร์อย่างแพร่หลาย และก่อนที่ข้อมูลจำนวนมากจะถูกใช้เป็นประจำในระบบซอฟต์แวร์เพื่อจัดการบุคคลและคาดการณ์ มี การวิจัยเบื้องต้นบางอย่าง ว่า FOIA สามารถอำนวยความสะดวกในการเปิดเผยซอร์สโค้ดซอฟต์แวร์ได้หรือไม่ แต่คำถามยังคงมีอยู่ว่ากฎหมายปัจจุบันตอบสนองต่อความต้องการของสาธารณชนในศตวรรษที่ 21 ได้หรือไม่: เราสามารถใช้อัลกอริธึม FOIA ได้หรือไม่?

กรณีศึกษาความโปร่งใสของอัลกอริทึม

ฉันออกเดินทางเพื่อตอบคำถามนี้ที่ วิทยาลัยวารสารศาสตร์ Philip Merrill ที่มหาวิทยาลัยแมริแลนด์ซึ่งฉันเป็นผู้ช่วยศาสตราจารย์ ในฤดูใบไม้ร่วงปี 2015 เราได้ร่วมงานกับชั้นเรียนกฎหมายสื่อของ Sandy Banisky ซึ่งเป็นเพื่อนร่วมงานของฉัน เราได้แนะนำนักเรียนในการส่งคำขอ FOIA ไปยังแต่ละรัฐใน 50 รัฐ เราขอเอกสาร คำอธิบายทางคณิตศาสตร์ ข้อมูล การประเมินการตรวจสอบ สัญญาและซอร์สโค้ดที่เกี่ยวข้องกับอัลกอริธึมที่ใช้ในกระบวนการยุติธรรมทางอาญา เช่น การพิจารณาทัณฑ์บนและการคุมประพฤติ การประกันตัวหรือการพิจารณาพิพากษา

ในฐานะที่เป็นโครงการระยะยาว ความพยายามจำเป็นต้องถูกจำกัดด้วยเวลา โดยมีอุปสรรคมากมายและประสบความสำเร็จค่อนข้างน้อย เช่นเดียวกับการสืบสวนของนักข่าวหลายๆ คน แม้แต่การคิดว่าจะถามใครและอย่างไรก็เป็นเรื่องที่ท้าทาย หน่วยงานต่าง ๆ อาจต้องรับผิดชอบในส่วนต่าง ๆ ของระบบยุติธรรมทางอาญา (ศาลอาจพิพากษาได้ แต่การจัดการทัณฑ์บนทำโดยกรมราชทัณฑ์)

แม้หลังจากระบุตัวบุคคลได้ถูกต้องแล้ว นักเรียนพบว่าเจ้าหน้าที่ของรัฐใช้คำศัพท์ที่แตกต่างกันซึ่งทำให้ยากต่อการสื่อสารว่าต้องการข้อมูลใด บางครั้ง นักเรียนต้องทำงานอย่างหนักเพื่ออธิบาย "ขั้นตอนวิธีกระบวนการยุติธรรมทางอาญา" แก่ข้าราชการที่ไม่ค่อยเข้าใจข้อมูล เมื่อมองย้อนกลับไป การขอ “เครื่องมือประเมินความเสี่ยง” อาจมีประสิทธิภาพมากกว่า เนื่องจากเป็นคำที่รัฐบาลของรัฐมักใช้

จัดการกับคำตอบ

บางรัฐ เช่น โคโลราโด ปฏิเสธคำขอของเราโดยบอกว่าอัลกอริธึมมีอยู่ในซอฟต์แวร์ ซึ่งไม่ถือเป็น "เอกสาร" ที่กฎหมายเปิดของรัฐบาลกำหนดให้เจ้าหน้าที่ต้องเปิดเผยต่อสาธารณะ รัฐต่างๆ มีกฎเกณฑ์ที่แตกต่างกันเกี่ยวกับการเปิดเผยการใช้ซอฟต์แวร์ สิ่งนี้ได้เกิดขึ้นในบางครั้งในศาลเช่น 2004 ฟ้องเมืองดีทรอยต์ ว่าควรเปิดเผยสูตรการคำนวณค่าน้ำที่เรียกเก็บจากเมืองที่อยู่ติดกันหรือไม่

ด้วยความพยายามของเราเอง เราได้รับคำอธิบายทางคณิตศาสตร์ของอัลกอริธึมความยุติธรรมทางอาญาเพียงรายการเดียว: Oregon เปิดเผย ตัวแปรทั้ง 16 ตัวและน้ำหนัก ในรูปแบบที่ใช้ในการทำนายการกระทำผิดซ้ำ รัฐนอร์ทดาโคตาได้เผยแพร่สเปรดชีต Excel ที่แสดงสมการที่ใช้ในการกำหนดวันที่ผู้ต้องขังจะมีสิทธิ์ได้รับการพิจารณาให้รอลงอาญา จากไอดาโฮและนิวเม็กซิโก เราได้รับเอกสารพร้อมคำอธิบายบางอย่างเกี่ยวกับการประเมินความเสี่ยงในการกระทำผิดซ้ำที่รัฐเหล่านั้นใช้ แต่ไม่มีรายละเอียดเกี่ยวกับวิธีการพัฒนาหรือตรวจสอบ

เก้ารัฐใช้การปฏิเสธที่จะเปิดเผยรายละเอียดเกี่ยวกับอัลกอริธึมกระบวนการยุติธรรมทางอาญาโดยอ้างว่าข้อมูลดังกล่าวเป็นของ บริษัท จริงๆ ความหมายก็คือการปล่อยอัลกอริธึมออกมาจะเป็นอันตรายต่อบริษัทที่พัฒนามัน แบบสอบถามความเสี่ยงซ้ำซ้อนที่พบบ่อย เรียกว่า LSI-Rกลายเป็นสินค้าเชิงพาณิชย์ที่ได้รับการคุ้มครองลิขสิทธิ์ รัฐเช่นฮาวายและเมนอ้างว่าป้องกันไม่ให้เปิดเผยต่อสาธารณะ

หลุยเซียน่ากล่าวว่าสัญญากับผู้พัฒนาเทคนิคการประเมินความเสี่ยงแบบใหม่ห้ามไม่ให้เปิดเผยข้อมูลที่ร้องขอเป็นเวลาหกเดือน รัฐเคนตักกี้อ้างสัญญากับ a มูลนิธิการกุศล เนื่องจากไม่สามารถเปิดเผยรายละเอียดเพิ่มเติมได้ ความกังวลเกี่ยวกับข้อมูลที่เป็นกรรมสิทธิ์อาจชอบด้วยกฎหมาย แต่เนื่องจากรัฐบาลทำสัญญากับบริษัทเอกชนเป็นประจำ เราจะสร้างสมดุลระหว่างข้อกังวลเหล่านั้นกับระบบยุติธรรมที่อธิบายได้และถูกต้องตามกฎหมายได้อย่างไร

ทำการปรับปรุง

การปฏิรูป FOIA ที่จำเป็นมากคือ อยู่ระหว่างการพิจารณา โดยสภาคองเกรส นี่เป็นโอกาสสำหรับกฎหมายที่จะมีความทันสมัย ​​แต่การเปลี่ยนแปลงที่เสนอยังคงทำเพียงเล็กน้อยเพื่อรองรับการใช้อัลกอริธึมที่เพิ่มขึ้นในรัฐบาล ข้อมูลความโปร่งใสของอัลกอริทึม อาจจะประมวลได้ ให้เป็นรายงานที่ทางราชการจัดทำและเผยแพร่ต่อสาธารณะอย่างสม่ำเสมอโดยเป็นส่วนหนึ่งของธุรกิจตามปกติ

ในฐานะสังคม เราควรกำหนดให้เจ้าหน้าที่ข้อมูลสาธารณะได้รับการฝึกอบรมเพื่อให้พวกเขามีความรู้และคล่องแคล่วในคำศัพท์ที่พวกเขาอาจพบเมื่อประชาชนขออัลกอริทึม รัฐบาลกลางอาจสร้างตำแหน่งใหม่สำหรับ "อัลกอริทึมซาร์" ซึ่งเป็นผู้ตรวจการแผ่นดินซึ่งมีหน้าที่ในการสื่อสารและสอบถามข้อมูลในระบบอัตโนมัติของรัฐบาล

ไม่มีเอกสารใดที่เราได้รับในการวิจัยของเราบอกเราว่ารูปแบบการประเมินความเสี่ยงด้านความยุติธรรมทางอาญาได้รับการพัฒนาหรือประเมินอย่างไร เนื่องจากอัลกอริธึมควบคุมชีวิตเรามากขึ้นเรื่อยๆ ประชาชนจึงต้องการ – และต้องเรียกร้อง – ความโปร่งใสมากขึ้น

เกี่ยวกับผู้เขียน

ไดอาโกปูลอส นิโคลัสNicholas Diakopoulos, Tow Fellow, Tow Center for Digital Journalism ที่มหาวิทยาลัยโคลัมเบีย; ผู้ช่วยศาสตราจารย์ วารสารศาสตร์ มหาวิทยาลัยแมริแลนด์ งานวิจัยของเขาอยู่ในวารสารศาสตร์เชิงคำนวณและข้อมูล โดยเน้นที่ความรับผิดชอบของอัลกอริทึม การสร้างภาพข้อมูลเชิงบรรยาย และการคำนวณทางสังคมในข่าว

บทความนี้ถูกเผยแพร่เมื่อวันที่ สนทนา. อ่าน บทความต้นฉบับ.

หนังสือที่เกี่ยวข้อง

at ตลาดภายในและอเมซอน