ทฤษฎีเกมเสนอเบาะแสว่าทำไมเราถึงร่วมมือกัน (และทำไมเราไม่ทำ)

ทำไมคนถึงให้ความร่วมมือ? นี่ไม่ใช่คำถามที่ใครๆ ก็ถามอย่างจริงจัง คำตอบนั้นชัดเจน: เราร่วมมือกันเพราะการทำเช่นนั้นมักจะเป็นการทำงานร่วมกัน มันสร้างประโยชน์มากขึ้นด้วยต้นทุนที่น้อยลงและทำให้ชีวิตของเราง่ายขึ้นและดีขึ้น

บางทีถามว่าทำไมไม่มีคนดีกว่า เสมอ ให้ความร่วมมือ แต่คำตอบที่นี่ก็ดูชัดเจนเช่นกัน เราไม่ทำอย่างนั้นถ้าเราคิดว่าเราทำได้ หากเราสามารถช่วยตัวเองให้พยายามทำงานร่วมกับคนอื่นได้ แต่ยังคงได้รับประโยชน์จากความร่วมมือของผู้อื่น และบางทีเราระงับความร่วมมือเพื่อเป็นการลงโทษสำหรับการปฏิเสธในอดีตของผู้อื่นที่จะร่วมมือกับเรา

ผู้คนจะให้ความร่วมมือภายใต้เงื่อนไขใด?

เนื่องจากมีเหตุผลที่ดีในการร่วมมือ – และเหตุผลที่ดีที่จะไม่ทำเช่นนั้น – เราจึงเหลือคำถามโดยไม่มีคำตอบที่ชัดเจน: ผู้คนจะให้ความร่วมมือภายใต้เงื่อนไขใด

แม้จะดูเหมือนเรียบง่าย แต่คำถามนี้ซับซ้อนมาก ทั้งจากมุมมองทางทฤษฎีและจากการทดลอง คำตอบนั้นสำคัญมากสำหรับทุกคนที่พยายามสร้างสภาพแวดล้อมที่ส่งเสริมความร่วมมือ ตั้งแต่ผู้จัดการองค์กรและข้าราชการไปจนถึงผู้ปกครองของพี่น้องที่ดื้อรั้น

การวิจัยใหม่เกี่ยวกับทฤษฎีเกม ฉันได้ดำเนินการกับ Joshua Plotkin แล้ว โดยเสนอคำตอบบางอย่าง แต่ก็ทำให้เกิดคำถามมากมายในตัวของมันเองเช่นกัน


กราฟิกสมัครสมาชิกภายในตัวเอง


ตามเนื้อผ้า การวิจัยในทฤษฎีเกม - การศึกษาการตัดสินใจเชิงกลยุทธ์ - มุ่งเน้นไปที่ว่าผู้เล่นที่มีเหตุผลควรร่วมมือในการโต้ตอบครั้งเดียวหรือมองหา "วิธีแก้ปัญหาที่ชนะ" ที่ช่วยให้บุคคลที่ต้องการร่วมมือตัดสินใจได้ดีที่สุด ในการโต้ตอบซ้ำๆ

การทำความเข้าใจพลวัตอันละเอียดอ่อนของการเปลี่ยนแปลงพฤติกรรม

คำถามล่าสุดของเรามีเป้าหมายเพื่อทำความเข้าใจการเปลี่ยนแปลงที่ละเอียดอ่อนของการเปลี่ยนแปลงพฤติกรรมเมื่อมีกลยุทธ์ที่เป็นไปได้มากมาย (เช่นชีวิต) และผลตอบแทนของเกมก็เปลี่ยนไปอย่างต่อเนื่อง (เช่นเดียวกับชีวิต)

จากการตรวจสอบอย่างละเอียดมากขึ้น เราจะเรียนรู้วิธีจูงใจคนให้ร่วมมือกันได้ดียิ่งขึ้น ไม่ว่าจะด้วยการตั้งค่าเงินช่วยเหลือที่เราให้เด็กๆ ทำงานบ้าน การให้รางวัลการทำงานเป็นทีมในโรงเรียนและที่ทำงาน หรือแม้แต่ภาษีเพื่อจ่ายผลประโยชน์สาธารณะเช่น เป็นการดูแลสุขภาพและการศึกษา

สิ่งที่เกิดขึ้นจากการศึกษาของเราเป็นภาพที่ซับซ้อนและน่าดึงดูดใจ: ปริมาณความร่วมมือที่เราเห็นในกลุ่มใหญ่นั้นไม่คงที่ และสิ่งจูงใจที่หมายถึงความดีอาจนำไปสู่พฤติกรรมที่ให้ความร่วมมือน้อยกว่าโดยไม่ได้ตั้งใจ

แต่ก่อนอื่น มาเรียนรู้เพิ่มเติมเล็กน้อยเกี่ยวกับทฤษฎีเกมกันก่อน

ทฤษฎีความร่วมมือและเกม

ทฤษฎีเกม ซึ่งพัฒนาขึ้นครั้งแรกในช่วงทศวรรษที่ 1930 แต่มีต้นกำเนิดมาจนถึงเพลโต เป็นเครื่องมือสำหรับการศึกษาความร่วมมือ มันจัดการกับคำถามที่ว่าเมื่อใดที่ความร่วมมือจะเกิดขึ้นโดยจินตนาการว่าผู้เล่นมีส่วนร่วมในเกม เกมดังกล่าวมีกฎเกณฑ์ และผู้เล่นมีกลยุทธ์ ปัญหาคือการคิดออก สำหรับชุดของกฎ กลยุทธ์ที่ผู้เล่นจะใช้

ลองพิจารณาเกมความร่วมมือที่ง่ายที่สุด ผู้เล่นสองคนแต่ละคนมีทางเลือก: ร่วมมือหรือไม่ ขึ้นอยู่กับทางเลือกของตนเองและทางเลือกของคู่ต่อสู้ พวกเขาแต่ละคนจะได้รับ "ผลตอบแทน" หรือจำนวนผลประโยชน์ที่พวกเขาได้รับจากการโต้ตอบ กลยุทธ์ของผู้เล่นคือการร่วมมือกันหรือไม่ และอาจขึ้นอยู่กับประสบการณ์ในอดีตและผลที่คาดว่าจะได้รับ

คำถามแรกที่ถามคือผู้เล่นแต่ละคนควรใช้กลยุทธ์ใด? สันนิษฐานว่าผู้เล่นควรทำทุกอย่างที่จะส่งผลให้ได้ผลตอบแทนสูงสุด

ในภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ตัวอย่างที่มีชื่อเสียงที่สุด ของเกมความร่วมมือสองคนที่เรียบง่ายนี้ คำตอบ - จากการเล่นเกมเพียงครั้งเดียว - คือไม่ควรให้ความร่วมมือ เคย.

สำหรับคำอธิบายโดยละเอียดเพิ่มเติมเกี่ยวกับภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ คลิกที่นี่. แต่โดยสังเขป ลองนึกภาพสมาชิกสองคนของแก๊งค์ถูกขังอยู่ในห้องขังเดี่ยวและแต่ละคนได้รับข้อเสนอ: หักหลังอีกฝ่ายหนึ่งและเป็นอิสระ ในขณะที่คู่หูถูกจำคุกสามปี หรืออยู่เงียบๆ และรับใช้เพียงหนึ่งปี หากผู้เล่นทั้งสองทรยศต่อกัน พวกเขาทั้งคู่จะได้รับสองปี

คนที่มีเหตุผลล้วนๆ – เล่นเกมอีกครั้งเพียงครั้งเดียว – ควรเลือกที่จะทรยศต่ออีกฝ่าย (หรือข้อบกพร่องตามที่นักทฤษฎีเกมอย่างเรากล่าวไว้) โดยหวังว่าจะเป็นอิสระ แต่ผลสุดท้ายของพฤติกรรมทั้งสองอย่างมีเหตุผลคือทั้งคู่ได้เวลาสองปี ในคุก. จะดีกว่าสำหรับพวกเขาที่จะ "ร่วมมือ" และในกรณีนี้ก็เงียบ (ให้โทษจำคุกหนึ่งปีแก่พวกเขาแต่ละคน)

ในเกมแห่งชีวิต การร่วมมือหรือไม่คือทางเลือกที่ต่อเนื่อง

แต่ในขณะที่นักโทษเหล่านี้ต้องเลือกเพียงครั้งเดียวว่าจะร่วมมือหรือไม่ และไม่รู้พฤติกรรมในอดีตของอีกฝ่ายหรือจินตนาการถึงผลกระทบต่อการเลือกในอนาคตได้ ในชีวิตจริง เราเล่นเกมความร่วมมือเหล่านี้ซ้ำแล้วซ้ำเล่า ทางเลือกที่เราทำนั้นได้รับแจ้งจากประสบการณ์ในอดีตของเราและความคาดหวังของการมีปฏิสัมพันธ์ในอนาคต ตัวอย่างเช่น ฉันมีโอกาสน้อยที่จะร่วมมือกับคนที่ทรยศฉันในอดีต และฉันมีโอกาสน้อยที่จะทรยศคนที่อาจมีโอกาสตอบแทนความโปรดปรานในอนาคต

ความแตกต่างนี้สะท้อนให้เห็นในการทดลองกับ คนจริงที่เล่นภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษใคร มักเลือกที่จะ “ร่วมมือ” (นั่นคืออยู่เงียบๆ) ดังนั้น เพื่อให้เข้าใจทุกอย่างเกี่ยวกับเวลาที่คนจริงๆ อาจร่วมมือกัน เราต้องคิดว่าพวกเขาตัดสินใจอย่างไรเมื่อควรร่วมมือ และกลยุทธ์ใดที่จะเลือก และสิ่งนี้เปลี่ยนแปลงไปตามกาลเวลาอย่างไร

เนื่องจากพฤติกรรมของเราขึ้นอยู่กับประสบการณ์ของเราในการโต้ตอบกับคนจำนวนมาก เราจึงต้องดูเกมที่เล่นระหว่างไม่ใช่แค่คู่เดียว แต่ระหว่างผู้เล่นหลายคน ทั้งหมดนี้ทำให้เรานึกถึงจำนวนผู้เล่น และพลวัตของกลยุทธ์ของผู้เล่นในการพัฒนาเกม เมื่อความซับซ้อนเพิ่มขึ้น ยูทิลิตี้ก็เช่นกัน

ความร่วมมือในระยะยาว

ในเกมที่กำลังพัฒนา เราคิดถึงผู้เล่นที่มีปฏิสัมพันธ์ซึ่งกันและกันหลายครั้ง ซึ่งทำให้มันดูคล้ายชีวิตมากขึ้นและเปิดกว้างให้เป็นประโยชน์ในทางปฏิบัติมากขึ้นในการศึกษา ผู้เล่นเปลี่ยนกลยุทธ์และลองเล่นหลายๆ แบบเมื่อเวลาผ่านไป และคัดลอกกลยุทธ์ของผู้เล่นคนอื่นๆ ที่ประสบความสำเร็จมากกว่าด้วย

กลยุทธ์เหล่านั้นเปลี่ยนแปลงไปตามกาลเวลาอย่างไร? บางคนจะมีวิวัฒนาการและยึดครองหรือไม่? และโดยเฉพาะอย่างยิ่งความร่วมมือจะเป็นบรรทัดฐาน? ถ้าเป็นเช่นนั้นเมื่อไหร่?

แนวทางวิวัฒนาการของทฤษฎีเกมได้นำไปสู่ผู้คนมากมาย ข้อมูลเชิงลึกที่เป็นประโยชน์ เกี่ยวกับวิธีการสร้างแรงจูงใจให้ความร่วมมือ และมี รู้จักกันมานาน ว่าด้วยการลงโทษผู้แปรพักตร์ (หรือผู้ที่ไม่ให้ความร่วมมือ) อย่างเหมาะสม กลยุทธ์ความร่วมมือที่เฉพาะเจาะจงสามารถทำได้ดีในสภาพแวดล้อมเชิงวิวัฒนาการ

แต่เมื่อเร็ว ๆ นี้ นักวิจัยได้เริ่มคิดเกี่ยวกับ a ช่วงกว้างกว่ามาก ของกลยุทธ์และ a ข้อมูลเพิ่มเติม ซับซ้อน ภาพ ได้โผล่ออกมา.

การวิจัยของเราไม่ได้ถามว่ากลยุทธ์ใด "ชนะ" ในกลุ่มประชากร เพราะปรากฎว่าไม่มีกลยุทธ์ใดที่ดีที่สุดเสมอไป โดยมีตัวเลือกมากมาย อันที่จริง ในระยะยาว ไม่มีใครพฤติกรรม (ร่วมมือหรือบกพร่อง) ที่ครอบงำตลอดไป

ในทางกลับกัน เมื่อเรามุ่งเน้นไปที่พลวัตของกลยุทธ์เมื่อเวลาผ่านไป สิ่งที่เกิดขึ้นคือภาพของฟลักซ์คงที่ ผู้คนอาจเลือกกลวิธีร่วมมือ แต่กลยุทธ์เหล่านี้ค่อยๆ ถูกแทนที่ด้วยกลยุทธ์ที่เสียเปรียบหรือเห็นแก่ตัว ซึ่งจะถูกกัดเซาะและแทนที่

เหตุผลของการไหลนี้คือความพึงพอใจที่เกิดขึ้นเองตามธรรมชาติ: เมื่อทุกคนร่วมมือ ไม่จำเป็นต้องกังวลเกี่ยวกับผู้แปรพักตร์เหล่านี้ (เรียกพวกเขาว่ากบฏโดยไม่มีสาเหตุ) ที่ต่อต้านเมล็ดพืช ผู้เล่นมีอิสระที่จะลองใช้กลยุทธ์ใหม่ๆ เช่น ไม่เคยลงโทษผู้แปรพักตร์ และในระยะสั้นพวกเขาไม่ต้องเสียค่าใช้จ่ายใดๆ แต่เมื่อกลยุทธ์ที่พึงพอใจดังกล่าวเกิดขึ้น ประชากรทั้งหมดก็เปิดรับการแสวงประโยชน์จากผู้แปรพักตร์ ดังนั้นความร่วมมือจึงสูญเสียไป

แม้จะมีการหมุนเวียนอย่างต่อเนื่อง แต่เรายังสามารถลองกำหนดประเภทของพฤติกรรมที่ครอบงำได้ โดยเฉลี่ย. โชคดีสำหรับสังคม สิ่งที่เราพบคือส่วนใหญ่ความร่วมมือจะครอบงำ การหมุนเวียนระหว่างผู้ให้ความร่วมมือและผู้แปรพักตร์อาจหลีกเลี่ยงไม่ได้ แต่ความร่วมมือยังคงเป็นกฎ อย่างไรก็ตาม เรื่องนี้ขึ้นอยู่กับการรักษาต้นทุนและประโยชน์ของความร่วมมือให้คงที่ และโดยทั่วไปแล้วไม่ใช่

เมื่อความร่วมมือพังทลาย

เราเปลี่ยนแปลงวิธีที่เราสร้างแรงจูงใจให้ความร่วมมืออย่างต่อเนื่อง รัฐบาลใหม่เข้ามามีอำนาจ ผู้จัดการคนใหม่ต้องการทำเครื่องหมาย ผู้ปกครองอ่านหนังสือเล่มใหม่เกี่ยวกับการเลี้ยงลูก

ในเกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษธรรมดา การจำคุกที่สั้นลงจะกระตุ้นให้ผู้เล่นปิดปากเงียบ และด้วยเหตุนี้จึงได้ผลลัพธ์ที่ดีที่สุด ในชีวิตประจำวัน การร่วมมือระหว่างผู้คนต้องแลกมาด้วยต้นทุนบางอย่าง เช่น ความพยายามในการทำงาน และรางวัลตอบแทน ซึ่งเป็นผลิตภัณฑ์ที่ดีกว่าใครๆ ก็สามารถสร้างขึ้นได้เพียงลำพัง สิ่งจูงใจคือรางวัล ค่าใช้จ่ายเป็นสิ่งที่บุคคลมีส่วนร่วมในการบรรลุพวกเขา

โดยทั่วไปแล้ว ผลประโยชน์และผลตอบแทนจะแตกต่างกันออกไป ยิ่งผู้คนพยายามร่วมมือกันมากเท่าไร ก็ยิ่งได้รับผลตอบแทนจากการมีปฏิสัมพันธ์มากขึ้นเท่านั้น ในเกมที่กำลังพัฒนา สิ่งนี้ทำให้ผู้เล่นไม่เพียงแต่เปลี่ยนกลยุทธ์เท่านั้น แต่ยังรวมถึงความพยายามที่พวกเขาใส่เข้าไปเมื่อพวกเขาเลือกที่จะร่วมมือด้วย

นี่อาจดูเหมือนเป็นสิ่งที่ดี – สมาชิกของทีมไม่เพียงแค่ร่วมมือแต่พยายามอย่างเต็มที่เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด น่าเสียดายที่เมื่อกลยุทธ์ ต้นทุน และผลประโยชน์เริ่มพัฒนาร่วมกัน สิ่งที่ตรงกันข้ามอาจเกิดขึ้นได้: ความร่วมมือเริ่มล่มสลาย

การล่มสลายของความร่วมมือเกิดขึ้นเมื่ออัตราส่วนของต้นทุนต่อผลประโยชน์สูงเกินไป

สมมติว่าทุกคนในทีมทำงานพิเศษจริง ๆ เมื่อพวกเขาทำงานในโครงการ จากนั้นสมาชิกทุกคนในทีมจะรู้ว่าเขาหรือเธอมีน้อยที่จะสูญเสียโดยการละเลย เพราะความพยายามพิเศษของคนอื่นจะยังคงแบกรับพวกเขาอยู่

นี่คือสิ่งที่เราเห็นในเกมที่กำลังพัฒนา – ผู้เล่นที่ให้ความร่วมมือมีส่วนช่วยในความร่วมมือมากขึ้นเรื่อยๆ เพียงเพื่อให้ผู้หลบหนีเข้ายึดครองได้ง่ายขึ้นเท่านั้น สิ่งนี้ทำให้เกิดความขัดแย้ง เพราะมันหมายถึงยิ่งเราร่วมมือกันมากเท่าไหร่ คนอื่นก็จะยิ่งทำแบบเดียวกันน้อยลงเท่านั้น

เราจะสร้างแรงจูงใจให้ความร่วมมืออย่างมีประสิทธิภาพได้อย่างไร

ทั้งหมดนี้ทำให้เกิดคำถามเกี่ยวกับวิธีการสร้างแรงจูงใจให้ความร่วมมือ ในอีกด้านหนึ่ง เราพบว่าเป็นไปไม่ได้ที่จะรับประกันว่าสมาชิกของกลุ่มจะให้ความร่วมมือในระยะยาวเสมอ แต่เรามักจะสามารถให้ความร่วมมือโดยเฉลี่ยเป็นจำนวนมากหากเราได้รับผลตอบแทนที่ถูกต้อง ในทางกลับกัน หากเราสร้างแรงจูงใจให้ความร่วมมือมากเกินไป เราก็สนับสนุนให้เกิดการละเลยไปพร้อม ๆ กันที่ขัดแย้งกันเอง

เกมอย่างภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษนั้นเรียบง่ายเกินไป โดยเฉพาะอย่างยิ่งเมื่อพูดถึงการจับภาพความซับซ้อนของการปฏิสัมพันธ์ของมนุษย์

แนวทางวิวัฒนาการในการวิเคราะห์ทฤษฎีเกมไม่สามารถบอกเราได้อย่างแม่นยำถึงวิธีการสร้างสมดุลที่เหมาะสมระหว่างการส่งเสริมความร่วมมือและการละทิ้ง แต่เผยให้เห็นว่าการสร้างแรงจูงใจมากเกินไปมีค่าใช้จ่ายสูงลิบลิ่ว

บทความนี้ถูกเผยแพร่เมื่อวันที่ สนทนา.
อ่าน บทความต้นฉบับ.

เกี่ยวกับผู้เขียน

อเล็กซานเดอร์ เจ สจ๊วตอเล็กซานเดอร์ เจ สจ๊วร์ต เป็นนักศึกษาปริญญาเอกสาขาชีววิทยาคณิตศาสตร์ที่ มหาวิทยาลัยเพนซิลเวเนีย เขาใช้ทฤษฎีเกมวิวัฒนาการและพันธุศาสตร์ของประชากรเพื่อศึกษาคำถามเกี่ยวกับวิวัฒนาการของพฤติกรรมทางสังคมที่ซับซ้อน การวิวัฒนาการของประชากร และวิวัฒนาการของสถาปัตยกรรมทางพันธุกรรม

คำสั่งการเปิดเผยข้อมูล: Alexander J Stewart ไม่ได้ทำงานให้ ปรึกษา เป็นเจ้าของหุ้นหรือรับเงินทุนจากบริษัทหรือองค์กรใดๆ ที่จะได้รับประโยชน์จากบทความนี้ และไม่มีส่วนเกี่ยวข้องใดๆ

หนังสือที่เกี่ยวข้อง:

at