کاربرد تئوری بازیها در مذاکرات سیاسی تعیینکننده
احمد یزدانپناه *
چند سالی است هم در تدریس و هم پژوهش روی «نظریه بازی»ها کار میکنم. کتابی هم روی میز است که چشمانتظار چاپ است. در هشت یا نه سالی که در دانشگاه ایالتی ایوا فرصت پژوهش و تدریس و تعلم داشتم، توفیقی نصیب شد که در خدمت مایکل هلمر کارشناس ارشدی فاضلتر از دهها دکتر در زمینه ابعاد گوناگون، سازمان تجارت جهانی WTO، تلمذ کنیم. یکی از مباحث فنون مذاکره بود. گفتم شاید نگاهی به آن یادداشتها و مطابقت آن با منبع جدید و البته با حفظ سادگی بحث، برای ما که چشمانتظار نتایج مذاکرات هستهای هستیم مفید فایده باشد، نیویورک تایمز ماه گذشته در گزارشی نوشته بود مذاکرات ایران با آمریکا با واسطهگری اروپا دارد به سمت یک «بازی جوجه» (ترسو و بزدل) میرود. راستش نگران شده و بیشتر مصمم شدم- با آنکه سیاسی نیستم و از اکثر سیاستمداران دل خوشی ندارم- تا به این بازی و بازی دیگری که نقشآفرین در مدل مذاکرات هستند اشارهای کنم.
بدون شک، حضور و ظهور و بروز مذاکرات یکی از متداولترین و از غالبترین نیازهای زندگی امروزه ما هستند. از معاملات و بدهبستانهای زندگی روزمره گرفته مثل رهایی از ترافیک و پرهیز از وقت تلفشده در راهبندانها و نشستن بر ترک موتور با مذاکره اینکه چقدر میگیرد و خطوط قرمز ما را مثل به کار نبردن پیادهرو و رعایت سرعت مطمئنه که جزو عناصر مذاکره با آن موتوری است رعایت میکند. البته قواعد بازی باید رعایت شود. اگر لیست بالابلندی از خطوط قرمز مطرح کنید احتمال اینکه بین فرمایشات شما موتور را به حرکت درآورد و از خیر معامله با شما درگذرد، بسیار است.
از مذاکره با سوپر سر کوچه گرفته تا مذاکرات تجارت بینالملل و جنگ و صلح. مذاکره تعاملی است بین طرفهای مذاکره برمبنای منافع خود؛ هرچند این منافع میتوانند متقابل و متقاطع باشند. هدف از مذاکره تلاشهای سازنده برای خاتمه دادن به منازعات و تضادها و تنشها و برقراری صلح و امکان تسویهحساب به روش عقلایی و منطقی و برپایه منافع متقابل است. مذاکرات در اصل یک «بازی» به معنی استراتژیک آن است؛ یعنی رابطه و گفتوگوی تعاملی و همان چیزی که تئوری بازیها به عنوان بازی مطرح میکند. طرفهای مذاکره هم همان «بازیکنان» هستند که باید با هوشیاری تمام «انتخاب» و تصمیمسازی کنند یا به گفته نظریه بازیها برنامه عمل یا «استراتژی» داشته باشند تا مذاکره به نتایج مطلوب برسد. کاربرد تئوری بازیها در مذاکرات امکان نتایج و پیامدهای مذاکره برای مذاکرهکنندگان را روشن میکند.
تئوری بازیها چیست؟
تئوری بازیها یک شاخهای از ریاضیات است که برای بررسی موشکافانه و دقیق شکل رفتار بهینه (بهترین) تصمیمگیران در موقعیتها استراتژیک طراحی شده است.
موقعیتهای استراتژیکال و راهبردی به آنهایی گفته میشود که پیامدهای تصمیمگیریها در آنها نهتنها به خود تصمیمگیرنده بستگی دارد بلکه به تصمیمات طرف مقابل او هم وابسته است. به همین جهت است که تئوری بازیها ابزاری قدرتمند برای تحلیل «موقعیتهای تصمیمگیری متقابل و دوطرفه» به حساب میآید که اعتبار و اهمیت خود را امروزه در مذاکرات استراتژیک به اثبات رسانده است.
بدون ورود به مباحث ریاضی و فنی کار سعی میشود به دو بازی متداول در مذاکرات یعنی «بازی جوجه» و «معمای زندانیها» اشاره شود و برای مثال به بحران موشکی ۱۹۶۲ کوبا هم اشاره خواهد شد.
عناصر اصلی تئوری بازیها
به زبان ساده، تئوری بازیها عبارت است از مجموعهای گسترده و متنوع از روشهای ریاضی که برای تحلیل فرآیندهای تصمیمگیری تعاملی بین دو یا چند بازیکن «عقلایی» که در آن تصمیم یک طرف یا یک حریف یا رقیب بر تمام حریفان دیگر و سایر رقبا اثرگذاری دارد. فرض بر آن است که بازیکنان عقلانیت خود را در حداکثرسازی منافع و مطلوبیت خود متجلی میکنند و فرض میشود که سایر بازیکنان هم هدفشان همین است.
در تئوری بازیها، یک «بازی» عبارت است از توصیف هر تعاملی میان بازیکنان که تحت تبعیت از مجموعهای از قواعد که حرکات احتمالی و ممکن آنان را مشخص میکند و پیامدها و نتایج هر ترکیب ممکن از حرکات را شکل میدهد. به هر مجموعه از نتایج و پیامد تصمیمات بازیکنان در نظریه بازیها «پاداشها» گفته میشود.
یک پاداش به سهولت میتواند رتبهبندی مطلوبیت و خوشایندی از نتایج را برساند. یا ممکن است ماحصل تلاشهای بازیکنان را ارزشگذاری کند به طوری که عایدات کسبشده هر بازیکن و یا محدودیتهای ضرر و زیان او را به نمایش بگذارد. این بازیها اکثرا در دو قالب دستهبندی میشوند؛ یا به شکل نرمال (یا استراتژیک) و یا به شکل بسط و گسترشیافته (درخت بازی).
ما در این یادداشت برای سهولت بحث، تمرکز خود را روی شکل نرمال بازیها قرار میدهیم. شکل نرمال یک بازی را میتوان به صورت ماتریس پاداشها و نتایج به نمایش گذاشت، که در آن پاداش متعلق به هر بازیکن از ترکیب استراتژیها و نتیجه اقدامات او نشان داده میشود. این شکل و فرم برای بازیهایی مناسبتر است که تصمیمات در آنها به طور همزمان گرفته میشوند، برخلاف بازیهایی که در آنها تصمیمات با حرکات پی در پی و متوالی بازیکنان همراه است.
این تقسیمبندی دوگانه کمک میکند که بازیکنان منطقه «راهحل» بازی را پیدا کنند. این شفافیت و روشنی بخشیدن به میدان دید بازیکنان درباره راهحلهای بازی دو منظور عمده را تعقیب (نیاز حیاتی برای فعالان بازارهای گوناگون کشور ما در حال حاضر) میکند.
اول، یک هدف هنجاری (یعنی باید و نبایدی) که میتواند ما را به سمت و سوی بهترین استراتژی که یک بازیکن با رفتار عقلایی میتواند آن را بپذیرد و راهنمایی کند و دوم، یک هدف پیشبینانه که میتواند نماگری باشد برای اینکه دریابیم چگونه بازیکنان عقلایی در چنین موقعیتهایی چنان رفتاری را از خود بروز میدهند.
برای مثال، راهحل یک بازی به توضیح و شرح «استراتژی غالب» یک بازیکن و یا در تشخیص او در «تعامل نش» بازی کمکهای زیادی میکند میبینید که تئوری بازیها میتواند به خوبی دو مسوولیت تئوری و نظریه بودن خود یعنی توانمندسازی ما در «توضیحدهی» و «پیشبینی» در مذاکرات نقش خود را ایفا کند. در قسمتهای بعد به مفهوم استراتژیهای غالب و تعادل نش اشاره خواهد شد.
کاربرد تئوری بازیها
هم در بحران کوبا و هم در بحران ۱۹۷۳ (جنگ اسراییل با مصر و سوریه) دو نمونه کلاسیک درگیری ابرقدرتهای جهانی (ایالات متحده و اتحاد جماهیر شوروی) در منازعات منطقهای را به نمایش میگذارند و با توجه به هدف این یادداشت، از زاویه کاربرد دو بازی «جوجه» (ترسوها) و «معمای زندانیها» به آنها نیمنگاهی خواهیم انداخت.
ریشه تئوریک بازی «جوجه» از یک «مسابقه» بین دو جوان جویای نام و قهرماننما سرچشمه میگیرد که در یک جاده باریک هر دو اتومبیلهای خود را به سمت هم میرانند. رانندگان مزبور (یا مذاکرهکنندگان یا طرفین بازی) دو گزینه دارند: یا با نرمشی دلاورانه و شجاعانه فرمان اتومبیل را کمی چرخش دهند و از یک تصادف پرلطمه و خسارت جلوگیری کنند (همکاری با طرف مقابل و حریف) و یا شاخ به شاخ شوند و لطمه به خود و دیگران را برگزینند (بازی با عدم همکاری با طرف دیگر) تا مبادا «جوجه» و ترسو و بزدل نامیده شوند. (یادتان هست در زنگ تفریح هم اگر کسی در نبردی کمی کوتاه میآمد، همکلاسیهای معرکهساز و هیزمآور قضیه او را «جوجه» صدا میکردند!)
بازی معمای زندانیها، در اصل ریشه تئوریک خود را از داستانی که A.W.Tzucker مطرح کرده سرچشمه گرفته که در آن پلیس دو نفر را به عنوان مظنون در باند جرم و جنایت (در بیشتر روایتها سرقت مسلحانه از بانک) دستگیر و در دو سلول جداگانه و انفرادی بازداشت میکند، به طوری که هیچ «ارتباطی» نمیتوانند با هم داشته باشند. نماینده دادستان ضمن بازجویی از آنها در تلاش به اعتراف گرفتن از آنها به شراکت در جرم مزبور، پیشنهاد گونههایی لااقل برای اعتراف گرفتن از یکی از آنها همراه با عواقب تصمیمگیری آنها را در سه سناریو برایشان تفهیم میکند:
۱- اگر یک مظنون اعتراف کند ولی دیگری اعتراف نکند، مظنونی که اعتراف و اقرار کرده آزاد شده بدون آنکه به همکاری و مشارکت در آن جرم محکوم شود، در حالی که مظنون دیگر به ۱۰ سال حبس محکوم خواهد شد.
۲- اگر هر دو مظنون اعتراف کنند، هر کدام فقط به ۵ سال حبس محکوم میشوند.
۳- اگر هیچکدام از مظنونان و زندانیان اعتراف نکنند، آنگاه هر دو باید یک سال یا کمتر زندان را تحمل کنند به خاطر فقدان شواهد و قرائن برای اتهامهای دیگر.
تحت آن شرایط و اوضاع و احوال با محدودیتها برقرار شده برای آنها، هر دو زندانی با معمایی روبهرو میشوند. به عبارت دیگر، بر سر دوراهی قرار میگیرند که تحت آن شرایط تحمیلی دست به یک انتخاب و گزینش بازدارنده و پیشدستگونه بزنند یعنی یا اعتراف کنند (عدم همکاری با طرف دیگر) و یا ساکت بمانند (همکاری با طرف دیگر).
هم در بازی «جوجه» و هم در بازی «معمای زندانیها» آن بازیکنان باید یک انتخاب مشخص از میان دو استراتژی «همکاری» (C) یا «عدم همکاری» (D) بکنند. به چنین بازیهایی بازی ۲×۲ میگویند. انتخابهای آنان در مورد هر یک از آن استراتژیها ۴ پیامد یا نتیجه یا پاداش برای هر بازیکن دربردارد که طبق معمول میتوان آنها را از «بهترین» (۴) تا «بدترین» (۱) درجهبندی و رتبهبندی کرد.
در هر دو بازی، مجموع پاداشها (و یا رتبهها) در هر نتیجه متغیر است و ثابت نیست، (بازی با تعارض و تضاد محدود و نسبی است) و بنابراین «برد» یک بازیکن لزوماً به معنی «باخت» حریف و بازیکن دیگر نیست. بنابراین هر دو بازیکن به طور همزمان برای برخی از نتایج بهتر و برای سایر نتایج تصمیمگیریهای خود بدتر عمل میکنند. برعکس، در بازیهای «با مجموع- صفر» یا «بازیهای تعارض» و «تضاد و اختلاف کامل» عایدی و نفع یک بازیکن معادل زیان و ضرر بازیکن و حریف و طرف دیگر مذاکره است. بنابراین منافع یک بازیکن همیشه حاصل لطمه زدن به منافع دیگری است.
به دو «ماتریس پاداشها» برای بازی «جوجه» و «معمای زندانیها» توجه کنید:
بازی «معمای زندانیها»
بازیکن ستون
C D بازیکن سطر
۴ و ۱ |
۳ و ۳ |
۲ و ۲ |
۱ و ۴ |
بازی «جوجه»
بازیکن ستون
C D بازیکن سطر
۴ و ۲ |
۳ و ۳ |
۱ و ۱ |
۲ و ۴ |
نمودار (۱)
همانطور که در نمودار (۱) دیده میشود، در هر دو بازی، هر دو بازیکن یا مذاکرهکننده مصالحه سازش و توافق میکنند. (یعنی انتخاب C) هر دو به نتایجی تقریبا بهترین (۳ و ۳) دست مییابند، اما هرکدام از بازیکنها با روی آوردن به تکروی و یکجانبهگرایی میتواند بهترین پیامد و نتیجه و پاداش را برای خود رقم بزند، لذا این امر در آنها انگیزهای قوی برای انتخاب D (عدم همکاری) به وجود میآورد؛ وقتی که طرف مقابل آنها یا بازیکن دیگر C را برمیگزیند. با این همه، اگر هر دوی آنها اسیر و قربانی پندار و رفتار حریصانه خود شوند و فقط در تعقیب منافع طرف خود باشند، به تبع و در نتیجه آن هر دو به «بدترین» نتیجه خود میرسند (در بازی «جوجه» (ترسوها و بزدلها)) و در مورد «معمای زندانیها» هم به تقریبا بدترین نتیجه خواهند رسید. (تشخیص برد- برد و سایر استراتژیها مشخص است)
«بازی جوجه» (ترسوها و بزدلها)
همانطور که از نمودار (۱) دیده میشود در بازی جوجه، دو «تعادل نش» وجود دارد (۲ و ۴) و (۴ و ۲) که هر دو به ترتیب برای سطر و ستون «برتر- پارتو» هستند، زیرا هیچ نتیجه دیگر برای هر کدام از بازیکنان بهتر از آنها نیست. تردستی در اینجا آن است که اگر هر کدام از بازیکنان برای رسیدن به تعادل نش که مطلوب و مقصود اوست D (عدم همکاری) را برگزیند، ریسک رسیدن به بدترین نتیجه خود را به جان خریده است و از قضا بازیکن دیگر و حریف او هم تصمیم میگیرد D را انتخاب کند. از آنجا که گزینه ناپایدار و بیثبات توافق متقابل (۳ و ۳) نامطلوب و ناخوشایند است و هیچ کدام از آنها در پی و متوجه یک استراتژی غالب نیست؛ این میتواند چنین نتیجه دهد که انتخاب و استراتژی بهترین بازیکن بستگی به انتخاب استراتژی بازیکن دیگر دارد. این وابستگی متقابل در «بازی جوجه» این امکان را برای یک بازیکن فراهم میآورد که D را انتخاب کند، به امید آنکه با چربزبانی و بازی با کلمات جوی را بسازد که بازیکن دیگر بازیکن دیگر C را برگزیند، تا در این میان مسیری شفاف برای خود بسازد تا به تعادل نش رقیب دست پیدا کند.
بحران موشکی کوبا به مثابه یک بازی جوجه
این بحران در اکتبر ۱۹۶۲ با استقرار موشکهای شوروی که دارای کلاهک هستهای بودند آغاز شد؛ موشکهایی که با هدفگیری خود به بخش مهمی از ایالاتمتحده میتوانستند خسارت وارد کنند.
هدف ایالاتمتحده برچیده شدن سریع موشکهای شوروی بود و لذا آنها دو استراتژی یا برنامه عمل روی میز خود داشتند.
۱- نیروی دریایی راههای حملونقل موشکها در آینده را به کوبا مسدود کند
۲- به کمک بمباران هوایی موشکهای مستقر را نابود سازند.
در حالی که شوروی دو گزینه داشت:
۱- موشکهای خود را برچیند و جمع کند.
۲- موقعیت خود را حفظ کند.
دو ابرقدرت برای یک تصادف شاخ به شاخ درست مثل دو راننده بازی جوجه رودرروی هم صفآرایی کرده بودند.
ماتریس زیر حرکات استراتژیک آنها را به نمایش میگذارد.
«شوروی»
ادامه استقرار موشکها برچیدن موشکها
۴ و ۲ پیروزی شوروی |
۳ و ۳ توافق و مصالحه |
۱ و ۱ جنگ هستهای |
۲ و ۴ پیروزی ایالات متحده |
نمودار (۲)
جالب است برخلاف بیشتر بازیهای جوجه که در آنها بازیکنان «عقلایی» تقریبا هرگز روی یک استراتژی و بیثبات همکاری به توافق نمیرسند، بحران موشکی کوبا با برچیدن موشکها توسط شوروی (۳ و۳ ) پایان گرفت.
بحث دارد مثل برخی مذاکرات سیاسی طولانی میشود و این آفات خاص خود را دارد لذا اجازه دهید به معمای زندانیها به عنوان پایان کلام اشاره کنیم.
همانطور که نمودار (۱) نشان میدهد، انتخاب استراتژیک عدم همکاری به طور اکید استراتژی غالب برای هر دو بازیکن است چون مستقل است از اینکه بازیکن دیگر و حریف C یا D را برگزیند؛ هر یک از بازیکنان با انتخاب عدم همکاری (D) وضع بهتری پیدا میکند. معما در اینجا آن است که اگر هر دو بازیکن D را برگزینند، آنها به این نتیجه دست مییابند که نسبت به انتخاب بیثبات (۳ و ۳)، پایینتر و پستتر- پارتو است (۲ و ۲) به ویژه این نتیجه یگانه و یکتا است که در آن هیچ کدام از بازیکنان انگیزهای برای تغییر و دور شدن یکجانبه و به صورت تکروی از آن را ندارند چراکه در غیر این صورت خود را با ریسک اوضاع و احوال بدتری مواجه میکنند. بنابراین میتوان برآورد کرد و نتیجه گرفت که بازیکنان «عقلایی» تعادل نش را برمیگزینند و در فرآیند تصمیمسازی خود انتخاب میکنند علیرغم اینکه امکان نتایج بهتر هم وجود دارد! (نکته مهم برای تصمیم عقلایی و عدم زیادهخواهی در مذاکرات برای هر دو طرف).
جمعبندی
در این یادداشت سعی شد به برخی از متداولترین مدلهای مطرح در تئوری بازیها که بیشترین کاربرد را در مذاکرات دارند اشاره شود. کاربرد این مدلها به عنوان وسیلهای برای «توضیحدهندگی» و «پیشبینی» عکسالعمل و پاسخ طرف مقابل و انتخابهای استراتژیک (دوطرفه) بازیکنان و در نهایت، ترسیم نتایج مذاکرات.
برای نمایش منافع و مزایای کاربری مدلهای تئوری بازیها در مذاکرات روابط تعاملی و تقابلی بینالمللی به عنوان «مدل مذاکره» به دو نمونه تاریخی «بحران کوبا» و «جنگ اعراب و اسراییل» یا «بحران ۱۹۷۳» میخواستم بپردازم که به علت طولانی شدن مطلب از خیر دومی درگذشتم و فقط به بحران موشکی کوبا اشاره شد.
به علاوه سعی نوشته بر آن بود تا به باز شدن این گره کمک کند که چرا بازیکنان و مذاکرهکنندگان به روش مشخصی در مواجه شدن با تضادها و تعارض با خواستههای طرف مقابل برخورد و عمل میکنند و پشت آن چه دلیل و منطقی نهفته است.
نظریه بازیها را میتوان به عنوان پلی برای عبور از شکافها و خلأهای مذاکرات و برخی خطوط قرمز که در مذاکرات، امکان بروز و ظهور دارند، به کاربر و مذاکرهکنندگان کمک نماید تا با تکیه بر علم و هنر و تجربه خود نگذارند نتیجهای به نام «بنبست» پدید آید. این مدلها میتوانند و باید نه تنها به مشخص کردن «استراتژی غالب» حریف و رقیب کمک نمایند بلکه برای فهم و درک منطقی که طرفهای دیگر مذاکره در تصمیمات و اقدامات و عکسالعملها و پاسخهای خود برای دستیابی به نتیجه به کار میبرند (از قبیل نیرنگها و ترفندها و اغواها، جنگهای روانی و رسانهای و تاکتیکهای فشار موقعیتی) که در نگاه اول به نظر آنها غیرعقلانی میآید بسیار کارساز هستند. در نهایت مراد آن بود که نشان داده شود تئوری بازیها حتی قبل از آنکه بازیگران و مذاکرهکنندگان پشت میز مذاکره جلوس نمایند، به وسیله روشنسازی موضوعات استراتژیک که محل هر منازعه و تعارض شده نتیجه مذاکرات را پیشبینی کنند و این مزیت کمی نیست چرا که اگر مذاکره برای ملتی تعیینکننده است ترک میز آن را برای مذاکرهکنندگان غیرعقلایی به حساب میآورد.
پانوشتها
۱- تعریف «استراتژی غالب»: وقتی بازیکنی با دو استراتژی و Y مواجه است، استراتژی X به استراتژی Y غالب (مسلط) میگویند اگر پاداش یا نتیجه X از زاویه مطلوبیت بزرگتر یا مساوی Y باشد.
میتوان راهبرد غالب را چنین بیان کرد که بازیکنان مستقل از اینکه حریف کدام بازی را برمیگزیند که از استراتژی دیگر بهتر است (پاداش بیشتری بهبار میآورد). اگر در یک بازی برای بازیکنی استراتژی اکیدا یا قویا غالب وجود داشته باشد و آن بازی «تعادل نش» داشته باشد، بازیکن مزبور حتما آن استراتژی یا برنامه عمل و اقدام را بازی میکند. اگر هر دو بازیکن استراتژی غالب اکید و قوی داشته باشند آنگاه آن بازی دارای یک «تعادل نش» یگانه و یکتا است.
۲- «تعادل نش» زمانی حاصل میشود که هیچ بازیکنی انگیزهای برای تغییر و انحراف از استراتژی (برنامه عمل) خود ندارد. حتی اگر از استراتژی سایر بازیکنان و حریفان و رقیبان آگاهی داشته باشد.
۳- معیار برتر- پارتو: تبیین موقعیتی که در آن وضع هیچ شخصی بدتر نمیشود، در حالی که حداقل موقعیت یک فرد و حداکثر وضع همه طرفها بهتر میشود.
برتر- پارتو: به نتیجه «الف» که احتمال و امکان وقوع دارد نسبت به نتیجه «ب» برتر- پارتو میگویند. وقتی لااقل یک عضو گروه «الف» را بر «ب» ترجیح دهد (یعنی، دستکم برای یکی از اعضای گروه، مطلوبیت نتیجه «الف» بیشتر از نتیجه و پیامد «ب» باشد) و هیچ فردی از گروه «ب» را بر «الف» ترجیح ندهد. (یعنی، فردی در گروه پیدا نشود که برای او مطلوبیت (رضایتخاطر) از نتیجه «ب» کمتر از مطلوبیت نتیجه «الف» باشد.)
۴- به نتیجه «ب» (که محصول انتخاب و تصمیمسازی افراد است) نسبت به «الف» دونپایه- پارتو گفته میشود که نتیجه «الف» برتر- پارتو» نسبت به نتیجه «ب» است.
*اقتصاددان و عضو هیات علمی دانشگاه الزهرا
اخبار برگزیدهیادداشتلینک کوتاه :