कारोबार और परिसंपत्ति आवंटन में कंप्यूटर प्रोग्राम और एल्गोरिदम का उपयोग करीब पांच दशक पहले आरंभ हो चुका है। हालांकि सार्वजनिक वस्तुओं और परिसंपत्तियों का वितरण कैसे किया जाए, यह एल्गोरिदम द्वारा नहीं किया गया। बहरहाल, कृत्रिम बुद्धिमत्ता (आर्टिफिशियल इंटेलिजेंस या एआई) आधारित एक अध्ययन यही दर्शाता है कि सेल्फ-लर्निंग एल्गोरिदम के जरिये यह काम भी कहीं अधिक प्रभावी और समतापूर्वक ढंग से संभव है।
डीप माइंड नाम की एक एआई शोध कंपनी (अल्फाबेट की अनुषंगी) अपने ‘अल्फा-जीरो’ एल्गो के लिए प्रसिद्ध है, जो शानदार तरीके से शतरंज खेलने से लेकर प्रोटीन-संरचना सरीखी तमाम जटिल गुत्थियों को सुलझाने के गुर सिखाती है। डीप माइंड ने हाल में एक पत्र प्रकाशित किया है, जिसमें लाभांश वितरण के लिए मानव-एआई संपर्क की प्रक्रिया को अपनाया गया और उसे पारंपरिक पद्धतियों की तुलना में कहीं बेहतर पाया।
मान लीजिए तमाम लोग एक सार्वजनिक कोष (पब्लिक फंड) के लिए अलग-अलग राशि का योगदान करते हैं। फंड से प्रतिफल प्राप्त होता है। तब अंशदान करने वालों को आनुपातिक प्रतिफल मिलना चाहिए। परंतु इस आनुपातिक का उचित स्तर क्या होना चाहिए? जब आप पेंशन कोष की बात करते हैं तो यह काफी आसान हो जाता है। आप अमुक राशि का योगदान करते हैं और उस राशि को जिस श्रेणी में निवेश किया गया हो, उस परिसंपत्ति वर्ग के लाभ अनुसार प्रतिफल प्राप्त करते हैं।
वहीं जब करों के प्रवर्तन के साथ ही एकत्रित करों के माध्यम से यह आकलन करते हैं कि उनसे सार्वजनिक वस्तुओं का कैसा समुच्चय बनना चाहिए और और उस समुच्चय को कैसे आवंटित किया जाना चाहिए तो यह मसला खासा जटिल हो जाता है। व्यवहार वैज्ञानिक ऐसे विभाजन का आकलन करने के लिए ‘पब्लिक गुड्स गेम’ जैसी अवधारणा का प्रयोग करते हैं। इस कवायद में खिलाड़ी या प्रतिभागी यह चुनते हैं कि वे एक कोष में कितना निवेश करेंगे। वह समूह प्रतिफल प्राप्त करता है, परंतु उसमें अदायगी-निधि या आवंटित की जाने वाली राशि को समान रूप से अन्य तरीकों से विभाजित किया जा सकता है। यदि सौ लोगों के समूह ने 100 रुपये निवेश किए और उस निवेश पर कुल 50 रुपये प्रतिफल मिलता है तो प्रत्येक प्रतिभागी को शायद 1.5 रुपये मिलें, भले ही उनके योगदान का स्तर अलग-अलग हो। इसे ‘विशुद्ध समतावाद’ कहते हैं। यदि प्रत्येक अपने योगदान के अनुपात में प्रतिफल प्राप्त करता है तो यह ‘लिबर्टेरियन यानी उदारवादी’ माना जाएगा। वहीं ‘उदारवादी समतावाद’ एक और वितरण पद्धति है, जहां योगदान की गई समग्र परिसंपत्ति के अंश के आधार पर प्रतिफल की गणना की जाती है। इसमें यदि कोई कम-आय वाला प्रतिभागी अधिक अंशदान करता है तो उसे उस अधिक आमदनी वाले व्यक्ति से ज्यादा प्रतिफल प्राप्त होगा, जो कोष में कम अंशदान करता है।
यदि हर कोई अधिक योगदान करता है तो कुल निधि भी बढ़ जाती है। हालांकि ऐसे लोग जो ‘बहती गंगा में हाथ धोने’ वाली मुफ्तखोरी की मानसिकता से ग्रस्त होते हैं और शून्य या मामूली योगदान करते हैं, उनके हाथ ऐसी व्यववस्था में शायद कुछ न लगे। यदि यह कवायद कई चरणों में की जाए तो हमें यह अंदाजा मिलता है कि एक ‘औसत’ व्यक्ति कितना योगदान करेगा और उस पर क्या उचित प्रतिफल होगा।
इस मॉडल में करों और सार्वजनिक वस्तुओं के मोर्चे पर क्या होता है? हम कई दौर में करों का भुगतान करते हैं। ‘पब्लिक गुड्स गेम’ की बात करें तो यह पहलू शिक्षा, स्वच्छ वायु, सब्सिडी और यहां तक कि सार्वभौमिक बुनियादी आय जैसी वास्तविक सांसारिक सार्वजनिक वस्तुओं के वितरण सदृश माना जा सकता है।
दार्शनिक एवं राजनीतिक दृष्टिकोण से लाभ का विभाजन और वितरण जटिल प्रतीत होता है। उसमें प्रश्न उठने लगते हैं कि क्या किसी अरबपति को गैस सिलिंडर पर सब्सिडी मिलना ‘उचित’ है? या फिर किसी उच्च-वर्गीय परिवार के बच्चे को सरकारी स्कूल में मध्याह्न भोजन मिलना चाहिए?
सार्वजनिक वस्तु वितरण ढांचा तैयार करने के लिहाज से इन पहलुओं का स्वाभाविक रूप से व्यापक निहितार्थ होता है। कुछ लोग हमेशा ‘हमेशा बहती गंगा में हाथ’ धोते रहेंगे, वहीं कुछ लोग शायद अपनी सीमा से अधिक योगदान करेंगे। तब यदि आप अधिसंख्य लोगों को योगदान और प्राप्ति के स्तर पर संतुष्ट करते हैं तो समझिए कि आपका कराधान और सार्वजनिक वस्तु तंत्र कारगर है, जो मतदाताओं में भी लोकप्रिय हो। दूसरी ओर कोई पुनर्वितरण योजना अलोकप्रिय है तो यह न केवल योगदान के स्तर को घटाएगी और मुफ्तखोरी को बढ़ाएगी, बल्कि इससे असमान परिणाम भी प्राप्त होंगे या फिर कर-वंचना को बढ़ावा मिलेगा।
एआई के उपयोग से विभिन्न स्तरों पर मानव व्यवहार के इन पहलुओं का अध्ययन किया जा सकता है। इससे पहले कि एआई-आधारित सिस्टम ह्यमुन वैल्यूज पर विश्वसनीय परिणाम दे सके, उससे पहले उसे इन वैल्यूज को जानना होगा। कंप्यूटर वैज्ञानिक इसे ‘वैल्यू अलाइनमेंट’ कहते हैं। संभावित ह्यूमन वैल्यूज को लेकर प्रोगामर्स के अनुमानों के बजाय डीप माइंड ने गहन सुदृढ़ीकरण समझ और मानवीय प्रतिपुष्टि का उपयोग किया। पेपर में इसे ‘ह्यूमन-सेंटर्ड मैकेनिज्म डिजाइन विद डेमोक्रेटिक एआई’ यानी लोकतांत्रिक एआई के साथ मानव-केंद्रित तंत्र ढांचा बताया है।
मानव व्यवहार की नकल करने के लिए डीप माइंड ने कई गेम्स का मंच बनाया। हजारों मानव प्रतिभागियों और वर्चुअल एजेंट्स को उससे जोड़ दिया। विशुद्ध समतावाद, उदारवाद, उदार समतावाद और मानव-डिजाइन तंत्रों के योगदान और उनसे प्राप्त प्रतिपुष्टि का आकलन करते हुए एआई ने भी ‘ह्यूमन सेंटर्ड रीडिस्ट्रिब्यूशन मैकेनिज्म (एचआरसीएम)’ यानी मानव केंद्रित पुनर्वितरण तंत्र डिजाइन किया।
डीप माइंड की इस कवायद में शामिल हुए विभिन्न खिलाड़ियों को अलग-अलग आरंभिक निधि (माडलिंग आय असानता) प्राप्त हुई और उन्होंने अपना अंशदान भी चुना कि उन्हें कितना योगदान करना है। एचआरसीएम के अंतर्गत निवेश से होने वाला लाभ अंशदान के कुल मूल्य और योगदान एवं निधि के बीच अनुपात जैसे दोनों पहलुओं के संदर्भ में सशर्त ही था। जितना ज्यादा योगदान, उतना ही अधिक प्रतिफल।
एचआरसीएम प्रणाली सबसे लोकप्रिय प्रतीत हुई। प्रतिपुष्टि के अनुसार इसे प्रगतिशील रूप में देखा गया, क्योंकि इसने धनाभाव से जूझ रहे लोगों के अधिकारों को प्रोत्साहन दिया। वहीं इसने मुफ्तखोरी वाले रवैये को दंडित करने के साथ ही निधि के अनुपात में अधिक योगदान को भी प्रोत्साहित किया। स्वाभाविक है कि कर प्रणाली के डिजाइन से लेकर सार्वजनिक वस्तुओं के वितरण तंत्र में इस अनुभव के प्रयोग पर भारतीय वित्त मंत्री निर्मला सीतारामण से लेकर किसी भी वर्तमान वित्त मंत्री के अपने आग्रह या हिचक हो सकती है। लेकिन भविष्य में यह बहुत उपयोगी सिद्ध हो सकता है।