जैसे-जैसे इंटरनेट की सघनता बढ़ती जा रही हैं, फ़ेक न्यूज़ का दायरा और उसके फैलने की गति भी उसी अनुपात में बढ़ती जा रही है. युद्ध हो या सांप्रदायिक दंगे अथवा प्राकृतिक आपदा, फ़ेक न्यूज़ अपने लिए जगह बना ही लेती है. भला, चुनाव कैसे इससे अछूते रह सकते हैं. चुनाव की सुगबुहाट होते ही है, फ़ेक न्यूज़ की हवा चलने लगती है. मतदाताओं को प्रभावित करने करने के लिए सभी पार्टियां अपने अनुरूप इसका इस्तेमाल करती हैं.
नवम्बर महीने में मध्य प्रदेश, राजस्थान, छत्तीसगढ़, तेलंगाना और मिजोरम में विधानसभा चुनाव के लिए मतदान होना है. पांचों राज्यों में कुल 16 करोड़ 14 लाख से अधिक मतदाता 679 विधानसभा सीट्स के लिए वोट डालेंगे. यह देश की कुल विधानसभा सीट्स का लगभग छठवा हिस्सा है, जो राज्य सभा की कुल 34 सीट्स को तय करता है. इसके अतिरिक्त, इन राज्यों से लोकसभा के लिए कुल 83 सदस्य चुने जाते हैं. यही वजह कि पांच राज्यों के विधानसभा चुनाव को अगले साल होने वाले लोकसभा चुनाव का सेमीफाइनल कहा जा रहा है.
ऐसे में सभी पार्टियां और उनके समर्थक मतदाताओं को लुभाने के लिए सभी प्रकार के उपाय कर रहे हैं. फिर भले ही विरोधी दल की छवि ख़राब करने के लिए झूठे तथा भ्रामक वीडियो एवं तस्वीर ही क्यों न शेयर करनी पड़े. मध्य प्रदेश विधानसभा चुनाव को लेकर सोशल मीडिया पर शेयर किये जा रहे वीडियो से यह सब स्पष्ट समझा जा सकता है.
मध्य प्रदेश में राजनीतिक पार्टियों के समर्थक बड़ी संख्या में एक दूसरे के नेताओं के पुराने वीडियो को एडिट और छेड़छाड़ कर उन्हें सोशल मीडिया पर शेयर कर रहे. बीजेपी नेता और प्रदेश के मुख्यमंत्री शिवराज सिंह चौहान तथा कांग्रेस नेता कमलनाथ पर निशाना साधा जा रहा है.
मात्र पिछले एक महीने में मध्य प्रदेश चुनाव से सम्बंधित बूम ने कुल 17 पुराने व एडिटेड वीडियो और उनके साथ किये जा रहे फ़र्ज़ी एवं भ्रामक दावों को फ़ैक्ट चेक किया. इनमे से 9 वीडियो बीजेपी विरोधी दावों वहीं, 8 वीडियो कांग्रेस विरोधी दावों के साथ वायरल किये जा रहे थे. तस्वीरों के साथ किये जा रहे दावे अलग हैं.
3 वीडियो में मुख्यमंत्री शिवराज सिंह को टारगेट किया गया. वहीं कांग्रेस नेता कमलनाथ को भी निशाना बनाते हुए हमारी जांच में 3 एडिटेड वीडियो पाय गए. इन सभी वीडियो में अलग से वॉइसओवर जोड़ा गया है. हालांकि यह स्पष्ट नहीं है कि ये वॉइसओवर किसी मिमिक्री आर्टिस्ट द्वारा डबिंग (dubbing) कर या फिर किसी एआई (AI) टूल की मदद से तैयार किये गए हैं.
कांग्रेस समर्थक पवन दीक्षित ने एक्स (पूर्व में ट्विटर) पर शिवराज सिंह चौहान का पुराना वीडियो शेयर करते हुए बताया कि मुख्यमंत्री शिवराज सिंह चौहान ने चुनाव से पहले ही हांर मान ली और वह बीजेपी नेताओं तथा अधिकारियों से कांग्रेस नेता कमलनाथ को किसी भी कीमत पर रोकने के लिए कह रहे हैं. साथ ही वह अपनी घोषणाओं को झूठी बताते हुए कांग्रेस की घोषणाओं की बात करते हुए कहते है कि अगर वोजीत गए तो हम अगले चुनाव में भी नहीं जीत पाएंगे.
बूम ने जांच करते हुए पाया कि यह वीडियो जून 2023 में भोपाल के सतपुड़ा भवन में लगी आग को लेकर की गई समीक्षा बैठक का है और इसमें शिवराज सिंह चौहान की फ़र्ज़ी आवाज अलग से जोड़ी गई है. जबकि मूल वीडियो में कोई आवाज नहीं थी.
बीजेपी के समर्थन में लगातार पोस्ट करने वाले फ़ेसबुक पेज 'मेरा मध्य प्रदेश' ने कमलनाथ का चुनावी सभा का एडिटेड वीडियो पोस्ट किया जिसमें कमलनाथ कह रहे हैं कि सरकार में आते ही हम बीजेपी द्वारा लायी गयी 'लाड़ली बहना योजना' को बंद कर देंगे और कांग्रेस की 'नारी सम्मान योजना' में उनका नाम नहीं जोड़ेंगे. बूम ने पाया कि वीडियो के साथ छेड़छाड़ कर कमलनाथ की फ़र्ज़ी आवाज अलग से जोड़ी गयी है. मूल वीडियो में कमलनाथ छिन्दवाड़ा ज़िले के विकास और रोजगार से सम्बंधित बात कर रहे हैं.
हमने बीजेपी के मध्य प्रदेश के सोशल मीडिया प्रभारी अभिषेक शर्मा जी बात की. जब हमने उनसे मुख्यमंत्री शिवराज सिंह चौहान के वायरल हो रहे वीडियो के बारे में पूछा तो उन्होंने कहा कि उनके नज़र में ऐसे तीन-चार वीडियो आये हैं जो कि फ़ेक हैं और इस सम्बन्ध में उनकी लीगल सेल ने कानूनी कार्रवाई करते हुए मामला दर्ज़ कराया है.
कांग्रेस पर आरोप लगाते हुए उन्होंने आगे कहा कि "ये वीडियो कांग्रेस आईटी सेल ने ही बनाकर फैलाए हैं. किसी अन्य को क्या ही मतलब इससे." जब हमने उनसे सोशल मीडिया कैंपेन में आर्टिफीसियल इंटेलिजेंस (एआई) के इस्तेमाल के बारे में पूछा तो उन्होंने नकारते हुए कहा कि "हम एआई का इस्तेमाल नहीं करते हैं. हमारे पास प्रोफेशनल एडिटर और ग्राफ़िक डिज़ाइनर होते हैं.”
इसके बाद, हमने कांग्रेस के मध्य प्रदेश में सोशल मीडिया देखने वाले अभय तिवारी से उनके सोशल मीडिया कैम्पेन के सम्बन्ध में बात करने की कई बार कोशिश की लेकिन वह लगातार टालते रहे.
बूम ने इस तरह की कुल 6 वीडियो को फ़ैक्ट चेक किया है जिन्हें ऑडियो के साथ छेड़छाड़ कर एडिट किया गया है. संभव है किसी मिमिक्री आर्टिस्ट ने डबिंग कर फ़र्ज़ी ऑडियो तैयार की हो जिसे इन वीडियो में डाला गया हो. फ़र्ज़ी ऑडियो तैयार करने का दूसरा विकल्प एआई (AI) टूल की मदद से भी हो सकता है. हालांकि बूम आधिकारिक रूप से इसकी पुष्टि नहीं करता है कि ये फ़र्ज़ी ऑडियो कैसे तैयार किये गए हैं.आर्टिफीसियल इंटेलिजेंस टूल्स के इस्तेमाल को लेकर बूम ने एआई एक्सपर्ट दिव्येंद्र सिंह जादौन से इस बारे में बात की.
एआई टूल की मदद से कैसे फ़र्ज़ी ऑडियो तैयार की जाती है?
हमने आर्टिफीसियल इंटेलिजेंस (डीप फेक) पर काम करने वाले एक्सपर्ट दिव्येंद्र सिंह जादौन को ये सारे एडिटेड वीडियो भेजे. वीडियो देखने के बाद उन्होंने बताया कि "ये सारे वीडियो एआई (AI) जनरेटेड वॉइस क्लोनिंग से तैयार किये गए हैं." उन्होंने हमें विस्तारपूर्वक बताया कि कैसे किसी भी व्यक्ति की फ़र्ज़ी आवाज़ तैयार की जा सकती है.
उन्होंने कहा "वॉइस क्लोनिंग करने के दो तरीके हैं. एक तो पहले से ट्रेन (तैयार) किये हुए वॉइस मॉडल्स हैं, जो ऑनलाइन उपलब्ध हैं. कुछ वेबसाइट हैं जिनपर ये उपलब्ध होते है, लेकिन ये ज्यादातर सेलिब्रिटीज के वॉइस मॉडल्स होते हैं जैसे बराक ओबामा, डोलैंड ट्रम्प, नरेंद्र मोदी आदि के. इनकी आवाज को आसानी से क्लोन किया जा सकता है".
दूसरा तरीका बताते हुए उन्होंने कहा,"जिसकी वॉइस हमें क्लोन करनी है.उसकी कोई वीडियो अथवा ऑडियो को डाउनलोड करके उसे क्लीन करना होता है. क्लीन करने से आशय है कि उसमें जो बैकग्राउंड नॉइज है उसे हटाना. इसके बाद हमें साइलेन्सेस (बात कहने के बीच में जो चुप्पी होती है) और बोलते हुए अटकने की आवाज (बबल) हटानी होती हैं. इसके बाद इस फाइल को एक बार में पूरा या कुछ हिस्सों में जिनमें वाक्यों का सेंस निकल रहा हो, में बांटकर फाइल तैयार कर लेते हैं."
आगे उन्होंने बताया कि " आज कल कई सारी ओपन सोर्स रिपॉजिटरीज हैं जैसे आरबीसी (रिट्रीवल बेस्ड वॉइस क्लोनिंग), एसबीसी (सिंगिंग बेस्ड वॉइस क्लोनिंग) आदि. इनकी मदद से आप वॉइस क्लोन कर सकते हैं. इनमें से किसी एक का इस्तेमाल करके जो हमारे पास क्लीन डाटा फाइल्स (वॉइस मॉडल्स ) हैं, उन्हें ट्रेन करना होता है. ट्रेनिंग में एआई की मदद से वॉइस में जो भी इनोटेशन, पिचिंग होती है उसे मिमिक कर लिया जाता है. पहले वॉइस मॉडल को क्लोनिंग के लिए काफ़ी ज्यादा ट्रेन करना पड़ता था. अब यह काम एक या दो दिन में हो जाता है. हालांकि अभी भी लिप सिंक करना इतना आसान नहीं है. इन सब वीडियो में वॉइस क्लोनिंग की गई है, किसी में भी लिप सिंक नहीं है."
आगे उन्होंने कहा, "वॉइस मॉडल की ट्रेनिंग के बाद दो विकल्प होते हैं 'टेक्स्ट टू स्पीच' और 'स्पीच टू स्पीच'. आपको फिर वॉइस क्लोन करने के लिए बस उस व्यक्ति के हलके से लहजे में टेक्स्ट को लिख कर अथवा स्पीच को रिकॉर्ड कर अपलोड करना होता है. लहजे से आशय है जैसे मोदी जी 'भाइयो और बहनों' अथवा 'मित्रों' जैसे शब्दों का इस्तेमाल खूब करते हैं. ऐसे ही चीजों को चिन्हित कर तैयार की हुई टेक्स्ट या स्पीच को अपलोड करने के बाद सिर्फ़ कुछ मिनटों में आपको आउटपुट मिल जाता है. फिर आप किसी भी वीडियो में एडिट कर इनका इस्तेमाल कर सकते हैं."
'टेक्स्ट टू स्पीच' के विकल्प से क्लोन करने पर हमारा नियंत्रण कम रहता है कि वह किस चीज को जोर देकर पढ़ेगा और पढ़ते हुए कहाँ, कितना रुकेगा. आपने जो भी वीडियो भेजे हैं ये सारे 'स्पीच टू स्पीच' प्रक्रिया से तैयार किये गए हैं. इनमें से किसी को भी 'टेक्स्ट टू स्पीच' प्रक्रिया से तैयार नहीं किया गया है. पूरी सम्भावना है कि सभी वीडियो आरबीसी (रिट्रीवल बेस्ड वॉइस क्लोनिंग) की मदद से तैयार किये गए हों.
पॉलिटिक्स में इसके उपयोग को लेकर दिव्येंद्र ने बताया कि "अब राजनीतिक दल इसका इस्तेमाल मतदातों तक निजी तौर पर पहुंचने के लिए कर रहे हैं. जैसे किसी चुनावी क्षेत्र में लाखों वोटर हैं तो हर वोटर के नाम से उन्हें पर्सनली कोई सन्देश पहुँचाने के लिए इसका इस्तेमाल होता है. जिससे मतदाताओं को नेता से ज्यादा अपनापन और लगाव महसूस हो. मैं राजस्थान में रहता हूँ तो यहां के जो राजनीतिक दल है उनमें से कुछ ने ऐसा करने के लिए मुझसे भी संपर्क किया. लोकसभा चुनाव को लेकर भी इसपर काम किया जा रहा है."
जब दिव्येंद्र से इसके प्रयोग और इस्तेमाल करने को लेकर क़ानूनी प्रावधानों के बारे में पूछा तो उन्होंने कहा कि " फ़िलहाल तो ऐसा कोई कानून द्वारा तय की गई प्रक्रिया नहीं है. भारत में इसको लेकर फ़िलहाल कोई प्रावधान नहीं है. जबकि यहां होना जरूरी है. अभी तो हम फिर भी इसको डिटेक्ट कर पा रहे हैं लेकिन आगे चलकर ये और बेहतर हो जाएगा तब बहुत मुश्किल होगी इसके दुरूपयोग को रोकने में. हालांकि पश्चिमी देशों में आर्टिफीसियल इंटेलिजेंस के प्रयोग लेकर गॉइडलाइन्स जारी की जा रही हैं.