
वीडियो कॉल पर किसी का चेहरा दिखाई देना पहले इस बात का पक्का सबूत माना जाता था कि आप वाकई उसी व्यक्ति से बात कर रहे हैं। अगर आपकी माँ, बॉस या कोई दोस्त आपको वीडियो कॉल करते थे, तो आप शायद दो बार नहीं सोचते थे। लेकिन AI video call scam के बढ़ते मामलों के साथ अब यह मान लेना सुरक्षित नहीं रहा।
अब स्कैमर्स रियल‑टाइम AI सॉफ़्टवेयर का इस्तेमाल करके लाइव कॉल के दौरान अपने चेहरे पर किसी दूसरे व्यक्ति का चेहरा चढ़ा देते हैं। हांगकांग पुलिस के अनुसार, 2024 में वहाँ के एक फाइनेंस कर्मचारी ने अपनी कंपनी के CFO के डीपफेक वाली वीडियो कॉल के बाद 25 मिलियन डॉलर ट्रांसफ़र कर दिए। जैसे‑जैसे ये टूल्स आसानी से उपलब्ध हो रहे हैं, यह पहचान पाना कि वीडियो कॉल असली है या नहीं, एक बुनियादी सुरक्षा कौशल बन गया है।
मजबूत हार्डवेयर होने के बावजूद ये AI टूल्स अभी भी लाइव वीडियो प्रोसेसिंग में संघर्ष करते हैं। यहां 5 आसान टेस्ट दिए गए हैं, जिन्हें आप लाइव कॉल के दौरान इस्तेमाल कर सकते हैं ताकि संभावित डीपफेक को पहचान सकें।
लाइव Video Call Deepfake कैसे काम करता है?
एक लाइव डीपफेक कॉल आम तौर पर कुछ चरणों के ज़रिए काम करती है, जिनमें डेटा जुटाना, रियल‑टाइम रेंडरिंग और हार्डवेयर के साथ धोखाधड़ी शामिल होती है।
1. डेटा कलेक्शन और टारगेट ट्रेनिंग
स्कैमर सोशल मीडिया से टारगेट (जैसे किसी रिश्तेदार या कंपनी के मैनेजर) की फोटोज़ या वीडियो डाउनलोड करते हैं। वे इन फ़ाइलों का उपयोग AI को अलग‑अलग एंगल से टारगेट के चेहरे को पहचानना सिखाने के लिए करते हैं। वे छोटे वॉइस क्लिप भी इकट्ठा करते हैं, जिनका उपयोग बाद में कॉल के दौरान उस व्यक्ति की आवाज़ का क्लोन तैयार करने के लिए किया जाता है।
2. रियल‑टाइम फेस और एक्सप्रेशन ट्रैकिंग
कॉल के दौरान स्कैमर अपने ही वेबकैम के सामने बैठता है। लाइव AI सॉफ़्टवेयर स्कैमर के चेहरे को रियल टाइम में ट्रैक करता है और आँखों, नाक और होंठों पर की‑पॉइंट्स मैप करके हर पलक झपकाने और होंठों की हरकत को कैप्चर करता है। इसी समय AI आवाज़ के टोन और बोलने की स्पीड को भी रियल‑टाइम में एडजस्ट करके टारगेट की बोलने की शैली से मेल कराने की कोशिश करता है।
3. इंस्टेंट AI फेस स्वैपिंग (रेंडरिंग)
जैसे ही स्कैमर बोलता है, GPU रियल‑टाइम में वीडियो को प्रोसेस करता है। AI एल्गोरिद्म तुरंत स्कैमर के चेहरे के भाव और होंठों की हरकत को लेता है और उनके ऊपर टारगेट व्यक्ति का चेहरा ओवरले कर देता है। यह "स्टिचिंग" प्रक्रिया फ़्रेम दर फ़्रेम होती है, आम तौर पर 30 फ्रेम प्रति सेकंड पर, ताकि एक लगातार चलता हुआ लाइव वीडियो मास्क बनाया जा सके।
4. वर्चुअल कैमरा के ज़रिए रूटिंग
इस नकली वीडियो को ऐप्स तक पहुँचाने के लिए स्कैमर "Virtual Camera" ड्राइवर का उपयोग करता है। यह सॉफ़्टवेयर फ़ोन या कंप्यूटर को यह सोचने पर मजबूर कर देता है कि एक असली वेबकैम चल रहा है, जबकि वास्तव में यह AI से जनरेट किया गया नकली चेहरा ही आपकी लाइव कॉल स्क्रीन पर स्ट्रीम कर रहा होता है।
Video Call Deepfake Detection के लिए 5 रियल‑टाइम टेस्ट
1. 90‑डिग्री साइड प्रोफाइल टर्न के लिए कहें
अधिकांश AI फेस‑स्वैपिंग सॉफ़्टवेयर टारगेट के चेहरे के साफ़ डेटा पर निर्भर करते हैं, जो आम तौर पर सोशल मीडिया की फोटोज़ और फ्रंट‑फेसिंग वीडियो से मिलता है। एल्गोरिद्म आँखों, नाक और होंठ जैसे की‑पॉइंट्स को मैप करता है।
सिर की बड़ी और तेज़ मूवमेंट्स ऐसे विज़ुअल आर्टिफ़ैक्ट्स को उजागर कर सकती हैं, जिन्हें सीधा कैमरे की ओर देखते समय नोटिस करना मुश्किल होता है। कॉलर से कहें कि वे अपना सिर पूरी तरह बायीं या दायीं ओर घुमाएँ। इस दौरान चेहरे के किनारों पर विकृति, गालों के आसपास खिंचाव या मूवमेंट के समय आने वाली हल्की गड़बड़ियों पर नज़र रखें।

2. हैंड ऑब्स्ट्रक्शन टेस्ट
भले ही आधुनिक AI मॉडल्स अब चेहरे पर आने वाली रुकावटों को बेहतर तरीके से संभालते हों, अचानक होने वाली तेज़ हाथों की मूवमेंट अभी भी कुछ रियल‑टाइम फेस‑स्वैपिंग सिस्टम में विज़ुअल असंगतियां पैदा कर सकती है। कॉलर से कहें कि वे अपना हाथ चेहरे के सामने तेज़ी से लहराएँ या एक आँख पूरी तरह ढक लें। तेज़ मूवमेंट के दौरान उंगलियों के आसपास घोस्टिंग, हल्का धुंधलापन या किनारों का अप्राकृतिक दिखना देखें।
3. लाइटिंग शिफ्ट टेस्ट
अगर कॉलर स्मार्टफोन इस्तेमाल कर रहा है, तो उससे कहें कि वह फ़ोन की फ्लैशलाइट ऑन करके उसे चेहरे की ओर घुमाए, या फिर खिड़की के पास चले जाने को कहें। असली कॉल में रोशनी बदलते ही नाक और जबड़े की लाइन पर पड़ने वाली परछाइयाँ तुरंत बदल जाती हैं। अगर चेहरे पर पड़ती रोशनी कमरे की बाकी लाइटिंग से मेल नहीं खाती, तो यह बात ध्यान देने लायक है।
4. पलक झपकने और शारीरिक असंगतियों पर नज़र रखें
ध्यान से देखें कि सामने वाला व्यक्ति कितनी बार पलक झपकता है और उसकी नज़र किस दिशा में है। यह भी देखें कि आँखें सिर के मूवमेंट के साथ स्वाभाविक रूप से ट्रैक कर रही हैं या नहीं, और जबड़े की लाइन, कान, हेयरलाइन और गले के आसपास ऐसे स्थानों पर ध्यान दें जहां ब्लेंडिंग में गड़बड़ी दिख सकती है।
5. ऑडियो‑टू‑लिप सिंक्रोनाइज़ेशन जांचें
लाइव वीडियो कॉल्स में पहले ही बहुत अधिक बैंडविड्थ लगती है, और उस पर AI फेस‑स्वैपिंग टूल जोड़ने से प्रोसेसिंग का एक अतिरिक्त लेयर आ जाता है। यह अतिरिक्त प्रोसेसिंग अक्सर देरी पैदा करती है।
कॉलर से ऐसा सवाल पूछें जिसका जवाब विस्तार से देना पड़े, न कि केवल "हाँ" या "नहीं" में। उनके मुंह को ध्यान से देखें। अगर होंठ आवाज़ से लगातार पीछे चल रहे हों या बोले जा रहे शब्दों से मेल न खाते हों, तो उस कॉल को और बारीकी से जांचने की ज़रूरत है।
कोई भी एक टेस्ट डीपफेक को पूरी तरह साबित नहीं कर सकता, लेकिन अगर कई संकेत एक साथ दिखें, तो उन्हें गंभीर तौर पर संदेह का कारण मानें।
रियल‑टाइम में Live Deepfakes क्यों फेल हो जाते हैं
Video call deepfake detection को समझने के लिए यह समझना ज़रूरी है कि ये सिस्टम कंप्यूटर पर कितना दबाव डालते हैं। लाइव स्ट्रीम के दौरान सॉफ़्टवेयर को स्कैमर के चेहरे को कैप्चर करना, उसे पीड़ित के जान‑पहचान वाले के चेहरे जैसा बनाना, और फिर उसे 30 फ्रेम प्रति सेकंड की स्पीड पर वापस वीडियो फ़ीड में रेंडर करना होता है।
इस प्रक्रिया में पोस्ट‑प्रोडक्शन एडिटिंग के लिए कोई गुंजाइश नहीं होती। पहले से रिकॉर्ड किए गए डीपफेक वीडियो में क्रिएटर्स फ्रेम‑दर‑फ्रेम glitches को सुधारने में कई दिन लगा सकते हैं। लेकिन लाइव कॉल में सॉफ़्टवेयर को तुरंत अनुमान लगाना पड़ता है। खराब इंटरनेट कनेक्शन, नेटवर्क जिटर और पैकेट लॉस जैसी समस्याएं AI के लिए परफेक्ट मास्क बनाए रखना और भी मुश्किल कर देती हैं। यही वजह है कि सिर घुमाने या हाथ हिलाने जैसे छोटे‑छोटे शारीरिक टेस्ट भी इस भ्रम को तोड़ देते हैं।
"10‑सेकंड डिसकनेक्ट" ट्रिक
स्कैमर्स जानते हैं कि जितनी देर तक लाइव डीपफेक चलेगा, उसके glitch होने की संभावना उतनी ही बढ़ जाएगी। पकड़े जाने के जोखिम को घटाने के लिए वे अक्सर वीडियो कॉल के साथ‑साथ टेक्स्ट मैसेज का संयोजन करते हैं।
मान लीजिए आपको किसी मैसेजिंग ऐप पर वीडियो कॉल आती है। आप कॉल रिसीव करते हैं और आपको अपने दोस्त का चेहरा दिखाई देता है। वे घबराए हुए लगते हैं और क्लोन की गई आवाज़ में कहते हैं: "अरे, मैं मुसीबत में हूँ, अभी‑अभी मेरा एक—"
और फिर कॉल अचानक कट जाती है। आपको यह एक आम नेटवर्क ड्रॉप जैसा लगता है।
एक सेकंड बाद, उसी अकाउंट से संदेश आता है: "यहाँ सिग्नल बहुत कमजोर है। मेरी बैटरी भी खत्म होने वाली है। मुझे तुरंत हॉस्पिटल डिपॉज़िट के लिए इमरजेंसी कैश चाहिए। कृपया इस अकाउंट में तुरंत पैसे ट्रांसफ़र करें।"
कॉल को जानबूझकर ड्रॉप करके वे रियल‑टाइम में AI वीडियो की कमजोरियों को एक्सपोज़ होने से बचाते हैं। अगर कोई वीडियो कॉल कटने के तुरंत बाद पैसों की मांग वाला मैसेज आए, तो उसे संदिग्ध मानें। कॉल काटें और उन्हें सामान्य मोबाइल/सेलुलर लाइन पर वापस कॉल करके सत्यापित करें।
आपका Video Call App आपकी सुरक्षा को कैसे प्रभावित करता है
आप कौन सा ऐप इस्तेमाल करते हैं, यह भी तय करता है कि इन स्कैम्स को पहचानना आपके लिए कितना आसान होगा। कुछ मैसेजिंग ऐप्स सर्वर कॉस्ट बचाने के लिए वीडियो डेटा को बहुत ज़्यादा कंप्रेस कर देते हैं। हाई वीडियो कंप्रेशन से इमेज धुंधली और पिक्सेलटेड हो जाती है। विडंबना यह है कि यह धुंधलापन स्कैमर्स के पक्ष में काम करता है, क्योंकि कम रेजोल्यूशन AI टूल्स के कारण होने वाली छोटी पिक्सेल फटने, असमान स्किन टोन्स और डिजिटल आर्टिफ़ैक्ट्स को छिपा देता है।
इसीलिए वीडियो की स्पष्टता मायने रखती है। उदाहरण के लिए, imo पर, कमजोर कनेक्शन होने पर भी वीडियो स्ट्रीम साफ़ और शार्प रहती है। जब वीडियो क्वालिटी स्पष्ट रहती है, तो आप आसानी से खाली‑सी नज़र, कठोर होंठों की हरकत या किनारों पर होने वाली डिस्टॉर्शन जैसी बातें पकड़ सकते हैं, जो डीपफेक मास्क की पोल खोलती हैं। डीपफेक की पहचान करना ऑनलाइन सुरक्षित रहने का केवल एक हिस्सा है; अजनबियों के साथ वीडियो कॉल के लिए सुरक्षा टिप्स जानना भी उतना ही महत्वपूर्ण है।
FAQs
ये deepfake video call scams आमतौर पर किस लिए इस्तेमाल किए जाते हैं?
इनका मुख्य उद्देश्य आपका पैसा चुराना होता है, खासकर romance scams (या "pig butchering") में। स्कैमर्स पहले ऑनलाइन भरोसा बनाते हैं और फिर नकली डीपफेक वीडियो कॉल करके यह "साबित" करते हैं कि वे असली व्यक्ति हैं, उसके बाद वे कैश या क्रिप्टो की मांग करते हैं। वे इसी तरकीब से आपके बॉस या किसी रिश्तेदार का रूप धरकर भी इमरजेंसी वायर ट्रांसफ़र मांग सकते हैं।
क्या deepfakes सीधे मोबाइल फोन पर बनाए जा सकते हैं?
बेसिक फेस‑स्वैपिंग ऐप्स मोबाइल पर चल सकते हैं, लेकिन उनकी क्वालिटी बहुत कमज़ोर होती है। हाई‑एंड स्कैम्स के लिए आम तौर पर एक शक्तिशाली डेस्कटॉप कंप्यूटर की ज़रूरत होती है ताकि AI मास्क को स्मूथ तरीके से रेंडर किया जा सके, और फिर वर्चुअल कैमरा सेटअप के ज़रिए उसे मोबाइल ऐप्स में फ़ीड किया जाता है।
क्या कॉल के दौरान deepfakes पहचानने के लिए ऑटोमेटेड टूल्स मौजूद हैं?
सिक्योरिटी कंपनियां ऑटोमैटिक डिटेक्शन टूल्स पर काम कर रही हैं, लेकिन वे अभी तक आम उपभोक्ताओं के लिए उपलब्ध ऐप्स में व्यापक रूप से शामिल नहीं हुए हैं। फिलहाल, प्रोफाइल टर्न जैसे व्यवहार‑आधारित टेस्ट पर भरोसा करना अब भी सबसे प्रभावी विकल्प है।
Sources:
https://vsquare.org/when-your-clone-calls-how-ai-voice-fraud-became-a-billion-dollar-industry/
https://www.ncoa.org/article/understanding-deepfakes-what-older-adults-need-to-know/