লাইভ ভিডিও কলে ডিপফেক ধরার ৫টি রিয়েল-টাইম পরীক্ষা

Tue Jun 02 2026

Dual-monitor setup showing scraped social media photos on the left and a 3D facial wireframe mesh on the right, illustrating AI deepfake data training.

আগে ভিডিও কলে কারও মুখ দেখলেই ধরে নেওয়া হতো, সত্যিই সেই মানুষটিই কথা বলছেন। মা, বস বা বন্ধুর ভিডিও কল এলে আমরা সাধারণত সন্দেহ করতাম না। কিন্তু এখন AI video call scam বেড়ে যাওয়ায় সেই ধারণা আর নিরাপদ নয়।

এখন প্রতারকরা রিয়েল-টাইম AI সফটওয়্যার ব্যবহার করে লাইভ কলের সময় নিজের মুখের ওপর অন্য কারও মুখ বসিয়ে দেয়। হংকং পুলিশের তথ্য অনুযায়ী, ২০২৪ সালে সেখানকার একজন ফাইন্যান্স কর্মী তার কোম্পানির CFO-এর ডিপফেক ভিডিও কল দেখে ২.৫ কোটি ডলার ট্রান্সফার করে বসেন। এসব টুল যত সহজলভ্য হচ্ছে, ভিডিও কল আসলে সত্যি কি না বুঝতে পারা এখন একটি মৌলিক নিরাপত্তা দক্ষতা।

শক্তিশালী হার্ডওয়্যার থাকলেও লাইভ ভিডিও প্রোসেসিংয়ে এসব AI টুল এখনও হোঁচট খায়। লাইভ কলের সময় সন্দেহজনক ডিপফেক চিহ্নিত করতে এখানে রয়েছে ৫টি সহজ পরীক্ষা।

লাইভ ভিডিও কল ডিপফেক কীভাবে কাজ করে?

একটি লাইভ ডিপফেক কল সাধারণত কয়েকটি ধাপের মাধ্যমে কাজ করে, যেখানে ডেটা সংগ্রহ, রিয়েল-টাইম রেন্ডারিং এবং হার্ডওয়্যারকে ভুল পথে পরিচালিত করা একসঙ্গে ঘটে।

1. ডেটা সংগ্রহ এবং টার্গেট ট্রেনিং

প্রতারক সোশ্যাল মিডিয়া থেকে টার্গেট ব্যক্তির (যেমন আত্মীয় বা কোম্পানির ম্যানেজার) পাবলিক ছবি ও ভিডিও ডাউনলোড করে। সেই ফাইলগুলো ব্যবহার করে AI-কে বিভিন্ন অ্যাঙ্গেল থেকে টার্গেটের মুখ চিনতে প্রশিক্ষণ দেয়। পাশাপাশি তারা ছোট ছোট ভয়েস ক্লিপও সংগ্রহ করে, যা পরে কলের সময় সেই ব্যক্তির কণ্ঠের ক্লোন তৈরি করতে ব্যবহার করা হয়।

2. রিয়েল-টাইম মুখ ও অভিব্যক্তি ট্র্যাকিং

কল চলাকালে প্রতারক নিজের ওয়েবক্যামের সামনে বসে। লাইভ AI সফটওয়্যার রিয়েল-টাইমে প্রতারকের মুখ ট্র্যাক করে, চোখ, নাক ও ঠোঁটের গুরুত্বপূর্ণ পয়েন্টগুলো ম্যাপ করে প্রতিটি চোখের পলক ও ঠোঁটের নড়াচড়া ক্যাপচার করে। একই সঙ্গে AI ভয়েসের টোন ও গতি সামঞ্জস্য করে টার্গেট ব্যক্তির স্বাভাবিক কথা বলার ধাঁচের সঙ্গে মিলিয়ে দেয়।

3. তাৎক্ষণিক AI Face Swapping (রেন্ডার)

প্রতারক কথা বলার সময় GPU রিয়েল-টাইমে ভিডিও প্রোসেস করে। AI অ্যালগরিদম তাৎক্ষণিকভাবে প্রতারকের মুখের অভিব্যক্তি ও ঠোঁটের নড়াচড়া নিয়ে তার ওপর টার্গেট ব্যক্তির মুখ বসিয়ে দেয়। এই “stitching” প্রক্রিয়াটি ফ্রেম বাই ফ্রেম হয়, সাধারণত সেকেন্ডে ৩০ ফ্রেম হারে, যাতে একটি ধারাবাহিক লাইভ ভিডিও মাস্ক তৈরি হয়।

4. ভার্চুয়াল ক্যামেরা দিয়ে রাউটিং

এই ভুয়া ভিডিওটি অ্যাপে পাঠাতে প্রতারক “Virtual Camera” ড্রাইভার ব্যবহার করে। এই সফটওয়্যার ফোন বা কম্পিউটারকে এমনভাবে বিভ্রান্ত করে যেন একটি আসল ওয়েবক্যাম চালু আছে, কিন্তু বাস্তবে এটি আপনার লাইভ কল স্ক্রিনে AI-তৈরি সেই নকল মুখই স্ট্রিম করে।

ভিডিও কল ডিপফেক ধরতে ৫টি রিয়েল-টাইম পরীক্ষা

1. ৯০-ডিগ্রি পাশে ঘুরে তাকাতে বলুন

বেশিরভাগ AI face-swapping সফটওয়্যার টার্গেটের মুখের পরিষ্কার ডেটার ওপর নির্ভর করে, যা সাধারণত পাবলিক ছবি ও সামনের দিকের ভিডিও থেকে সংগ্রহ করা হয়। অ্যালগরিদম চোখ, নাক, ঠোঁটের মতো মূল পয়েন্টগুলো ম্যাপ করে।

মাথা বেশি ঘোরালে এমন ভিজ্যুয়াল আর্টিফ্যাক্ট দেখা যেতে পারে, যা সরাসরি ক্যামেরার দিকে তাকিয়ে থাকলে বোঝা কঠিন। কলারের কাছে অনুরোধ করুন যেন একেবারে বাম বা ডান পাশে মুখ ঘুরিয়ে তাকায়। এই সময় মুখের প্রান্ত বিকৃতি, গালের চারপাশে অস্বাভাবিক টান, বা মুহূর্তের জন্য কোনো গ্লিচ হচ্ছে কি না লক্ষ্য করুন।

2. হাত দিয়ে মুখ ঢাকার পরীক্ষা

যদিও আধুনিক AI মডেল এখন মুখের আংশিক বাধা সামলাতে অনেক ভালো, হঠাৎ হাত নাড়াচাড়া এখনও কিছু রিয়েল-টাইম face-swapping সিস্টেমে ভিজ্যুয়াল অসামঞ্জস্য তৈরি করতে পারে। কলারকে বলুন দ্রুত হাত নেড়ে মুখের সামনে দিয়ে নিয়ে যেতে, অথবা একটি চোখ হাত দিয়ে ঢেকে রাখতে। এই সময় আঙুলের পাশে ঘোস্টিং, হালকা ব্লারিং বা অস্বাভাবিক কনটুর দেখা যায় কি না তা খেয়াল করুন।

3. আলো বদলের পরীক্ষা

কলার যদি স্মার্টফোন ব্যবহার করে, তাকে বলুন ফোনের ফ্ল্যাশলাইট অন করে মুখের দিকে ধরতে, অথবা জানালার পাশে গিয়ে দাঁড়াতে। বাস্তব ভিডিও কলে নাক ও চোয়ালের ছায়া আলো বদলালে সঙ্গে সঙ্গে বদলে যায়। যদি মুখের আলো আর ঘরের বাকি অংশের আলো সামঞ্জস্যপূর্ণ না মনে হয়, তবে বিষয়টি নিয়ে সন্দেহ করার যথেষ্ট কারণ রয়েছে।

4. চোখের পলক ও শারীরবৃত্তীয় সূক্ষ্মতা পর্যবেক্ষণ করুন

ব্যক্তি কতবার চোখের পলক ফেলছে এবং কোথায় তাকিয়ে আছে, খুব কাছ থেকে লক্ষ করুন। মাথা নাড়ানোর সঙ্গে সঙ্গে চোখ স্বাভাবিকভাবে সেই দিকে যাচ্ছে কি না দেখুন, আর চোয়াল, কান, হেয়ারলাইন ও গলা– এসব জায়গায় ব্লেন্ডিং-এর অসামঞ্জস্য বা “প্যাচ” তৈরি হচ্ছে কি না পরীক্ষা করুন।

5. অডিও ও ঠোঁটের সামঞ্জস্য মিলিয়ে দেখুন

লাইভ ভিডিও কলের জন্য প্রচুর ব্যান্ডউইথ লাগে, এর সঙ্গে AI face-swapping টুল যোগ হলে আরও একটি ডেটা প্রোসেসিং লেয়ার তৈরি হয়। এই বাড়তি প্রোসেসিং দেরি তৈরি করে।

কলারকে এমন প্রশ্ন করুন যেটার উত্তরে শুধু “হ্যাঁ” বা “না” বললেই হয় না, বরং একটু বিস্তারিত ব্যাখ্যা দরকার। খুব মনোযোগ দিয়ে তার ঠোঁটের নড়াচড়া দেখুন। ঠোঁটের গতি যদি বারবার শব্দের থেকে পিছিয়ে থাকে বা কথার সঙ্গে মিল না খায়, তাহলে সেই কল নিয়ে বাড়তি সতর্ক হওয়া দরকার।

কোনো একক পরীক্ষা ডিপফেক প্রমাণ করার জন্য যথেষ্ট নয়, কিন্তু একাধিক সংকেত একসঙ্গে দেখা গেলে অবশ্যই সন্দেহ বাড়ানো উচিত।

লাইভ ডিপফেক কেন রিয়েল-টাইমে ভেঙে পড়ে

video call deepfake detection বুঝতে হলে আগে বুঝতে হবে এই সিস্টেমগুলো কম্পিউটারের ওপর কী ধরনের চাপ তৈরি করে। লাইভ স্ট্রিমের সময় সফটওয়্যারকে প্রতারকের মুখ ক্যাপচার করতে হয়, সেটি ভুক্তভোগীর পরিচিত ব্যক্তির মুখে রূপান্তর করতে হয়, এবং সেকেন্ডে ৩০ ফ্রেম গতিতে আবার ভিডিও ফিডে রেন্ডার করে পাঠাতে হয়।

এখানে পরবর্তী এডিটিং বা “পোস্ট-প্রোডাকশন” করার কোনো সুযোগ থাকে না। আগে থেকে রেকর্ড করা ডিপফেক ভিডিওতে নির্মাতারা ফ্রেম বাই ফ্রেম কয়েক দিন ব্যয় করে গ্লিচ ঠিক করেন। কিন্তু লাইভ কলে সফটওয়্যারকে সব সিদ্ধান্ত তাৎক্ষণিকভাবে নিতে হয়। দুর্বল ইন্টারনেট কানেকশন, নেটওয়ার্ক জিটার আর প্যাকেট লস AI-এর জন্য নিখুঁত মাস্ক ধরে রাখা আরও কঠিন করে তোলে। এ কারণেই মাথা ঘোরানো বা হাত নাড়ার মতো ছোট ছোট শারীরিক পরীক্ষা সহজেই এই ভুয়া চেহারার ভেল্কি ভাঙতে পারে।

“১০-সেকেন্ড ডিসকনেক্ট” কৌশল

প্রতারকরা জানে, যত বেশি সময় লাইভ ডিপফেক চালু থাকে, গ্লিচ ধরা পড়ার ঝুঁকি তত বেড়ে যায়। তাই ধরা পড়ার ঝুঁকি কমাতে তারা ভিডিও কলের সঙ্গে দ্রুত ফলো-আপ টেক্সট মেসেজ মিলিয়ে ব্যবহার করে।

আপনার মেসেজিং অ্যাপে একটি ভিডিও কল আসে। আপনি রিসিভ করলেন এবং আপনার বন্ধুর মুখ দেখলেন। তিনি আতঙ্কিত দেখাচ্ছে এবং ক্লোন করা কণ্ঠে বললেন: “শুনো, আমার বড় সমস্যা হয়েছে, আমি একটু আগে—”

হঠাৎই কল কেটে যায়। আপনার কাছে এটি স্বাভাবিক নেটওয়ার্ক সমস্যার মতোই মনে হয়।

এক সেকেন্ডের মধ্যেই একই অ্যাকাউন্ট থেকে টেক্সট মেসেজ আসে: “এখানে সিগন্যাল খুব খারাপ। ফোনের ব্যাটারিও শেষ হয়ে যাচ্ছে। হাসপাতালে জরুরি ডিপোজিট দেওয়ার জন্য এখনই টাকার প্রয়োজন। দয়া করে এই অ্যাকাউন্টে টাকা পাঠাও।”

এইভাবে তারা “ড্রপড কল” অভিনয় করে রিয়েল-টাইমে AI ভিডিওর দুর্বলতা ধরা পড়া এড়িয়ে যায়। কোনো ভিডিও কল হঠাৎ কেটে যাওয়ার পরই যদি সঙ্গে সঙ্গে টাকা চাওয়া হয়, সেটাকে সন্দেহজনক ধরে নিন। কল কেটে দিয়ে সাধারণ সেলুলার লাইনে আবার ফোন করে সত্যতা যাচাই করুন।

আপনি যে ভিডিও কল অ্যাপ ব্যবহার করেন, তা কীভাবে নিরাপত্তায় প্রভাব ফেলে

আপনি কোন অ্যাপ ব্যবহার করছেন, সেটাও এসব প্রতারণা বোঝা কতটা সহজ হবে তাতে বড় ভূমিকা রাখে। কিছু মেসেজিং অ্যাপ সার্ভারের খরচ বাঁচাতে ভিডিও ডেটা খুব বেশি কমপ্রেস করে। অতিরিক্ত কমপ্রেশন ভিডিওকে ঝাপসা ও পিক্সেলেটেড করে দেয়। ব্যঙ্গাত্মকভাবে, এই ঝাপসা ইমেজই প্রতারকদের সুবিধা করে দেয়, কারণ কম রেজোলিউশন AI টুলের কারণে তৈরি ছোট পিক্সেল টিয়ার, ত্বকের টোনের অমিল আর ডিজিটাল আর্টিফ্যাক্ট আড়াল করে ফেলে।

এই কারণেই ভিডিওর স্বচ্ছতা গুরুত্বপূর্ণ। উদাহরণ হিসেবে imo-তে দুর্বল কানেকশন থাকলেও ভিডিও স্ট্রিম পরিষ্কার ও শার্প থাকে। ভিডিও গুণমান ভালো থাকলে ফাঁকা দৃষ্টি, অস্বাভাবিকভাবে শক্ত ঠোঁটের নড়াচড়া, বা মুখের প্রান্তের বিকৃতি— এসব ডিপফেক মাস্কের লক্ষণ সহজেই চোখে পড়ে। ডিপফেক শনাক্ত করা অনলাইনে নিরাপদ থাকার শুধু একটি অংশ; অপরিচিতদের সঙ্গে ভিডিও কলের নিরাপত্তা টিপস জানাও সমানভাবে গুরুত্বপূর্ণ।

FAQs

সাধারণত এসব ডিপফেক ভিডিও কল স্ক্যাম কী কাজে ব্যবহার করা হয়?

প্রায় সব ক্ষেত্রেই এগুলো আপনার অর্থ হাতিয়ে নেওয়ার জন্য ব্যবহার করা হয়, বিশেষ করে রোমান্স স্ক্যাম বা প্রেমের ফাঁদ (Romance Scams / “Pig Butchering”)-এর ক্ষেত্রে। প্রতারকরা আগে অনলাইনে আস্থা গড়ে তোলে, তারপর দ্রুত একটি ডিপফেক ভিডিও কল দিয়ে “প্রমাণ” করে যে তারা সত্যিকারের মানুষ, তারপরই নগদ অর্থ বা ক্রিপ্টো চায়। একই কৌশল ব্যবহার করে তারা আপনার বস বা আত্মীয় সেজে জরুরি wire transfer-এর দাবি করতেও পারে।

ডিপফেক কি সরাসরি মোবাইল ফোনে তৈরি করা যায়?

সাধারণ মানের কিছু face-swapping অ্যাপ ফোনে চলতে পারে, তবে এগুলোর গুণমান খুবই কম। উচ্চমানের প্রতারণা সাধারণত শক্তিশালী ডেস্কটপ কম্পিউটার প্রয়োজন করে, যাতে AI মাস্ক মসৃণভাবে রেন্ডার করা যায়। পরে ভার্চুয়াল ক্যামেরা সেটআপ ব্যবহার করে সেই ফিড মোবাইল অ্যাপে পাঠানো হয়।

কলের সময় ডিপফেক ধরার জন্য কি কোনো স্বয়ংক্রিয় টুল আছে?

নিরাপত্তা প্রতিষ্ঠানগুলো স্বয়ংক্রিয় ডিটেকশন টুল নিয়ে কাজ করছে, কিন্তু সেগুলো এখনও সাধারণ ভোক্তা-অ্যাপে ব্যাপকভাবে পাওয়া যাচ্ছে না। এই মুহূর্তে প্রোফাইল টার্নের মতো আচরণ-ভিত্তিক পরীক্ষার ওপর নির্ভর করাই এখনো আপনার সবচেয়ে কার্যকর উপায়।

Sources:

https://vsquare.org/when-your-clone-calls-how-ai-voice-fraud-became-a-billion-dollar-industry/

https://www.ncoa.org/article/understanding-deepfakes-what-older-adults-need-to-know/

https://seniors.hcsk.org/ai-powered-scams-targeting-seniors/ai-deepfake-video-scams-targeting-seniors/