OpenAI এর ভয়েস ইঞ্জিন 15-সেকেন্ডের নমুনা থেকে মানুষের ভয়েস ক্লোন করতে পারে GTW Tech

টেক্সট এবং ইমেজ তৈরির জন্য ওপেনএআই-এর অত্যাধুনিক মডেল রয়েছে এবং অতি সম্প্রতি, এটি সোরা, একটি অবিশ্বাস্য টেক্সট-টু-ভিডিও মডেলও চালু করেছে। এখন, কোম্পানি একটি ভয়েস ইঞ্জিন মডেল ঘোষণা করেছে যা একটি দিয়ে বক্তৃতা তৈরি করতে পারে একক 15-সেকেন্ডের অডিও নমুনা. এটি মূলত একটি টেক্সট-টু-অডিও মডেল যেখানে আপনি মডেলটিকে প্রশিক্ষণ দিতে একটি 15-সেকেন্ডের অডিও ফিড করেন এবং প্রাকৃতিক-শব্দযুক্ত বক্তৃতা তৈরি করতে আপনার পাঠ্য ইনপুট করেন।

OpenAI বলছে যে মডেলটি ছোট হলেও ভয়েস ইঞ্জিন তৈরি করতে পারে বাস্তববাদী এবং আবেগপূর্ণ কণ্ঠস্বর, মূল স্পিকারের খুব কাছাকাছি। কোম্পানির মতে, মডেলটি 2022 সালের শেষের দিকে তৈরি করা হয়েছিল এবং এটি ChatGPT ভয়েস চ্যাট বৈশিষ্ট্যকে শক্তিশালী করছে।

OpenAI প্রযুক্তির সাথে যুক্ত “গুরুতর ঝুঁকি” স্বীকার করে এবং “সিন্থেটিক ভয়েস অপব্যবহারের সম্ভাবনা” তাই কোম্পানি এই সময়ে জনসাধারণের কাছে মডেলটি প্রকাশ করছে না, পরিবর্তে, এটি ভয়েস সংশ্লেষণ এবং সমাজ কীভাবে এই নতুন ক্ষমতাগুলির সাথে খাপ খাইয়ে নিতে পারে সে সম্পর্কে একটি বক্তৃতা শুরু করার জন্য মডেলটির পূর্বরূপ দেখছে।

মডেলের জন্য, এটি একটি সূক্ষ্ম উচ্চারণ সহ বিভিন্ন ভাষায় বাস্তবসম্মত অডিও অনুবাদ করতে পারে। হেইজেন, একটি জনপ্রিয় AI ভিডিও এবং অডিও প্রজন্মের প্ল্যাটফর্ম, কাস্টম ভয়েস তৈরি করতে OpenAI এর ভয়েস ইঞ্জিন ব্যবহার করছে। এই স্থানটিতে, ElevenLabs তার নিজস্ব স্পিচ সংশ্লেষণ মডেল তৈরি করেছে যা ভয়েস ক্লোন করতে পারে এবং বহুভাষিক ভাষায় বক্তৃতা তৈরি করতে পারে।

প্রস্তাবিত প্রবন্ধ

OpenAI ব্লগ লিকস GPT-4.5 Turbo; স্পার্ক ইন্টারেস্ট

অর্জুন শা

13 মার্চ, 2024

GPT-5 2024 সালের গ্রীষ্মে মুক্তি পেতে পারে; GPT-4 এর চেয়ে ‘বস্তুগতভাবে ভাল’

অর্জুন শা

21 মার্চ, 2024

যদিও প্রযুক্তিটি বেশ শক্তিশালী, এটি প্রতারণামূলক হতে পারে এবং বিভিন্ন পরিস্থিতিতে ব্যবহারকারীদের ক্ষতি করতে পারে। ওপেনএআই তা স্বীকার করে ভয়েস-ভিত্তিক প্রমাণীকরণ ব্যাঙ্ক অ্যাকাউন্ট এবং অন্যান্য সংবেদনশীল তথ্য অ্যাক্সেস করার জন্য ব্যবহার করা হয়। কোম্পানি আশা করে যে এই ধরনের প্রমাণীকরণ সিস্টেম পর্যায়ক্রমে আউট করা হবে। তা ছাড়া, সোশ্যাল মিডিয়া লোকে তাদের পণ্য আপসেল করার জন্য জনপ্রিয় ভয়েস ক্লোন করে ভরা।

ভারতে, বিশেষ করে, AI ভয়েস ক্লোনিং কেলেঙ্কারী বাড়ছে সাইবার অপরাধীরা হয় বাচ্চাদের কণ্ঠস্বর ক্লোন করা বাবা-মাকে হুমকি দিয়ে টাকা আদায় করা। এই ধরনের পরিস্থিতিতে, ওপেনএআই মডেলটি ব্যাপকভাবে প্রকাশ করার জন্য ভাল অবস্থানে নেই। আমরা যখন এআই যুগের দিকে এগিয়ে যাচ্ছি, তখন সমাজ থেকে আরও সতর্কতা এবং স্থিতিস্থাপকতা প্রয়োজন।

OpenAI এর ভয়েস ক্লোনিং ইঞ্জিন সম্পর্কে আপনি কি মনে করেন? কোম্পানির কি জনসাধারণের কাছে মডেলটি প্রকাশ করা উচিত? আমাদের নীচের মন্তব্য আপনার চিন্তা জানি।

OpenAI এর ভয়েস ইঞ্জিন 15-সেকেন্ডের নমুনা থেকে মানুষের ভয়েস ক্লোন করতে পারে GTW Tech

প্রারম্ভিক ব্ল্যাক ফ্রাইডে ডিলে PS5 এবং Xbox সিরিজ X উভয়ের জন্যই Amazon-এ Madden NFL 25 হিট 50% ছাড় GTW Tech

কেন ওপেনএআই, গুগল এবং মাইক্রোসফ্ট স্মার্ট এআই এজেন্ট তৈরি করছে GTW Tech

আপনার ক্রোমবুকে কীভাবে ভাষা পরিবর্তন করবেন (2024) GTW Tech

Samsung Galaxy S25 সিরিজ সম্ভাব্য এই তারিখে লঞ্চ হতে পারে GTW Tech

Google এর ফ্যান-প্রিয় Pixel 5a এর চূড়ান্ত আপডেট পেয়েছে GTW Tech

ভোডাফোন আইডিয়া சத்தமில்லாமல் பார்த்த வேலை இந்த திட்டத்தின் GTW Tech

Leave A Reply Cancel Reply

OpenAI এর ভয়েস ইঞ্জিন 15-সেকেন্ডের নমুনা থেকে মানুষের ভয়েস ক্লোন করতে পারে GTW Tech

Related Posts

প্রারম্ভিক ব্ল্যাক ফ্রাইডে ডিলে PS5 এবং Xbox সিরিজ X উভয়ের জন্যই Amazon-এ Madden NFL 25 হিট 50% ছাড় GTW Tech

কেন ওপেনএআই, গুগল এবং মাইক্রোসফ্ট স্মার্ট এআই এজেন্ট তৈরি করছে GTW Tech

আপনার ক্রোমবুকে কীভাবে ভাষা পরিবর্তন করবেন (2024) GTW Tech

Samsung Galaxy S25 সিরিজ সম্ভাব্য এই তারিখে লঞ্চ হতে পারে GTW Tech

Google এর ফ্যান-প্রিয় Pixel 5a এর চূড়ান্ত আপডেট পেয়েছে GTW Tech

ভোডাফোন আইডিয়া சத்தமில்லாமல் பார்த்த வேலை இந்த திட்டத்தின் GTW Tech

Leave A Reply Cancel Reply