টেক্সট এবং ইমেজ তৈরির জন্য ওপেনএআই-এর অত্যাধুনিক মডেল রয়েছে এবং অতি সম্প্রতি, এটি সোরা, একটি অবিশ্বাস্য টেক্সট-টু-ভিডিও মডেলও চালু করেছে। এখন, কোম্পানি একটি ভয়েস ইঞ্জিন মডেল ঘোষণা করেছে যা একটি দিয়ে বক্তৃতা তৈরি করতে পারে একক 15-সেকেন্ডের অডিও নমুনা. এটি মূলত একটি টেক্সট-টু-অডিও মডেল যেখানে আপনি মডেলটিকে প্রশিক্ষণ দিতে একটি 15-সেকেন্ডের অডিও ফিড করেন এবং প্রাকৃতিক-শব্দযুক্ত বক্তৃতা তৈরি করতে আপনার পাঠ্য ইনপুট করেন।
OpenAI বলছে যে মডেলটি ছোট হলেও ভয়েস ইঞ্জিন তৈরি করতে পারে বাস্তববাদী এবং আবেগপূর্ণ কণ্ঠস্বর, মূল স্পিকারের খুব কাছাকাছি। কোম্পানির মতে, মডেলটি 2022 সালের শেষের দিকে তৈরি করা হয়েছিল এবং এটি ChatGPT ভয়েস চ্যাট বৈশিষ্ট্যকে শক্তিশালী করছে।
OpenAI প্রযুক্তির সাথে যুক্ত “গুরুতর ঝুঁকি” স্বীকার করে এবং “সিন্থেটিক ভয়েস অপব্যবহারের সম্ভাবনা” তাই কোম্পানি এই সময়ে জনসাধারণের কাছে মডেলটি প্রকাশ করছে না, পরিবর্তে, এটি ভয়েস সংশ্লেষণ এবং সমাজ কীভাবে এই নতুন ক্ষমতাগুলির সাথে খাপ খাইয়ে নিতে পারে সে সম্পর্কে একটি বক্তৃতা শুরু করার জন্য মডেলটির পূর্বরূপ দেখছে।
মডেলের জন্য, এটি একটি সূক্ষ্ম উচ্চারণ সহ বিভিন্ন ভাষায় বাস্তবসম্মত অডিও অনুবাদ করতে পারে। হেইজেন, একটি জনপ্রিয় AI ভিডিও এবং অডিও প্রজন্মের প্ল্যাটফর্ম, কাস্টম ভয়েস তৈরি করতে OpenAI এর ভয়েস ইঞ্জিন ব্যবহার করছে। এই স্থানটিতে, ElevenLabs তার নিজস্ব স্পিচ সংশ্লেষণ মডেল তৈরি করেছে যা ভয়েস ক্লোন করতে পারে এবং বহুভাষিক ভাষায় বক্তৃতা তৈরি করতে পারে।
প্রস্তাবিত প্রবন্ধ
OpenAI ব্লগ লিকস GPT-4.5 Turbo; স্পার্ক ইন্টারেস্ট
অর্জুন শা
13 মার্চ, 2024
GPT-5 2024 সালের গ্রীষ্মে মুক্তি পেতে পারে; GPT-4 এর চেয়ে ‘বস্তুগতভাবে ভাল’
অর্জুন শা
21 মার্চ, 2024
যদিও প্রযুক্তিটি বেশ শক্তিশালী, এটি প্রতারণামূলক হতে পারে এবং বিভিন্ন পরিস্থিতিতে ব্যবহারকারীদের ক্ষতি করতে পারে। ওপেনএআই তা স্বীকার করে ভয়েস-ভিত্তিক প্রমাণীকরণ ব্যাঙ্ক অ্যাকাউন্ট এবং অন্যান্য সংবেদনশীল তথ্য অ্যাক্সেস করার জন্য ব্যবহার করা হয়। কোম্পানি আশা করে যে এই ধরনের প্রমাণীকরণ সিস্টেম পর্যায়ক্রমে আউট করা হবে। তা ছাড়া, সোশ্যাল মিডিয়া লোকে তাদের পণ্য আপসেল করার জন্য জনপ্রিয় ভয়েস ক্লোন করে ভরা।
ভারতে, বিশেষ করে, AI ভয়েস ক্লোনিং কেলেঙ্কারী বাড়ছে সাইবার অপরাধীরা হয় বাচ্চাদের কণ্ঠস্বর ক্লোন করা বাবা-মাকে হুমকি দিয়ে টাকা আদায় করা। এই ধরনের পরিস্থিতিতে, ওপেনএআই মডেলটি ব্যাপকভাবে প্রকাশ করার জন্য ভাল অবস্থানে নেই। আমরা যখন এআই যুগের দিকে এগিয়ে যাচ্ছি, তখন সমাজ থেকে আরও সতর্কতা এবং স্থিতিস্থাপকতা প্রয়োজন।
OpenAI এর ভয়েস ক্লোনিং ইঞ্জিন সম্পর্কে আপনি কি মনে করেন? কোম্পানির কি জনসাধারণের কাছে মডেলটি প্রকাশ করা উচিত? আমাদের নীচের মন্তব্য আপনার চিন্তা জানি।