কয়েক মাস বিলম্বের পর, ওপেনএআই অবশেষে গত সপ্তাহে সমস্ত প্রদত্ত গ্রাহকদের জন্য ChatGPT অ্যাডভান্সড ভয়েস চালু করেছে। এটি স্বাভাবিক কথোপকথনের প্রতিশ্রুতি দেয় বাধাগুলির জন্য সমর্থনের সাথে, ঠিক যেমন জেমিনি লাইভ, এবং আমরা সবাই জানি যে মিথুনের সাথে আমার অভিজ্ঞতা কেমন ছিল। যাইহোক, ChatGPT এর সাথে পার্থক্য হল অ্যাডভান্সড ভয়েস মোড অফার করে নেটিভ অডিও ইনপুট এবং আউটপুট. তাই, আমি ওপেনএআই-এর নতুন অ্যাডভান্সড ভয়েস মোডটি ভালভাবে পরীক্ষা করে দেখেছি যে এটি সত্যই হাইপ অনুযায়ী চলে কিনা।
প্রাকৃতিক কথোপকথন
চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোড কতটা স্বাভাবিক এবং মুক্ত-প্রবাহিত তা দিয়ে শুরু করা যাক। প্রথমত, আপনি পাবেন নয়টি ভিন্ন কণ্ঠ থেকে বেছে নেওয়ার জন্য, এবং তাদের সকলেরই সেই সহায়ক এবং উত্সাহী ভাব রয়েছে। আপনার কাছে আরবার এবং ভ্যাল রয়েছে যা ব্রিটিশ উচ্চারণ অফার করে, যা আমি খুব পছন্দ করি। ওপেনএআই হার মুভি থেকে স্কারলেট জোহানসনের কণ্ঠের সাথে সাদৃশ্যপূর্ণ অত্যধিক চ্যাটি ‘স্কাই’ ভয়েস সরিয়ে দিয়েছে। এখানে সমস্ত উপলব্ধ ভয়েস আছে:
- Arbor – সহজগামী এবং বহুমুখী
- হাওয়া – অ্যানিমেটেড এবং আন্তরিক
- কভ – রচিত এবং সরাসরি
- Ember – আত্মবিশ্বাসী এবং আশাবাদী
- জুনিপার – খোলা এবং উত্সাহী
- ম্যাপেল – প্রফুল্ল এবং অকপট
- সল – বুদ্ধিমান এবং শিথিল
- স্প্রুস – শান্ত এবং নিশ্চিত
- ভেল – উজ্জ্বল এবং অনুসন্ধানী
এবং হ্যাঁ, বিজ্ঞাপন হিসাবে, ChatGPT অ্যাডভান্সড ভয়েস মোড বাধা সমর্থন করে জেমিনি লাইভের মতো, এবং আপনি যদি মাঝপথে কথা বলা শুরু করেন তবে এটি স্বয়ংক্রিয়ভাবে তার প্রতিক্রিয়া বন্ধ করে দেয়।
আমি ChatGPT Advanced Voice কে ওপেনএআই-এর সাম্প্রতিক সিদ্ধান্ত নিয়ে কোম্পানিটিকে লাভজনক কর্পোরেশন করার বিষয়ে জিজ্ঞাসা করার চেষ্টা করেছি, কিন্তু এটি উন্নয়ন সম্পর্কে জানত না। এটি সর্বশেষ তথ্য এবং তার খুঁজে পেতে ইন্টারনেট অ্যাক্সেস করতে পারে না জ্ঞান কাটার তারিখ হল অক্টোবর 2023GPT-4o এর মতই।
এই ক্ষেত্রে, জেমিনি লাইভ আরও ভাল কারণ এটি ওয়েব ব্রাউজ করতে এবং যেকোনো বিষয়ে সাম্প্রতিক তথ্য খুঁজে পেতে পারে। আমি এর অস্তিত্ব এবং চ্যাটবট কিছু অনুভব করে কিনা সে সম্পর্কে গভীর-ডুইভ কথোপকথন করার চেষ্টা করেছি, কিন্তু চ্যাটজিপিটি অ্যাডভান্সড ভয়েস ধারাবাহিকভাবে এটি নিয়ে আলোচনা করা এড়িয়ে গেছে।
ChatGPT অ্যাডভান্সড ভয়েস মোডের সাথে আমি যা উল্লেখযোগ্যভাবে ভাল পেয়েছি তা হল এটা প্রসঙ্গ মনে সত্যিই ভালকিছু মিথুন লাইভ সহজেই ভুলে যায়। একই ভয়েস সেশনে, যদি আমি আগে কোনো বিষয় নিয়ে আলোচনা করতাম, তাহলে তা মনে রাখত এবং প্রসঙ্গটি মাথায় রেখে দ্রুত প্রতিক্রিয়া তৈরি করত। আমার প্রতিবার প্রসঙ্গ দেওয়ার দরকার নেই, যা সহায়ক।
তাছাড়া, ChatGPT অ্যাডভান্সড ভয়েস কাস্টম নির্দেশাবলী সমর্থন করে যেখানে আপনি কে, আপনি কোথায় থাকেন, আপনি কী ধরনের প্রতিক্রিয়া পছন্দ করেন এবং আরও অনেক কিছু সেট করতে পারেন। মূলত, আপনি আপনার সমস্ত বিবরণ যোগ করতে পারেন যাতে ChatGPT অ্যাডভান্সড ভয়েস মোড একটি ব্যক্তিগতকৃত প্রতিক্রিয়া তৈরি করতে পারে। সামগ্রিকভাবে, দ্বি-মুখী প্রাকৃতিক মিথস্ক্রিয়া পরিপ্রেক্ষিতে, ChatGPT অ্যাডভান্সড ভয়েস সত্যিই ভাল।
সম্পর্কিত নিবন্ধ
OpenAI এর ChatGPT o1 মডেল সম্পর্কে আপনার 6টি জিনিস জানা উচিত
অর্জুন শা
17 সেপ্টেম্বর, 2024
এই মুহূর্তে নতুন ChatGPT o1 মডেলটি কীভাবে ব্যবহার করবেন
অর্জুন শা
১৩ সেপ্টেম্বর, ২০২৪
সাক্ষাত্কার অনুশীলন করুন
মে মাসে GPT-4o লঞ্চের সময়, OpenAI দেখিয়েছে যে ChatGPT অ্যাডভান্সড ভয়েস মোড ব্যবহারকারীদের ইন্টারভিউয়ের জন্য প্রস্তুত করার ক্ষেত্রে চমৎকার। যদিও এটিতে এখনও ক্যামেরা সমর্থন নেই, তবুও আপনি ChatGPT অ্যাডভান্সড ভয়েসকে একজন ইন্টারভিউয়ারের মতো কাজ করতে এবং আসন্ন কাজের জন্য প্রস্তুত করতে বলতে পারেন।

আমি এটিকে একটি প্রযুক্তি সাংবাদিক হিসাবে একটি কাজের জন্য আমাকে প্রস্তুত করতে বলেছিলাম এবং এটি আমাকে দক্ষতার একটি তালিকা দিয়েছে যা আমার জানা উচিত৷ আরও, চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোড আমাকে প্রযুক্তি সম্পর্কিত বেশ কয়েকটি প্রশ্ন জিজ্ঞাসা করেছে এবং আমাকে শক্তি এবং ক্ষেত্রগুলি দিয়েছে যেখানে আমি উন্নতি করতে পারি। কথোপকথনের সময়, আমি এটি অনুভব করতে শুরু করি একজন জ্ঞানী আমার সাক্ষাৎকার নিচ্ছিলেন এবং চ্যালেঞ্জিং প্রশ্ন দিয়ে আমার পায়ের আঙ্গুলের উপর রাখা.
গল্প আবৃত্তি
চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোডের প্রতিশ্রুতিশীল বৈশিষ্ট্যগুলির মধ্যে একটি হল এটি একটি নাটকীয় ভয়েসের সাথে গল্প আবৃত্তি করতে পারে এবং বিভিন্ন শৈলীতে স্বর যোগ করতে পারে। আমি এটিকে আমার (কাল্পনিক) বাচ্চার জন্য নাটকীয়ভাবে একটি গল্প আবৃত্তি করতে বলেছিলাম এবং এটি হয়েছিল। জিনিসগুলিকে মজাদার করার জন্য, আমি ChatGPT অ্যাডভান্সড ভয়েস মোডকে ফিসফিস, হাসি এবং গর্জন যোগ করে এটিকে আরও আকর্ষক করতে বলেছি।
জেমিনি লাইভের তুলনায়, চ্যাটজিপিটি এর মধ্যে মানুষের অভিব্যক্তি যোগ করার জন্য একটি দুর্দান্ত কাজ করেছে। এটা হাঁসফাঁস এবং আনন্দিতগল্পের ইচ্ছামতো। বিভিন্ন অক্ষর অনুমান করার জন্য, ChatGPT অ্যাডভান্সড ভয়েস চিত্তাকর্ষক।
আমি মনে করি এটি আরও অনেক কিছু করতে পারে, কিন্তু বর্তমানে, ওপেনএআই অভিজ্ঞতাকে গোলমাল করেছে বলে মনে হচ্ছে। আমরা ডেমোতে যা দেখেছি তার মতো নাটকীয় নয়।
সম্পর্কিত নিবন্ধ
জেমিনি লাইভ বিনামূল্যে সমস্ত অ্যান্ড্রয়েড ব্যবহারকারীদের জন্য রোল আউট করছে; এটি কীভাবে ব্যবহার করবেন তা এখানে
অর্জুন শা
১৩ সেপ্টেম্বর, ২০২৪
মেটা এআই একটি বিশাল আপগ্রেড পায়; ভয়েস চ্যাট এবং এআই ফটো এডিটিং এখানে
অর্জুন শা
25 সেপ্টেম্বর, 2024
আমাকে একটি লুলাবি গাও
যখন আমি মে মাসে ChatGPT অ্যাডভান্সড ভয়েস মোডের ডেমো দেখেছিলাম, যেখানে এটি গান গাইতে পারে, আমি এটি পরীক্ষা করার জন্য উত্তেজিত হয়েছিলাম। তাই আমি এটিকে আমাকে একটি লুলাবি গাইতে বলেছিলাম, কিন্তু আমার আশ্চর্যের জন্য, এটি তা করতে অস্বীকার করেছিল। এআই চ্যাটবট সহজভাবে বলেছে, “আমি গান গাইতে পারি না বা গুনগুন করতে পারি না।” মনে হচ্ছে ওপেনএআই আমার কাছে অস্পষ্ট কারণে চ্যাটজিপিটি অ্যাডভান্সড ভয়েসের ক্ষমতা মারাত্মকভাবে হ্রাস করেছে।
আরও, আমি এটিকে একটি অপেরা বা একটি ছড়া গাইতে বলেছিলাম, যার আমি একটি কুরুচিপূর্ণ উত্তর পেয়েছি, “আমি সঙ্গীত তৈরি করতে পারি না।” মনে হচ্ছে ওপেনএআই কপিরাইট সমস্যার কারণে গান গাওয়ার ক্ষমতা সীমিত করছে। এইভাবে, আপনি যদি আশা করেন যে ChatGPT আপনার সন্তানকে একটি ব্যক্তিগতকৃত লুলাবিতে ঘুমাতে সাহায্য করবে, ঠিক আছে, এটি এখনও সম্ভব নয়।
দ্রুত সংখ্যা গণনা
এটি একটি আকর্ষণীয় এবং মজার পরীক্ষা কারণ এটি সত্যই মাল্টিমডাল GPT-4o ভয়েস মোডকে এর গতিতে রাখে। আমি চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোডকে 1 থেকে 50 পর্যন্ত খুব দ্রুত সংখ্যা গণনা করতে বলেছি এবং এটি তাই করেছে। মাঝপথে, আমি “দ্রুত” যোগ করেছি এবং এটি আরও দ্রুত হয়ে গেছে। তারপর, আমি ChatGPT কে ধীরগতিতে যেতে বলেছিলাম এবং, ভাল, এটি আমার নির্দেশাবলী বেশ ভালভাবে অনুসরণ করেছে।
এই পরীক্ষায়, জেমিনি লাইভ ব্যর্থ হয় কারণ এটি একটি টেক্সট-টু-স্পিচ ইঞ্জিনের মাধ্যমে জেনারেট করা পাঠ্যকে সহজভাবে পড়ে। নেটিভ অডিও ইনপুট/আউটপুট সহ, ChatGPT অ্যাডভান্সড ভয়েস একটি দুর্দান্ত কাজ করে।
বহুভাষিক কথোপকথন
বহুভাষিক কথোপকথনে, আমার পরীক্ষার সময় চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোড শালীনভাবে কাজ করেছে। আমি ইংরেজি দিয়ে শুরু করে হিন্দি এবং তারপর বাংলায় ঝাঁপিয়ে পড়ি। এটা কথোপকথন বহন, কিন্তু আমার অভিজ্ঞতা কিছু hiccups ছিল. বিভিন্ন ভাষার মধ্যে রূপান্তরটি এত মসৃণ ছিল না। অন্যদিকে, যখন আমি বহুভাষিক কথোপকথনে জেমিনি লাইভ পরীক্ষা করেছি, তখন এটি সত্যিই ভাল পারফর্ম করেছে এবং অনায়াসে বিভিন্ন ভাষায় আমার প্রশ্নগুলি বুঝতে পেরেছে।
সম্পর্কিত নিবন্ধ
মীরা মুরাতির আকস্মিক প্রস্থান ওপেনএআই-এর লাভের উচ্চাকাঙ্ক্ষা সম্পর্কে গুরুতর প্রশ্ন উত্থাপন করেছে
অর্জুন শা
26শে সেপ্টেম্বর, 2024
OpenAI সিইও স্যাম অল্টম্যান বলেছেন সুপার ইন্টেলিজেন্স কয়েক হাজার দিন দূরে
অর্জুন শা
24 সেপ্টেম্বর, 2024
ভয়েস ইমপ্রেশন
চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোড মর্গান ফ্রিম্যান বা ডেভিড অ্যাটেনবরোর মতো পাবলিক ফিগারদের ভয়েস ইম্প্রেশন করতে পারে না, তবে এটি উচ্চারণ খুব ভাল করতে পারে। আমি ChatGPT Advanced Voice কে আমার সাথে শিকাগো উচ্চারণে কথা বলার জন্য বলেছিলাম এবং ভালভাবে এটি বিতরণ করা হয়েছে। এটি স্কটিশ এবং ভারতীয় উচ্চারণেও খুব ভাল করেছে। সামগ্রিকভাবে, বিভিন্ন আঞ্চলিক শৈলীতে কথোপকথনের জন্য, চ্যাটজিপিটি অ্যাডভান্সড ভয়েস বেশ দুর্দান্ত।
চ্যাটজিপিটি অ্যাডভান্সড ভয়েসের সীমাবদ্ধতা
যদিও ChatGPT অ্যাডভান্সড ভয়েস মোড তার এন্ড-টু-এন্ড মাল্টিমোডাল অভিজ্ঞতার কারণে জেমিনি লাইভ থেকে ভাল, এর ক্ষমতাগুলি ব্যাপকভাবে সীমাবদ্ধ করা হয়েছে। এটি ব্যাপকভাবে পরীক্ষা করার পরে, আমি বুঝতে পেরেছি যে এটির কোনও ব্যক্তিত্ব নেই। কথোপকথনটি এখনও কিছুটা রোবোটিক মনে হয়। অভাব আছে মানুষের মত অভিব্যক্তি সাধারণ কথোপকথনে যা এটিকে কম আকর্ষণীয় করে তোলে।
চ্যাটজিপিটি অ্যাডভান্সড ভয়েস মোড যখন আপনি একটি মজার উপাখ্যান শেয়ার করেন তখন হাসবে না। এটি স্পিকারের মেজাজ সনাক্ত করতে পারে না এবং প্রাণী এবং অন্যান্য প্রাণীর শব্দ বুঝতে পারে না। এই সমস্ত জিনিসগুলি সম্ভব কারণ ওপেনএআই লঞ্চের সময় সেগুলি প্রদর্শন করেছিল। আমি মনে করি যে আগামী মাসগুলিতে, ব্যবহারকারীরা সত্যিকারের মাল্টিমোডাল অভিজ্ঞতা পাবেন, কিন্তু আপাতত, আপনাকে ChatGPT অ্যাডভান্সড ভয়েস মোডের সীমিত সংস্করণের সাথে থাকতে হবে।