যদি 2022 এ AI চ্যাটবটগুলির জন্ম হয় যেমনটি আমরা জানি, OpenAI-এর ChatGPT-কে ধন্যবাদ, তাহলে সমস্ত ইঙ্গিত অনুসারে 2025 তাদের বর্তমান গোপন গবেষণার বুদবুদ থেকে অনেক AI এজেন্ট প্রকাশ্যে আসতে দেখবে – এবং না আমি কথা বলছি না বাগান বৈচিত্র্য এজেন্ট উল্লেখ ম্যাট্রিক্স! তারা কীভাবে আমাদের বিশ্বকে পরিবর্তন করবে তা এই মুহুর্তে যে কারও অনুমান, তবে AI এজেন্টদের ভোর অবশ্যই AI ল্যান্ডস্কেপে কিছু উত্তেজনা ইনজেক্ট করার প্রতিশ্রুতি দেয় যা হয়ে উঠছে – আমি বলতে সাহস করি – দিনে দিনে আরও নোংরা।
বিগত দুই বছরে, বিশ্ব জেনারেটিভ এআই স্পেসে প্রচুর অগ্রগতি দেখেছে, টেক্সট-টু-টেক্সট, টেক্সট-টু-ইমেজ এবং টেক্সট-টু-ভিডিও ভিত্তিক জেনারেটিভ AI ক্ষমতা। এবং এই সব কিছুই পরবর্তী বড় AI ব্রেকথ্রু – AI এজেন্টদের জন্য ধাপে ধাপে কম নয়। অনুযায়ী ব্লুমবার্গOpenAI তার প্রথম স্বায়ত্তশাসিত AI এজেন্ট চালু করার প্রস্তুতি নিচ্ছে, যার কোডনেম ‘অপারেটর’, 2025 সালের জানুয়ারিতে।
আরও পড়ুন: ভাল আবহাওয়ার পূর্বাভাসের জন্য পৃথ্বী, নাসা এবং আইবিএম-এর বিনামূল্যের এআই মডেলের সাথে দেখা করুন
স্পষ্টতই, এই OpenAI এজেন্ট – বা অপারেটর, যেমন এটির কোডনাম – জটিল কাজগুলি স্বাধীনভাবে সম্পাদন করার জন্য ডিজাইন করা হয়েছে। ভয়েস বা পাঠ্যের মাধ্যমে ব্যবহারকারীর আদেশগুলি বোঝার মাধ্যমে, এই এআই এজেন্ট কম্পিউটারে বিভিন্ন অ্যাপ্লিকেশন নিয়ন্ত্রণ করার সাথে সম্পর্কিত কাজগুলি আপাতদৃষ্টিতে করবে, একটি ইমেল পাঠাবে, ফ্লাইট বুক করবে এবং সন্দেহ নেই অন্যান্য দুর্দান্ত জিনিসগুলি। চ্যাটজিপিটি, কপিলট, গুগল জেমিনি বা অন্য কোনো এলএলএম-ভিত্তিক চ্যাটবট নিজেরাই করতে পারে না। পুরোপুরি জেনেও যে আমি নিজের থেকে অনেক এগিয়ে যাচ্ছি, আপনি কি জার্ভিসের জন্য প্রস্তুত, আয়রন ম্যান থেকে টনি স্টার্কের বুদ্ধিমান এআই সহকারী বা তার থেকে সামান্থা, আমরা এখন পর্যন্ত যা অভিজ্ঞতা করেছি তার চেয়ে উল্লেখযোগ্যভাবে উন্নত এআই অপারেটিং সিস্টেম?
এআই এজেন্ট কি?
সহজ কথায়, একটি AI এজেন্ট হল একটি সামান্য বেশি উন্নত AI প্রোগ্রাম যা নির্দিষ্ট স্বায়ত্তশাসিত কাজগুলি সম্পাদন করতে পারে যা শুধুমাত্র তার নিজস্ব বেস প্রোগ্রামের মধ্যে সীমাবদ্ধ নয়। ChatGPT বা Gemini আপনার জন্য কোড লিখতে পারে, যদি আপনি এটি চান, কিন্তু এটি গিয়ে সেই কোড থেকে একটি ওয়েবসাইট বা একটি অ্যাপ তৈরি করতে পারে না, যেখানে ওয়েবসাইটটি একটি ডোমেন নাম বা অ্যাপ স্টোরে প্রকাশিত অ্যাপ সহ লাইভ থাকে। একজন AI এজেন্ট এই কাজগুলি করতে সক্ষম হবে – আমি এই সঠিক কাজগুলি বলছি না যা আমি উপরে পরামর্শ দিয়েছি, কিন্তু এই AI এজেন্টদের কেবল কী করা দরকার তা দেখানোর ক্ষমতা থাকবে না বরং এগিয়ে যান এবং এর কিছু করারও ক্ষমতা থাকবে। কাজ
আমাজনের কর্মকর্তার মতে AWS ব্লগমানুষ যেকোন প্রদত্ত AI-সম্পর্কিত কাজের জন্য বিস্তৃত লক্ষ্য নির্ধারণ করবে, যেখানে AI এজেন্ট স্বাধীনভাবে সেই লক্ষ্যগুলি অর্জনের জন্য সর্বোত্তম কর্ম সম্পাদন করতে হবে তা বেছে নেবে। আমাজন আরও ব্যাখ্যা করে যে কীভাবে একটি গ্রাহক পরিষেবা পরিস্থিতিতে, একজন ভবিষ্যতের এআই এজেন্ট স্বয়ংক্রিয়ভাবে একজন কলিং গ্রাহকের প্রশ্নকে সন্তুষ্ট করার চেষ্টা করবে – অভ্যন্তরীণ তথ্য খোঁজার মাধ্যমে, মানব গ্রাহককে বিভিন্ন প্রশ্ন জিজ্ঞাসা করে, পরিস্থিতির স্টক নেওয়ার মাধ্যমে এবং একটি সমাধানের সাথে উত্তর দিয়ে যা কলিং গ্রাহকের সমস্যার সমাধান করে। এই পরিস্থিতিতে, এআই এজেন্ট গ্রাহকের কলটি নিজে থেকে পরিচালনা করে – কোনও মানব গ্রাহক সহায়তা বিশেষজ্ঞের কাছে কলটি পাস না করে। প্রকৃতপক্ষে, একজন মানব গ্রাহক সহায়তা বিশেষজ্ঞের কাছে কল স্থানান্তর করা হবে কি না তা এআই এজেন্ট স্বয়ংক্রিয়ভাবে নির্ধারণ করে।
এআই এজেন্টরা সহজ এআই চ্যাটবট থেকে উন্নত হবে তাদের উন্নত যুক্তির ক্ষমতার জন্য ধন্যবাদ, পরামর্শ দেয় AI এজেন্টদের উপর IBM এর ব্লগ পোস্ট. ChatGPT বা Gemini-এর মতো ঐতিহ্যবাহী AI চ্যাটবটগুলির বিপরীতে, যা ব্যবহারকারীর প্রশ্নের উচ্চ স্ক্রিপ্টেড প্রতিক্রিয়া দেয়, AI এজেন্টদের পরিকল্পনা করার, চিন্তা করার এবং নতুন তথ্যের সাথে খাপ খাইয়ে নেওয়ার ক্ষমতা থাকবে, যা তাদেরকে ন্যূনতম মানব হস্তক্ষেপ বা তত্ত্বাবধানে আরও জটিল কাজগুলি পরিচালনা করতে সক্ষম করবে।
এআই এজেন্ট এবং এআই চ্যাটবটের মধ্যে পার্থক্য
এআই এজেন্টদের মধ্যে প্রচুর পরিশীলিততা রয়েছে, যা এআই চ্যাটবটগুলিতে নেই। এআই চ্যাটবটগুলি দেখার একটি উপায় হল যে তারা বিভিন্ন বিষয়ের সমস্ত তত্ত্বে জ্ঞানী, যেখানে এআই এজেন্টদের কেবল জ্ঞানই নয়, তাদের শিক্ষাকে বিভিন্ন অ্যাপ্লিকেশনে প্রয়োগ করার দক্ষতাও রয়েছে। নীচে এআই এজেন্ট এবং চ্যাটবটগুলির মধ্যে তিনটি মূল পার্থক্য দেওয়া হল…
স্বায়ত্তশাসিত হওয়া এখানে খেলার নাম। এআই এজেন্টরা স্ব-পরিচালিত, নিরন্তর মানুষের হস্তক্ষেপের প্রয়োজন ছাড়াই মিটিং শিডিউল করা বা ইমেল পরিচালনার মতো কাজগুলি সম্পাদন করে প্রদত্ত মানব নির্দেশের ভিত্তিতে তাদের নিজস্ব সিদ্ধান্ত নিতে সক্ষম। এটি ChatGPT বা Gemini-এর মতো AI চ্যাটবটগুলির সম্পূর্ণ বিপরীত যা প্রতিক্রিয়া তৈরি করার জন্য অবিচ্ছিন্ন ব্যবহারকারীর অনুরোধের উপর নির্ভর করে, যেখানে তাদের স্বাধীনভাবে কাজ শুরু করার ক্ষমতা নেই।
জটিল কাজগুলিকে ভেঙে ফেলার এবং কার্যকর করার তাদের ক্ষমতা আরেকটি মূল পার্থক্যকারী। এআই এজেন্টরা জটিল, বহুমুখী কাজগুলি মোকাবেলা করার জন্য বিভিন্ন উত্স থেকে তথ্য সংগ্রহ করে এবং জ্ঞাত সিদ্ধান্ত নেওয়ার জন্য সজ্জিত। অন্যদিকে, AI চ্যাটবটগুলি সাধারণত শুধুমাত্র তথ্য প্রদান বা তাদের পূর্ব-বিদ্যমান প্রশিক্ষিত জ্ঞান ভিত্তির উপর ভিত্তি করে প্রশ্নের উত্তর দেওয়ার মধ্যে সীমাবদ্ধ থাকে।
বিশেষজ্ঞদের মতে, পার্থক্যের আরেকটি মূল বিষয় হল নিম্নোক্ত: এআই এজেন্টদের অভিজ্ঞতা থেকে শেখার এবং নির্দিষ্ট কাজের একটি সেটের সাথে মেলে সময়ের সাথে সাথে তাদের আচরণকে খাপ খাইয়ে নেওয়ার ক্ষমতা রয়েছে, সদা পরিবর্তনশীল পরিস্থিতিতে তাদের কর্মক্ষমতা বৃদ্ধি করে। যাইহোক, এআই চ্যাটবটগুলিতে সাধারণত এই স্তরের অভিযোজনযোগ্যতার অভাব থাকে, তাদের বিদ্যমান জ্ঞানের ভিত্তির মধ্যে যা আছে তা ছাড়া নতুন কিছু শিখতে অক্ষম। এগুলি এআই এজেন্ট এবং চ্যাটবটগুলির মধ্যে কিছু শীর্ষ পার্থক্য যা আমরা জানি৷
বিভিন্ন ধরনের এআই এজেন্ট
ঠিক যেমন বিভিন্ন এআই চ্যাটবটগুলির বিভিন্ন কাজ জুড়ে দক্ষতার বিভিন্ন স্তর রয়েছে, তেমনি এআই এজেন্টগুলিও সমস্ত আকার এবং আকারে আসে – অবশ্যই বলা যায়। একটি AI এজেন্ট তার প্রোগ্রামিং এবং এটি চালানোর প্রত্যাশিত কাজের পরিমাণের উপর নির্ভর করে সহজ বা জটিল হতে পারে। এই সুযোগের পরিপ্রেক্ষিতে, এখানে AI এজেন্টদের কিভাবে তিনটি প্রধান প্রকারে শ্রেণীবদ্ধ করা হচ্ছে।
আরও পড়ুন: এসএলএম বনাম এলএলএম: কেন ছোট জেনারেল এআই মডেলগুলি ভাল
প্রথমত, তথাকথিত লক্ষ্য-ভিত্তিক এজেন্ট রয়েছে যেগুলি বিভিন্ন অ্যাকশন সিকোয়েন্সের মূল্যায়ন করে এবং তাদের লক্ষ্যে পৌঁছানোর জন্য সবচেয়ে কার্যকর পথ নির্বাচন করে নির্দিষ্ট উদ্দেশ্য অর্জনের জন্য ডিজাইন করা হয়েছে। সাধারণ এজেন্টের বিপরীতে, লক্ষ্য-ভিত্তিক এজেন্টরা ভবিষ্যতের ফলাফলগুলিকে সাবধানে বিবেচনা করে এবং সেই অনুযায়ী তাদের কর্মের পরিকল্পনা করে। এই লক্ষ্য-ভিত্তিক AI এজেন্টের একটি উদাহরণ হল একটি নেভিগেশন সিস্টেম যা একাধিক পথ বিশ্লেষণ করে এবং ভ্রমণের সময় কম করে এমন একটি নির্বাচন করে একটি গন্তব্যে যাওয়ার দ্রুততম রুটটি সনাক্ত করে।
লক্ষ্য-ভিত্তিক এজেন্টের পরে আসে যা ইউটিলিটি-ভিত্তিক এজেন্ট নামে পরিচিত, যেটি লক্ষ্য-ভিত্তিক এজেন্টের কার্যকারিতাকে শুধুমাত্র একটি লক্ষ্য অর্জনের লক্ষ্যেই নয় বরং এর চূড়ান্ত অভিপ্রেত ফলাফলের গুণমানকেও অপ্টিমাইজ করে। এই AI এজেন্টরা প্রতিটি সম্ভাব্য ফলাফলের জন্য একটি মান নির্ধারণ করতে একটি ইউটিলিটি ফাংশন ব্যবহার করে, যার ফলে এমন ক্রিয়াগুলি বেছে নেয় যা কোনও প্রদত্ত কাজের সামগ্রিক সন্তুষ্টি বা কর্মক্ষমতাকে সর্বাধিক করে তোলে। এই পদ্ধতিটি বিশেষভাবে কার্যকর যখন একাধিক পাথ একই লক্ষ্যে নিয়ে যেতে পারে, AI এজেন্টকে পূর্বনির্ধারিত মানদণ্ডের উপর ভিত্তি করে সবচেয়ে সুবিধাজনক একটি নির্বাচন করতে দেয়। একটি ভ্রমণ বুকিং সিস্টেমের কথা কল্পনা করুন যেটি শুধুমাত্র গন্তব্যে পৌঁছানোর উপর ভিত্তি করেই নয়, সবচেয়ে সাশ্রয়ী ও সুবিধাজনক বিকল্প প্রদানের জন্য টিকিটের মূল্য, ভ্রমণের সময় এবং লেওভারের মতো বিষয়গুলিকে বিবেচনা করে ফ্লাইটের সুপারিশ করে – এটিই হবে একটি ইউটিলিটি-ভিত্তিক এআই এজেন্ট। এর কাজগুলির অংশ হিসাবে সঞ্চালন করতে সক্ষম।
অবশেষে, শেখার এজেন্ট আছে. এই AI এজেন্টদের অভিজ্ঞতা থেকে শিখে সময়ের সাথে সাথে তাদের কর্মক্ষমতা উন্নত করার ক্ষমতা রয়েছে। তাদের পরিবেশের সাথে ক্রমাগত ইন্টারঅ্যাক্ট করে এবং প্রতিক্রিয়া অন্তর্ভুক্ত করার মাধ্যমে, শেখার এজেন্টরা নতুন পরিস্থিতির সাথে খাপ খায় এবং তাদের সিদ্ধান্ত গ্রহণের প্রক্রিয়াগুলিকে পরিমার্জিত করে, তাদের গতিশীল এবং জটিল ডোমেনের জন্য উপযুক্ত করে তোলে। শ্রেণীবিন্যাস এজেন্ট হিসাবে পরিচিত কিছু আছে, যেগুলি একাধিক স্তরে সাজানো এআই এজেন্টদের একটি গ্রুপ ছাড়া কিছুই নয়। এই ধরনের একটি শ্রেণীবদ্ধ কাঠামোতে, উচ্চ-স্তরের এজেন্টরা জটিল কাজগুলি ভেঙে দেয় এবং সেগুলি পৃথক নিম্ন-স্তরের এআই এজেন্টদের কাছে অর্পণ করে। এই নিম্ন-স্তরের এজেন্টরা তাদের কাজগুলি স্বাধীনভাবে চালায় এবং তাদের ফলাফলগুলি মান শৃঙ্খলে উচ্চ-স্তরের এজেন্টদের কাছে হস্তান্তর করে।
যারা সবাই এআই এজেন্ট তৈরি করছে
AI শিল্পের সমস্ত বড় মুভার্স এবং শেকাররা খুব শীঘ্রই 2025 সালে জনসাধারণের জন্য তাদের AI এজেন্টের সংস্করণ প্রকাশ করার পরিকল্পনা করছে, যদি তারা 2024 সালের শেষের দিকে এটি না করে থাকে।
আমি আগেই উল্লেখ করেছি, OpenAI তাদের AI এজেন্ট, কোডনাম পাওয়ার জন্য কাজ করছে বলে জানা গেছে অপারেটরজানুয়ারী 2025 এর মধ্যে প্রত্যেকের জন্য চেক আউট করার জন্য উন্মুক্ত। AI এজেন্ট আপনার কম্পিউটারের মধ্যে স্বায়ত্তশাসিতভাবে কিছু কাজ পরিচালনা করতে সক্ষম হবে বলে আশা করা হচ্ছে, যেমন ফ্লাইট টিকিট বুক করা এবং কোড প্রয়োগ করা, অন্যান্য জিনিসগুলির মধ্যে। গুগল বেশ কয়েকটি এআই এজেন্ট প্রকল্পে কাজ করছে বলে মনে হচ্ছে, যার মধ্যে একটি প্রজেক্ট জার্ভিস নামে পরিচিত, যা সম্প্রতি ফাঁস হয়েছে ক্রোম ওয়েব স্টোর. এই এআই এজেন্ট অনুমিতভাবে গুগল ক্রোম ব্রাউজারে থাকবেন, ব্রাউজারের মধ্যে শুধুমাত্র স্বয়ংক্রিয় এবং কার্য সম্পাদন করতে পারবেন না বরং হোস্ট পিসি বা কম্পিউটারে অন্যান্য অ্যাপও পরিচালনা করতে পারবেন। যদিও এখনও প্রজেক্ট জার্ভিসের জন্য কোন নির্দিষ্ট রিলিজ তারিখ নেই, তবে, Google-এর জেমিনি 2.0 AI মডেলে উন্নত ক্ষমতা অফার করার জন্য AI এজেন্ট অন্তর্নির্মিত থাকবে বলে আশা করা হচ্ছে – এটি এই বছরের শেষের দিকে 2024 সালে মুক্তি পাবে বলে আশা করা হচ্ছে।
মাইক্রোসফ্ট এআই এজেন্টদের উপরও আক্রমনাত্মকভাবে কাজ করছে, যা 2024 সালের শুরুতে ঘোষণা করেছিল। অফিসিয়াল ব্লগকপিলট স্টুডিওতে নতুন ক্ষমতা Microsoft গ্রাহকদের শক্তিশালী স্বায়ত্তশাসিত AI এজেন্ট তৈরি করতে অনুমতি দেবে। এই মুহুর্তে এই প্রদর্শনগুলির মধ্যে কয়েকটি সর্বজনীন প্রিভিউতে রয়েছে, যেখানে AI এজেন্টরা বিভিন্ন ধরনের সহায়ক কাজ করার জন্য বিভিন্ন Microsoft Office 365 অ্যাপ থেকে কাজ বা ব্যবসার ডেটা আঁকতে পারে – যেমন IT সহায়তা ডেস্ক, কর্মচারী অনবোর্ডিং, বিক্রয় এবং পরিষেবা সমন্বয় করা এবং আরো
Anthropic, একটি AI স্টার্টআপ যা OpenAI-এর সাথে প্রতিদ্বন্দ্বিতা করছে, ইতিমধ্যেই মানুষের চেষ্টা করার জন্য তার AI এজেন্ট প্রকাশ করেছে৷ অনুযায়ী টেকক্রাঞ্চAnthropic তার Claude 3.5 Sonnet AI মডেলে উল্লেখযোগ্য আপগ্রেড করেছে যা এখন এটিকে হোস্ট কম্পিউটার ব্যবহার করতে দেয় – হ্যাঁ, এটি কম্পিউটারের সাথে এমনভাবে যোগাযোগ করতে পারে যা মানুষের অনুকরণ করে। এটি পর্দার চারপাশে কার্সারকে সরাতে পারে, অ্যাপ্লিকেশন এবং বোতামগুলিতে ক্লিক করতে পারে এবং এটি স্বায়ত্তশাসিতভাবে বিভিন্ন কাজ সম্পাদন করতে আপনার পিসিতে ইনস্টল করা অন্যান্য সফ্টওয়্যার এবং প্রোগ্রামগুলির সাথে যোগাযোগ করতে পারে। এটা কত ভীতিকর এবং শীতল?!
যদি 2022 সালে বিশ্ব জেনারেটিভ এআই-এর জন্য প্রস্তুত না হয়, তবে আমি আপনাকে বলতে চাই যে এটি অবশ্যই AI এজেন্টদের জন্য প্রস্তুত নয় এবং এটি আমাদের জীবনকে প্রভাবিত করতে পারে – ভাল বা খারাপের জন্য। আসুন আশা করি এই AI এজেন্টগুলি আপনার এবং আমার জন্য 25 বছর আগে একটি আইকনিক মুভিতে চিত্রিত হিসাবে ডিস্টোপিয়ান সংস্করণে পরিণত হবে না, তাই না?
আরও পড়ুন: মেটা এআই ম্যানিফেস্টো: মার্ক জুকারবার্গের এআই-সহায়তা পুনরুত্থান