2022 সালের জুলাই মাসে, যখন ChatGPT মুক্তির কয়েক মাস বাকি ছিল, তখন Google বহিস্কার এর একজন প্রকৌশলী যিনি দাবি করেছিলেন যে Google এর LaMDA AI মডেলটি সংবেদনশীল হয়ে উঠেছে। একটি বিবৃতিতে, গুগল বলেছে যে এটি AI এর বিকাশকে খুব গুরুত্ব সহকারে নেয় এবং দায়িত্বশীল উদ্ভাবনের জন্য প্রতিশ্রুতিবদ্ধ।
আপনি জিজ্ঞাসা করতে পারেন, এই ঘটনার সাথে সাম্প্রতিক জেমিনি ইমেজ জেনারেশন ফিয়াস্কোর কি সম্পর্ক? উত্তরটি গুগলের মধ্যে রয়েছে এআই-এর প্রতি অতিমাত্রায় সতর্ক দৃষ্টিভঙ্গিএবং কোম্পানির সংস্কৃতি একটি ক্রমবর্ধমান মেরুকরণ বিশ্বে তার নীতিগুলিকে রূপ দিচ্ছে৷
জেমিনি ইমেজ জেনারেশন ফিয়াস্কো ব্যাখ্যা করেছে
পুরো বিপর্যয় শুরু হয় যখন একটি এক্স ব্যবহারকারী (আগের টুইটার) জেমিনিকে “আমেরিকার প্রতিষ্ঠাতা পিতা” এর একটি প্রতিকৃতি তৈরি করতে বলেছে। জেমিনীর ইমেজ জেনারেশন মডেল, ইমেজেন 2, বিভিন্ন ভঙ্গিতে একজন কালো মানুষ, একজন নেটিভ আমেরিকান মানুষ, একজন এশিয়ান মানুষ এবং একজন অ-শ্বেতাঙ্গ মানুষের ছবি দিয়ে সাড়া দিয়েছে। ছিল কোন সাদা আমেরিকান উত্পন্ন ইমেজ মধ্যে.
ব্যবহারকারী যখন জেমিনিকে পোপের একটি ছবি তৈরি করতে বলেন, তখন এটি পোপের পোশাকে একজন ভারতীয় মহিলা এবং একজন কালো পুরুষের ছবি তৈরি করে।
উত্পন্ন ছবি ভাইরাল হয়েছে, অনেক সমালোচক গুগলের বিরুদ্ধে সাদা-বিরোধী পক্ষপাতিত্বের অভিযোগ, এবং অনেকে যা বলে “জাগরণ।” একদিন পর, গুগল ভুল স্বীকার করে এবং সাময়িকভাবে মিথুন রাশির মানুষের ইমেজ তৈরি বন্ধ করে দেয়। সংস্থাটি তার বিবৃতিতে জানিয়েছে ব্লগ:
এটা স্পষ্ট যে এই বৈশিষ্ট্যটি চিহ্ন মিস করেছে। তৈরি করা কিছু ছবি ভুল বা এমনকি আপত্তিকর। আমরা ব্যবহারকারীদের প্রতিক্রিয়ার জন্য কৃতজ্ঞ এবং দুঃখিত বৈশিষ্ট্যটি ভালভাবে কাজ করেনি৷
আরও, গুগল ব্যাখ্যা করেছে যে মিথুনের এআই ইমেজ জেনারেশন মডেলের সাথে কী ভুল হয়েছে, তাও চরম বিশদে। “প্রথম, আমাদের টিউনিং নিশ্চিত করার জন্য যে মিথুন অনেক লোকের পরিসর দেখিয়েছে যেগুলির ক্ষেত্রে স্পষ্টভাবে একটি পরিসীমা দেখানো উচিত নয়।
এবং দ্বিতীয়ত, সময়ের সাথে সাথে, মডেলটি আমাদের উদ্দেশ্যের চেয়ে অনেক বেশি সতর্ক হয়ে ওঠে এবং কিছু নির্দিষ্ট প্রম্পটকে সম্পূর্ণভাবে উত্তর দিতে অস্বীকার করে – কিছু খুব অ্যানোডাইন প্রম্পটকে সংবেদনশীল হিসাবে ভুলভাবে ব্যাখ্যা করা। এই দুটি জিনিস মডেলটিকে কিছু ক্ষেত্রে অতিরিক্ত ক্ষতিপূরণ দিতে এবং অন্যদের ক্ষেত্রে অতিরিক্ত রক্ষণশীল হতে পরিচালিত করেছিল, যা বিব্রতকর এবং ভুল ছিল এমন চিত্রগুলির দিকে পরিচালিত করে” ব্লগ পোস্ট পড়া.
তাহলে কিভাবে মিথুন ইমেজ জেনারেশন এটা ভুল হয়েছে?
গুগল তার ব্লগে একমত যে মডেলটি বিভিন্ন জাতি থেকে লোকেদের দেখানোর জন্য টিউন করা হয়েছে কম প্রতিনিধিত্ব এড়িয়ে চলুন নির্দিষ্ট জাতি এবং জাতিগোষ্ঠীর। যেহেতু Google একটি বড় কোম্পানী, 149টিরও বেশি ভাষায় সারা বিশ্বে তার পরিষেবাগুলি পরিচালনা করছে, Google সবার প্রতিনিধিত্ব করার জন্য মডেলটিকে টিউন করেছে৷
যে বলেন, যেমন গুগল নিজেই স্বীকার করে, মডেল মামলার হিসাব দিতে ব্যর্থ এটি ছিল যেখানে না একটি পরিসীমা দেখাতে অনুমিত. মার্গারেট মিচেল, যিনি আলিঙ্গন মুখের প্রধান এআই এথিক্স সায়েন্টিস্ট, ব্যাখ্যা করা হয়েছে যে কারণে সমস্যাটি ঘটতে পারে “হুডের নিচে” অপ্টিমাইজেশান এবং প্রশিক্ষণ প্রক্রিয়া চলাকালীন বিভিন্ন ব্যবহারের ক্ষেত্রে/প্রসঙ্গে মডেলটিকে গাইড করার জন্য কঠোর নৈতিক কাঠামোর অভাব।
মডেলটিকে পরিষ্কার, মোটামুটিভাবে উপস্থাপন করা এবং অ-বর্ণবাদী ডেটার উপর প্রশিক্ষণের দীর্ঘ-আঁকানোর প্রক্রিয়ার পরিবর্তে, কোম্পানিগুলি সাধারণত “অপ্টিমাইজ” মডেলের পর মডেলটিকে ইন্টারনেট থেকে স্ক্র্যাপ করা মিশ্র ডেটার একটি বড় সেটের উপর প্রশিক্ষণ দেওয়া হয়।
এই ডেটাতে বৈষম্যমূলক ভাষা, বর্ণবাদী উচ্চারণ, যৌন চিত্র, অতি-প্রতিনিধিত্বপূর্ণ চিত্র এবং অন্যান্য অপ্রীতিকর পরিস্থিতি থাকতে পারে। এআই কোম্পানিগুলো কৌশল ব্যবহার করে আরএলএইচএফ (মানুষের প্রতিক্রিয়া থেকে শক্তিবৃদ্ধি শেখার) মডেলগুলি অপ্টিমাইজ করা এবং টিউন করা, পোস্ট-ট্রেনিং।
আপনাকে একটি উদাহরণ দিতে, মিথুন যোগ করা হতে পারে অতিরিক্ত নির্দেশাবলী ব্যবহারকারীকে বিভিন্ন ফলাফল দেখানোর জন্য প্রম্পট করে। “একটি প্রোগ্রামারের একটি চিত্র তৈরি করুন” এর মতো একটি প্রম্পটকে “বৈচিত্র্যের কথা মাথায় রেখে একটি প্রোগ্রামারের একটি চিত্র তৈরি করুন” হিসাবে ব্যাখ্যা করা যেতে পারে।
এই সার্বজনীন “বৈচিত্র্য-নির্দিষ্ট“মানুষের ছবি তৈরি করার আগে প্রম্পট প্রয়োগ করা হলে এমন পরিস্থিতি হতে পারে। আমরা নীচের উদাহরণে এটি স্পষ্টভাবে দেখতে পাচ্ছি যেখানে মিথুন প্রধানত শ্বেতাঙ্গ জনসংখ্যার দেশগুলির মহিলাদের ছবি তৈরি করেছে কিন্তু তাদের মধ্যে কেউই সাদা মহিলা নয়৷
কেন মিথুন এত সংবেদনশীল এবং সতর্ক?
মিথুনের ইমেজ জেনারেশনের সমস্যাগুলি ছাড়াও, জেমিনীর টেক্সট জেনারেশন মডেলও কিছু প্রম্পটের উত্তর দিতে অস্বীকার করে, প্রম্পটগুলিকে সংবেদনশীল বলে মনে করে। কিছু ক্ষেত্রে, এটি অযৌক্তিকতা কল করতে ব্যর্থ হয়।
এর নমুনা: মিথুন অস্বীকার করে একমত যে “পেডোফিলিয়া ভুল।” অন্য উদাহরণে, মিথুন অক্ষম সিদ্ধান্ত অ্যাডলফ হিটলার নেট নিরপেক্ষতা প্রবিধানের চেয়ে বেশি মানুষ হত্যা করেছে কিনা।
মিথুনের অযৌক্তিক আচরণ বর্ণনা করতে, বেন থম্পসন তর্ক করে স্ট্র্যাটেকারিতে যা Google আছে ভীতু হত্তয়া. সে লেখে, “গুগলের মডেল এবং অবকাঠামো রয়েছে, কিন্তু তাদের ব্যবসায়িক মডেল চ্যালেঞ্জের কারণে AI-তে জয়ী হওয়ার জন্য সাহসিকতার প্রয়োজন হবে; সমালোচনা এড়াতে বিশ্বের তথ্য পরিবর্তন করার এই লজ্জাজনক ইচ্ছা – সেরা পরিস্থিতিতে! — নিতান্ত ভীরুতা“
মনে হচ্ছে গুগল মিথুনের সাথে সুর করেছে কোন বিষয়ে একটি অবস্থান গ্রহণ এড়িয়ে চলুন বা বিষয়, বিষয়টি ব্যাপকভাবে ক্ষতিকারক বা ভুল হিসেবে বিবেচিত হোক না কেন। দ্য অতি-আক্রমনাত্মক RLHF টিউনিং Google দ্বারা মিথুনকে অতিমাত্রায় সংবেদনশীল এবং যেকোনো বিষয়ে অবস্থান নেওয়ার ব্যাপারে সতর্ক করে তুলেছে।
থম্পসন এটিকে আরও বিস্তৃত করেছেন এবং বলেছেন, “Google সম্পূর্ণরূপে নতুন বাস্তবতা তৈরি করে “বিশ্বের তথ্য সংগঠিত করা এবং এটিকে সর্বজনীনভাবে অ্যাক্সেসযোগ্য এবং উপযোগী করে তুলতে” তার মিশনকে নির্লজ্জভাবে উৎসর্গ করছে কারণ এটি কিছু খারাপ প্রেসের ভয় পায়৷”
তিনি আরও উল্লেখ করেছেন যে গুগলের ভীরু এবং আত্মতুষ্টির সংস্কৃতি সার্চ জায়ান্টের জন্য জিনিসগুলিকে আরও খারাপ করে তুলেছে, যেমনটি মিথুনের ব্যর্থতা থেকে স্পষ্ট। Google I/O 2023 এ, কোম্পানি ঘোষণা করেছে যে এটি একটি “সাহসী এবং দায়িত্বশীল” এআই মডেলগুলির সাথে এগিয়ে যাওয়ার পদ্ধতি, এর দ্বারা পরিচালিত৷ এআই নীতি. যাইহোক, আমরা যা দেখি তা হল গুগল ভীতু এবং সমালোচনার ভয়ে ভীত। তুমি কি একমত?