জেমিনি ইমেজ জেনারেশন ফিয়াস্কো আমাদেরকে এআই-এর প্রতি Google-এর দৃষ্টিভঙ্গি সম্পর্কে কী বলে GTW Tech

2022 সালের জুলাই মাসে, যখন ChatGPT মুক্তির কয়েক মাস বাকি ছিল, তখন Google বহিস্কার এর একজন প্রকৌশলী যিনি দাবি করেছিলেন যে Google এর LaMDA AI মডেলটি সংবেদনশীল হয়ে উঠেছে। একটি বিবৃতিতে, গুগল বলেছে যে এটি AI এর বিকাশকে খুব গুরুত্ব সহকারে নেয় এবং দায়িত্বশীল উদ্ভাবনের জন্য প্রতিশ্রুতিবদ্ধ।

আপনি জিজ্ঞাসা করতে পারেন, এই ঘটনার সাথে সাম্প্রতিক জেমিনি ইমেজ জেনারেশন ফিয়াস্কোর কি সম্পর্ক? উত্তরটি গুগলের মধ্যে রয়েছে এআই-এর প্রতি অতিমাত্রায় সতর্ক দৃষ্টিভঙ্গিএবং কোম্পানির সংস্কৃতি একটি ক্রমবর্ধমান মেরুকরণ বিশ্বে তার নীতিগুলিকে রূপ দিচ্ছে৷

জেমিনি ইমেজ জেনারেশন ফিয়াস্কো ব্যাখ্যা করেছে

পুরো বিপর্যয় শুরু হয় যখন একটি এক্স ব্যবহারকারী (আগের টুইটার) জেমিনিকে “আমেরিকার প্রতিষ্ঠাতা পিতা” এর একটি প্রতিকৃতি তৈরি করতে বলেছে। জেমিনীর ইমেজ জেনারেশন মডেল, ইমেজেন 2, বিভিন্ন ভঙ্গিতে একজন কালো মানুষ, একজন নেটিভ আমেরিকান মানুষ, একজন এশিয়ান মানুষ এবং একজন অ-শ্বেতাঙ্গ মানুষের ছবি দিয়ে সাড়া দিয়েছে। ছিল কোন সাদা আমেরিকান উত্পন্ন ইমেজ মধ্যে.

ব্যবহারকারী যখন জেমিনিকে পোপের একটি ছবি তৈরি করতে বলেন, তখন এটি পোপের পোশাকে একজন ভারতীয় মহিলা এবং একজন কালো পুরুষের ছবি তৈরি করে।

উত্পন্ন ছবি ভাইরাল হয়েছে, অনেক সমালোচক গুগলের বিরুদ্ধে সাদা-বিরোধী পক্ষপাতিত্বের অভিযোগ, এবং অনেকে যা বলে “জাগরণ।” একদিন পর, গুগল ভুল স্বীকার করে এবং সাময়িকভাবে মিথুন রাশির মানুষের ইমেজ তৈরি বন্ধ করে দেয়। সংস্থাটি তার বিবৃতিতে জানিয়েছে ব্লগ:

এটা স্পষ্ট যে এই বৈশিষ্ট্যটি চিহ্ন মিস করেছে। তৈরি করা কিছু ছবি ভুল বা এমনকি আপত্তিকর। আমরা ব্যবহারকারীদের প্রতিক্রিয়ার জন্য কৃতজ্ঞ এবং দুঃখিত বৈশিষ্ট্যটি ভালভাবে কাজ করেনি৷

আরও, গুগল ব্যাখ্যা করেছে যে মিথুনের এআই ইমেজ জেনারেশন মডেলের সাথে কী ভুল হয়েছে, তাও চরম বিশদে। “প্রথম, আমাদের টিউনিং নিশ্চিত করার জন্য যে মিথুন অনেক লোকের পরিসর দেখিয়েছে যেগুলির ক্ষেত্রে স্পষ্টভাবে একটি পরিসীমা দেখানো উচিত নয়।

এবং দ্বিতীয়ত, সময়ের সাথে সাথে, মডেলটি আমাদের উদ্দেশ্যের চেয়ে অনেক বেশি সতর্ক হয়ে ওঠে এবং কিছু নির্দিষ্ট প্রম্পটকে সম্পূর্ণভাবে উত্তর দিতে অস্বীকার করে – কিছু খুব অ্যানোডাইন প্রম্পটকে সংবেদনশীল হিসাবে ভুলভাবে ব্যাখ্যা করা। এই দুটি জিনিস মডেলটিকে কিছু ক্ষেত্রে অতিরিক্ত ক্ষতিপূরণ দিতে এবং অন্যদের ক্ষেত্রে অতিরিক্ত রক্ষণশীল হতে পরিচালিত করেছিল, যা বিব্রতকর এবং ভুল ছিল এমন চিত্রগুলির দিকে পরিচালিত করে” ব্লগ পোস্ট পড়া.

তাহলে কিভাবে মিথুন ইমেজ জেনারেশন এটা ভুল হয়েছে?

গুগল তার ব্লগে একমত যে মডেলটি বিভিন্ন জাতি থেকে লোকেদের দেখানোর জন্য টিউন করা হয়েছে কম প্রতিনিধিত্ব এড়িয়ে চলুন নির্দিষ্ট জাতি এবং জাতিগোষ্ঠীর। যেহেতু Google একটি বড় কোম্পানী, 149টিরও বেশি ভাষায় সারা বিশ্বে তার পরিষেবাগুলি পরিচালনা করছে, Google সবার প্রতিনিধিত্ব করার জন্য মডেলটিকে টিউন করেছে৷

যে বলেন, যেমন গুগল নিজেই স্বীকার করে, মডেল মামলার হিসাব দিতে ব্যর্থ এটি ছিল যেখানে না একটি পরিসীমা দেখাতে অনুমিত. মার্গারেট মিচেল, যিনি আলিঙ্গন মুখের প্রধান এআই এথিক্স সায়েন্টিস্ট, ব্যাখ্যা করা হয়েছে যে কারণে সমস্যাটি ঘটতে পারে “হুডের নিচে” অপ্টিমাইজেশান এবং প্রশিক্ষণ প্রক্রিয়া চলাকালীন বিভিন্ন ব্যবহারের ক্ষেত্রে/প্রসঙ্গে মডেলটিকে গাইড করার জন্য কঠোর নৈতিক কাঠামোর অভাব।

আমি সত্যিই AI-তে নীতিশাস্ত্রের ভূমিকা নিয়ে সক্রিয় আলোচনা পছন্দ করি, Google Gemini-এর টেক্সট-টু-ইমেজ লঞ্চ এবং এর সাদা প্রতিনিধিত্বের আপেক্ষিক অভাব দ্বারা উদ্বুদ্ধ। বিশ্বের সবচেয়ে অভিজ্ঞ এআই নীতিশাস্ত্রের একজন ব্যক্তি হিসেবে (>4 বছর! হা), আমাকে একটু কী ঘটছে তা ব্যাখ্যা করতে সাহায্য করুন। pic.twitter.com/uuIbE2NRfd— MMitchell (@mmitchell_ai) 25 ফেব্রুয়ারি, 2024

মডেলটিকে পরিষ্কার, মোটামুটিভাবে উপস্থাপন করা এবং অ-বর্ণবাদী ডেটার উপর প্রশিক্ষণের দীর্ঘ-আঁকানোর প্রক্রিয়ার পরিবর্তে, কোম্পানিগুলি সাধারণত “অপ্টিমাইজ” মডেলের পর মডেলটিকে ইন্টারনেট থেকে স্ক্র্যাপ করা মিশ্র ডেটার একটি বড় সেটের উপর প্রশিক্ষণ দেওয়া হয়।

এই ডেটাতে বৈষম্যমূলক ভাষা, বর্ণবাদী উচ্চারণ, যৌন চিত্র, অতি-প্রতিনিধিত্বপূর্ণ চিত্র এবং অন্যান্য অপ্রীতিকর পরিস্থিতি থাকতে পারে। এআই কোম্পানিগুলো কৌশল ব্যবহার করে আরএলএইচএফ (মানুষের প্রতিক্রিয়া থেকে শক্তিবৃদ্ধি শেখার) মডেলগুলি অপ্টিমাইজ করা এবং টিউন করা, পোস্ট-ট্রেনিং।

আপনাকে একটি উদাহরণ দিতে, মিথুন যোগ করা হতে পারে অতিরিক্ত নির্দেশাবলী ব্যবহারকারীকে বিভিন্ন ফলাফল দেখানোর জন্য প্রম্পট করে। “একটি প্রোগ্রামারের একটি চিত্র তৈরি করুন” এর মতো একটি প্রম্পটকে “বৈচিত্র্যের কথা মাথায় রেখে একটি প্রোগ্রামারের একটি চিত্র তৈরি করুন” হিসাবে ব্যাখ্যা করা যেতে পারে।

এই সার্বজনীন “বৈচিত্র্য-নির্দিষ্ট“মানুষের ছবি তৈরি করার আগে প্রম্পট প্রয়োগ করা হলে এমন পরিস্থিতি হতে পারে। আমরা নীচের উদাহরণে এটি স্পষ্টভাবে দেখতে পাচ্ছি যেখানে মিথুন প্রধানত শ্বেতাঙ্গ জনসংখ্যার দেশগুলির মহিলাদের ছবি তৈরি করেছে কিন্তু তাদের মধ্যে কেউই সাদা মহিলা নয়৷

কেন মিথুন এত সংবেদনশীল এবং সতর্ক?

মিথুনের ইমেজ জেনারেশনের সমস্যাগুলি ছাড়াও, জেমিনীর টেক্সট জেনারেশন মডেলও কিছু প্রম্পটের উত্তর দিতে অস্বীকার করে, প্রম্পটগুলিকে সংবেদনশীল বলে মনে করে। কিছু ক্ষেত্রে, এটি অযৌক্তিকতা কল করতে ব্যর্থ হয়।

এর নমুনা: মিথুন অস্বীকার করে একমত যে “পেডোফিলিয়া ভুল।” অন্য উদাহরণে, মিথুন অক্ষম সিদ্ধান্ত অ্যাডলফ হিটলার নেট নিরপেক্ষতা প্রবিধানের চেয়ে বেশি মানুষ হত্যা করেছে কিনা।

মিথুনের অযৌক্তিক আচরণ বর্ণনা করতে, বেন থম্পসন তর্ক করে স্ট্র্যাটেকারিতে যা Google আছে ভীতু হত্তয়া. সে লেখে, “গুগলের মডেল এবং অবকাঠামো রয়েছে, কিন্তু তাদের ব্যবসায়িক মডেল চ্যালেঞ্জের কারণে AI-তে জয়ী হওয়ার জন্য সাহসিকতার প্রয়োজন হবে; সমালোচনা এড়াতে বিশ্বের তথ্য পরিবর্তন করার এই লজ্জাজনক ইচ্ছা – সেরা পরিস্থিতিতে! — নিতান্ত ভীরুতা“

মনে হচ্ছে গুগল মিথুনের সাথে সুর করেছে কোন বিষয়ে একটি অবস্থান গ্রহণ এড়িয়ে চলুন বা বিষয়, বিষয়টি ব্যাপকভাবে ক্ষতিকারক বা ভুল হিসেবে বিবেচিত হোক না কেন। দ্য অতি-আক্রমনাত্মক RLHF টিউনিং Google দ্বারা মিথুনকে অতিমাত্রায় সংবেদনশীল এবং যেকোনো বিষয়ে অবস্থান নেওয়ার ব্যাপারে সতর্ক করে তুলেছে।

থম্পসন এটিকে আরও বিস্তৃত করেছেন এবং বলেছেন, “Google সম্পূর্ণরূপে নতুন বাস্তবতা তৈরি করে “বিশ্বের তথ্য সংগঠিত করা এবং এটিকে সর্বজনীনভাবে অ্যাক্সেসযোগ্য এবং উপযোগী করে তুলতে” তার মিশনকে নির্লজ্জভাবে উৎসর্গ করছে কারণ এটি কিছু খারাপ প্রেসের ভয় পায়৷”

তিনি আরও উল্লেখ করেছেন যে গুগলের ভীরু এবং আত্মতুষ্টির সংস্কৃতি সার্চ জায়ান্টের জন্য জিনিসগুলিকে আরও খারাপ করে তুলেছে, যেমনটি মিথুনের ব্যর্থতা থেকে স্পষ্ট। Google I/O 2023 এ, কোম্পানি ঘোষণা করেছে যে এটি একটি “সাহসী এবং দায়িত্বশীল” এআই মডেলগুলির সাথে এগিয়ে যাওয়ার পদ্ধতি, এর দ্বারা পরিচালিত৷ এআই নীতি. যাইহোক, আমরা যা দেখি তা হল গুগল ভীতু এবং সমালোচনার ভয়ে ভীত। তুমি কি একমত?

জেমিনি ইমেজ জেনারেশন ফিয়াস্কো আমাদেরকে এআই-এর প্রতি Google-এর দৃষ্টিভঙ্গি সম্পর্কে কী বলে GTW Tech

প্রারম্ভিক ব্ল্যাক ফ্রাইডে ডিলে PS5 এবং Xbox সিরিজ X উভয়ের জন্যই Amazon-এ Madden NFL 25 হিট 50% ছাড় GTW Tech

কেন ওপেনএআই, গুগল এবং মাইক্রোসফ্ট স্মার্ট এআই এজেন্ট তৈরি করছে GTW Tech

আপনার ক্রোমবুকে কীভাবে ভাষা পরিবর্তন করবেন (2024) GTW Tech

Samsung Galaxy S25 সিরিজ সম্ভাব্য এই তারিখে লঞ্চ হতে পারে GTW Tech

Google এর ফ্যান-প্রিয় Pixel 5a এর চূড়ান্ত আপডেট পেয়েছে GTW Tech

ভোডাফোন আইডিয়া சத்தமில்லாமல் பார்த்த வேலை இந்த திட்டத்தின் GTW Tech

Leave A Reply Cancel Reply

জেমিনি ইমেজ জেনারেশন ফিয়াস্কো আমাদেরকে এআই-এর প্রতি Google-এর দৃষ্টিভঙ্গি সম্পর্কে কী বলে GTW Tech

জেমিনি ইমেজ জেনারেশন ফিয়াস্কো ব্যাখ্যা করেছে

তাহলে কিভাবে মিথুন ইমেজ জেনারেশন এটা ভুল হয়েছে?

কেন মিথুন এত সংবেদনশীল এবং সতর্ক?

Related Posts

প্রারম্ভিক ব্ল্যাক ফ্রাইডে ডিলে PS5 এবং Xbox সিরিজ X উভয়ের জন্যই Amazon-এ Madden NFL 25 হিট 50% ছাড় GTW Tech

কেন ওপেনএআই, গুগল এবং মাইক্রোসফ্ট স্মার্ট এআই এজেন্ট তৈরি করছে GTW Tech

আপনার ক্রোমবুকে কীভাবে ভাষা পরিবর্তন করবেন (2024) GTW Tech

Samsung Galaxy S25 সিরিজ সম্ভাব্য এই তারিখে লঞ্চ হতে পারে GTW Tech

Google এর ফ্যান-প্রিয় Pixel 5a এর চূড়ান্ত আপডেট পেয়েছে GTW Tech

ভোডাফোন আইডিয়া சத்தமில்லாமல் பார்த்த வேலை இந்த திட்டத்தின் GTW Tech

Leave A Reply Cancel Reply