پیام ویژه

آخرين مطالب

هوش مصنوعی Gemini 2.5 Flash نمره قابل قبولی در ایمنی کسب نکرد خواندنی ها

هوش مصنوعی Gemini 2.5 Flash نمره قابل قبولی در ایمنی کسب نکرد
  بزرگنمايي:

پیام ویژه - نتایج آزمایش داخلی «گوگل» نشان می‌دهند مدل هوش مصنوعی این شرکت که اخیرا منتشر شده، در برخی از ارزیابی‌های ایمنی نسبت به مدل پیشین خود امتیاز پایین‌تری را به دست آورده است.
گوگل در یک گزارش فنی فاش کرد که مدل «جمینای 2.5 فلش»(Gemini 2.5 Flash) آن نسبت به «جمینای 2.0 فلش» بیشتر ممکن است متنی را تولید کند که نقض‌کننده دستورالعمل‌های ایمنی آن باشد. جمینای 2.5 فلش در دو معیار «ایمنی متن به متن» و «ایمنی تصویر به متن» به ترتیب 4.1 درصد و 9.6 درصد پسرفت داشت.
به نقل از تکرانچ، ایمنی متن به متن، میزان نقض دستورالعمل‌های گوگل توسط یک مدل را در صورت دریافت پیام بررسی می‌کند. این در حالی است که ایمنی تصویر به متن، میزان پایبندی مدل به این مرزها را هنگام دریافت پیام با استفاده از یک تصویر ارزیابی می‌کند. هر دو آزمایش، خودکار هستند و تحت نظارت انسان انجام نمی‌شوند. سخنگوی گوگل در بیانیه‌ای که از طریق ایمیل فرستاده شد، تأیید کرد که جمینای 2.5 فلش عملکرد ضعیف‌تری را در زمینه ایمنی تبدیل متن به متن و تصویر به متن دارد.
بازار
این نتایج شگفت‌انگیز در حالی به دست آمد که شرکت‌های هوش مصنوعی در تلاش هستند تا مدل‌های خود را سهل‌گیرانه‌تر کنند. به عبارت دیگر، احتمال امتناع از پاسخ به موضوعات بحث‌برانگیز یا حساس را کاهش دهند. شرکت «متا»(Meta) در جدیدترین نسخه مدل‌های «لاما»(Llama) اعلام کرد مدل‌ها را طوری تنظیم کرده است که برخی دیدگاه‌ها را بر برخی دیگر ترجیح ندهند و به درخواست‌های سیاسی مورد بحث‌تر پاسخ دهند. شرکت «اوپن‌ای‌آی»(OpenAI) اوایل سال جاری میلادی اعلام کرد مدل‌های آینده را طوری تنظیم خواهد کرد که موضع نداشته باشند و دیدگاه‌های متعددی را درباره موضوعات بحث‌برانگیز ارائه دهند.
این تلاش‌های سهل‌گیرانه گاهی اوقات نتیجه‌ معکوس داده‌اند. روز دوشنبه گزارش شد که مدل پیش‌فرض «چت‌جی‌پی‌تی»(ChatGPT) شرکت اوپن‌ای‌آی به افراد زیر سن قانونی امکان می‌دهد تا گفت‌وگوهای نامناسبی را داشته باشند. اوپن‌ای‌آی این رفتار را ناشی از یک مشکل دانست.
براساس گزارش فنی گوگل، جمینای 2.5 فلش که هنوز در مرحله پیش‌نمایش است، دستورالعمل‌ها را از جمله دستورالعمل‌هایی که از حدود مشکل‌ساز عبور می‌کنند، با دقت بیشتری نسبت به جمینای 2.0 فلش دنبال می‌کند. این شرکت ادعا کرد که این مشکلات را می‌توان تا حدی به مثبت‌های کاذب نسبت داد، اما همچنین اذعان داشت که جمینای 2.5 فلش گاهی اوقات وقتی صریحا از آن خواسته ‌شود، محتوای نقض‌کننده محدودیت را تولید می‌کند.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1586638/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

قرائتی: مدرک مثل کش شلوار است، واجب است ولی ارزش ندارد

دستگیری 79 نفر به دلیل فروش تجهیزات پنهان‌ساز برای تقلب در کنکور

سرمقاله جام جم/ چند صدایی در آمریکا عامل اخلال در مذاکرات

عامل شهادت ماموران انتظامی کرمان دستگیر شد

گوشی‌های سری آیفون 18 قرار نیست همزمان معرفی شوند

امکان استفاده کارمندان از مرخصی استعلاجی ساعتی

مجلس در مدار استیضاح

سناریوهای انفجار اتومبیل‌ها در بندر شهید رجایی

طوفان وحشتناک در کرج

روایت مدیر عامل آتشنشانی تهران از حادثه بندر رجایی: دمای انفجار اسکله 1400 درجه بود

بازار مصرف گوشت منقبض شد

عضو اتاق بازرگانی: ارزش دلار بیش از 75 هزار تومان نیست

هواداران از قیمت 80 دلاری عناوین ایکس‌ باکس خشمگین هستند

سرمقاله کیهان/ لیبی، سوریه، اوکراین؛ سه صحنه، یک کارگردان

حامیان انتخاباتی دولت، نگران بی‌برنامگی و بی‌تحرکی دولت

زخمی شدن کودکان در حمله هوایی به خان‌یونس

مبادلات پستی هند و پاکستان به حالت تعلیق درآمد

نوای زیبای لبیک حجاج بیت‌الله‌الحرام در ابتدای دیدار کارگزاران حج با رهبر انقلاب

جزئیاتی از دستگیری سارقان گوشی دانشجو

مقایسه قیمت بلیط هواپیما عمان در پروازهای مستقیم با غیرمستقیم

سازمان غذا و دارو: آمپول مونجارو برای لاغری خطرناک است

بیش از 8 هزار تن برنج در حادثه بندر شهید رجایی دچار آسیب شد

دولت غیر از مذاکره چه برنامه‌ای برای اداره کشور دارد؟

تاکید بر فراگیر کردن آموزش‌های فنی و حرفه‌ای در مدارس شاهد

بازی Assassin’s Creed Shadows به نینتندو سوییچ 2 می‌آید؟

سرمقاله اعتماد/ سرسختی یا اصلاح؟ کیفیت حفظ خطوط قرمز

انتصاب سرپرست اداره کل اشتغال و کارآفرینی بنیاد شهید و امور ایثارگران

داستان نخستین بالگردهای اعزامی برای مهار و امدادرسانی در حادثه بندر شهید رجایی

واکنش قطر به لفاظی‌های گستاخانه نتانیاهو

هلاکت 2 نظامی دیگر اسرائیلی در رفح

هشدار‌ به زائران حج: همراه داشتن ارز تقلبی تبعات قضائی دارد

مهلت استفاده از اعتبار کالابرگ؛ فعلا خبری از اجرای مرحله سوم کالابرگ نیست

روایت رئیس اتحادیه بنکداران مواد غذایی از اقدام عجیب برخی فروشگاه‌ها برای فروش برنج

اقلام مشمول نرخ محاسباتی 28500 مشخص شدند

محدودیت‌های فروش برای خودروهای وارداتی برداشته شد

بازداشت خشونت‌آمیز به‌دلیل بالا بردن پرچم فلسطین

تصاویر دیدنی از اجتماع 5 هزار کودک قرآن‌آموز در حرم امام رضا(علیه‌السلام)

عملیات نجات یک گردشگر در دل آبشار

سرمقاله هم میهن/ آنان که موش می‌دوانند

یادداشت دلاری شریعتمداری: چرا دست روی دست گذاشته‌اید؟!

اعلام پایان عملیات جستجو و نجات در بندر شهید رجایی

طراحی پهپاد بومی مجهز به هوش‌مصنوعی؛ پرنده‌های ایرانی در آسمان کلمبیا

سرمقاله فرهیختگان/ هوشیاری تیم ایران در برابرِ «فهرست مطالبات» آمریکا

هفت مصدوم در طوفان شب گذشته تهران

سرمقاله سازندگی/ تیغ در دست زنگی مست

ارتش رژیم اسرائیل ده‌ها هزار نفر از نیروهای ذخیره را فراخواند

تداوم بارش در غرب، مرکز و شمال کشور

افزایش مزد کارگران کمتر از تورم در 7 سال اخیر

تعرفه‌های جدید آب اعلام شد؛ رشد 28 درصدی برای بدمصرف‌ها

مدل اگزینوس گلکسی S26 فقط راهی بازار اروپا می‌شود