پیام ویژه

آخرين مطالب

هوش مصنوعی Gemini 2.5 Flash نمره قابل قبولی در ایمنی کسب نکرد خواندنی ها

هوش مصنوعی Gemini 2.5 Flash نمره قابل قبولی در ایمنی کسب نکرد
  بزرگنمايي:

پیام ویژه - نتایج آزمایش داخلی «گوگل» نشان می‌دهند مدل هوش مصنوعی این شرکت که اخیرا منتشر شده، در برخی از ارزیابی‌های ایمنی نسبت به مدل پیشین خود امتیاز پایین‌تری را به دست آورده است.
گوگل در یک گزارش فنی فاش کرد که مدل «جمینای 2.5 فلش»(Gemini 2.5 Flash) آن نسبت به «جمینای 2.0 فلش» بیشتر ممکن است متنی را تولید کند که نقض‌کننده دستورالعمل‌های ایمنی آن باشد. جمینای 2.5 فلش در دو معیار «ایمنی متن به متن» و «ایمنی تصویر به متن» به ترتیب 4.1 درصد و 9.6 درصد پسرفت داشت.
به نقل از تکرانچ، ایمنی متن به متن، میزان نقض دستورالعمل‌های گوگل توسط یک مدل را در صورت دریافت پیام بررسی می‌کند. این در حالی است که ایمنی تصویر به متن، میزان پایبندی مدل به این مرزها را هنگام دریافت پیام با استفاده از یک تصویر ارزیابی می‌کند. هر دو آزمایش، خودکار هستند و تحت نظارت انسان انجام نمی‌شوند. سخنگوی گوگل در بیانیه‌ای که از طریق ایمیل فرستاده شد، تأیید کرد که جمینای 2.5 فلش عملکرد ضعیف‌تری را در زمینه ایمنی تبدیل متن به متن و تصویر به متن دارد.
بازار
این نتایج شگفت‌انگیز در حالی به دست آمد که شرکت‌های هوش مصنوعی در تلاش هستند تا مدل‌های خود را سهل‌گیرانه‌تر کنند. به عبارت دیگر، احتمال امتناع از پاسخ به موضوعات بحث‌برانگیز یا حساس را کاهش دهند. شرکت «متا»(Meta) در جدیدترین نسخه مدل‌های «لاما»(Llama) اعلام کرد مدل‌ها را طوری تنظیم کرده است که برخی دیدگاه‌ها را بر برخی دیگر ترجیح ندهند و به درخواست‌های سیاسی مورد بحث‌تر پاسخ دهند. شرکت «اوپن‌ای‌آی»(OpenAI) اوایل سال جاری میلادی اعلام کرد مدل‌های آینده را طوری تنظیم خواهد کرد که موضع نداشته باشند و دیدگاه‌های متعددی را درباره موضوعات بحث‌برانگیز ارائه دهند.
این تلاش‌های سهل‌گیرانه گاهی اوقات نتیجه‌ معکوس داده‌اند. روز دوشنبه گزارش شد که مدل پیش‌فرض «چت‌جی‌پی‌تی»(ChatGPT) شرکت اوپن‌ای‌آی به افراد زیر سن قانونی امکان می‌دهد تا گفت‌وگوهای نامناسبی را داشته باشند. اوپن‌ای‌آی این رفتار را ناشی از یک مشکل دانست.
براساس گزارش فنی گوگل، جمینای 2.5 فلش که هنوز در مرحله پیش‌نمایش است، دستورالعمل‌ها را از جمله دستورالعمل‌هایی که از حدود مشکل‌ساز عبور می‌کنند، با دقت بیشتری نسبت به جمینای 2.0 فلش دنبال می‌کند. این شرکت ادعا کرد که این مشکلات را می‌توان تا حدی به مثبت‌های کاذب نسبت داد، اما همچنین اذعان داشت که جمینای 2.5 فلش گاهی اوقات وقتی صریحا از آن خواسته ‌شود، محتوای نقض‌کننده محدودیت را تولید می‌کند.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1586638/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

سرمقاله خراسان/ کمک یمن به امنیت ملی ایران

ماجرای آتش‌سوزی جنب نیروگاه منتظر قائم البرز چه بود؟

کارخانه فعال تولید شرکت های صوری

مشقت کار در تونل های زیرزمینی

صد روز تکان‌دهنده در سیاست خارجی آمریکا

صبح جمعه با جولانی

پاکستان: به‌دنبال درگیری با هند نیستیم، اما پاسخ ما فراموش‌نشدنی است

مدل ویژه 20 سالگی آیفون احتمالاً طراحی تمام‌صفحه خواهد داشت

صدای پیامک ها بلندتر از قانون

انصارالله: آمریکا افسار اسرائیل را در سوریه باز گذاشته است

اعطای تسهیلات تا سقف 4 میلیارد تومان به مشاغل خانگی

حقوق پایه مدیرعامل انویدیا برای اولین‌بار از سال 2015 افزایش می‌یابد

آمیتاب باچان استودیوی بازیسازی می‌زند؛ بازی عصر بهارات برای کامپیوتر معرفی شد

زندگی یا نمایش زندگی!؟

چین و روسیه در آسمان به جنگ آمریکا می‌روند

کارشناس انرژی دلایل ناترازی بنزین را شرح داد

ماجرای آتش‌سوزی تاریخی در اسرائیل

سقوط مرگبار کودک 7 ساله از طبقه هفتم ساختمان

راز قتل دختر و پسر مفقود شده بر ملا شد

مشاغل غیر رسمی حدود 57 درصد بازار کار ایران را تشکیل می‌دهد

رونمایی از پشت پرده زندگی شخصی پوتین

چشمان بسته گمرک

سفر نتانیاهو به آذربایجان به تعویق افتاد

مرز تهران و البرز لرزید

وزش باد شدید در تهران آغاز شد

از فشار تا گفت‌وگو

تدارک رژیم صهیونیستی برای حمله گسترده به سوریه

بیشترین و کمترین موزه‌ها در کدام استان‌ها است؟

هویت 10 جان‌باخته دیگر حادثه انفجار بندر شهید رجایی شناسایی شد

روایتی از اولین پرواز روی آتش بندر شهید رجایی

تعویق در پرداخت وام ودیعه مسکن؛ تا شنبه امکان ثبت‌نام وجود ندارد

نان گران می‌شود؟

مصوباتی که در دولت رئیسی، پوچ از آب در آمد!

شناسایی باند کلاهبرداری مسکوکات طلا با کشف 595 سکه تقلبی

زلزله 4 ریشتری البرز و تهران را لرزاند

رد درخواست متقاضیان پروانه کسب بدون اعلام دلیل، جرم است

حراج شمش طلای مرکز مبادله فردا برگزار می‌شود

رم مجازی در One UI 8 سامسونگ تا 12 گیگابایت افزایش پیدا می‌کند

تصاویر قاب‌های سری آیفون 17 طراحی پرچمداران 2025 اپل را به‌نمایش می‌گذراند

هوش مصنوعی به ویکی پدیا هم رحم نکرد

بابک زنجانی در راه جاده مخصوص

ترامپ هزینه‌های دفاعی را بالا برد، اما بهداشت را کاهش داد

کشته شدن 2 نظامی صهیونیست در رفح

ادامه حملات هوایی رژیم صهیونیستی به جنوب لبنان

هشدار برای تهران؛ وزش باد شدید تا دقایقی دیگر

بانک‌هایی که چوب لای چرخ پرداخت تسهیلات قانونی می‌گذارند؛ دادگاهی می‌شوند

حمله هوایی اسرائیل به منطقه شیخ الزاید در شمال نوار غزه

واقعیت‌های تلخ از وضعیت پزشکی در کشور

تهران 6 درجه سردتر می‌شود؛ پیش‌بینی 3 روز ناپایداری جوی

مدل اگزینوس گلکسی S26 احتمالاً فقط در یک منطقه عرضه خواهد شد