انسان

پربازدیدترین‌ها

انقلابی در ارزیابی هوش مصنوعی: رضایت انسان، معیار نهایی

مدیرعامل انویدیا: هوش مصنوعی می‌تواند مشغله انسان را در آینده افزایش دهد

انقلابی در ارزیابی هوش مصنوعی: رضایت انسان، معیار نهایی

عامل‌های هوش مصنوعی که با مدل‌های زبان بزرگ (LLM) کار می‌کنند، به سرعت در حال تبدیل شدن به ابزاری قدرتمند هستند. اما چگونه می‌توانیم بفهمیم کدام‌یک واقعاً برای کاربران مفید است؟ تاکنون، ارزیابی این عامل‌ها بیشتر بر اساس بنچمارک‌های خودکار بوده است که عملکرد آن‌ها را در حالت کاملاً مستقل می‌سنجد، در حالی که در دنیای واقعی، تعامل با انسان بخش مهمی از کار آن‌هاست.

به گزارش پایگاه اطلاع رسانی جاده مخصوص، پژوهشگران برای حل این مشکل، یک چارچوب جدید و کارآمد برای ارزیابی انسان-محور به نام PULSE ارائه کرده‌اند. این چارچوب با جمع‌آوری بازخورد مستقیم از کاربران، آموزش یک مدل یادگیری ماشین برای پیش‌بینی رضایت آن‌ها و ترکیب نتایج انسانی با برچسب‌های تولیدشده توسط مدل، به ارزیابی دقیق‌تری دست می‌یابد.

این تیم تحقیقاتی، چارچوب PULSE را بر روی یک پلتفرم بزرگ مبتنی بر عامل نرم‌افزاری متن‌باز OpenHands با بیش از ۱۵ هزار کاربر پیاده‌سازی کرد. آن‌ها تأثیر تصمیمات کلیدی در طراحی عامل‌ها، مانند انتخاب مدل هوش مصنوعی (مثلاً مقایسه claude-sonnet-4 و gpt-5)، استراتژی برنامه‌ریزی و مکانیزم‌های حافظه را بر میزان رضایت توسعه‌دهندگان بررسی کردند.

نتایج این مطالعه نشان داد که تفاوت‌های قابل توجهی بین عملکرد عامل‌ها در دنیای واقعی و نتایج بنچمارک‌های استاندارد وجود دارد. این یافته‌ها بر محدودیت‌های ارزیابی‌های مبتنی بر بنچمارک تأکید می‌کند و راهنمایی‌های عملی برای طراحی عامل‌های هوش مصنوعی بهتر و کاربرپسندتر ارائه می‌دهد.

مدیرعامل انویدیا: هوش مصنوعی می‌تواند مشغله انسان را در آینده افزایش دهد

برخی می‌گویند هوش مصنوعی می‌تواند حجم کارها را کمتر کند، اما مدیرعامل انویدیا باور دارد در آینده کارهای زیادی برای انجام دادن خواهیم داشت.رحالی‌که بسیاری از مدیران حوزه فناوری معتقدند هوش مصنوعی باعث بیکاری بسیاری از شاغلین خواهد شد، اما «جنسن هوانگ»، مدیرعامل انویدیا، معتقد است که این فناوری می‌تواند حتی باعث افزایش مشغله‌های ما در آینده شود.

به گزارش پایگاه اطلاع رسانی جاده مخصوص هوانگ که در برنامه Fox Business حضور یافته بود، درباره بحث جنجالی فروش تراشه به چین، موفقیت انویدیا به‌عنوان یک شرکت ۴ تریلیون دلاری و احتمال ترکیدن حباب هوش مصنوعی صحبت کرد. مدیرعامل انویدیا همچنین درباره پروژه Jetson Thor و اینکه چگونه رباتیک ممکن است روش زندگی ما در آینده را متحول کند جزئیاتی ارائه نمود.

مدیرعامل انویدیا دیدگاه مثبتی درباره تأثیر هوش مصنوعی روی آینده بشریت دارد

جنسن هوانگ در پاسخ به سؤال مجری درباره آینده ربات‌ها گفت ربات‌ها در همه‌جا حضور خواهند داشت و هر چیزی که حرکت کند در آینده رباتیک خواهد بود. او افزود: «ربات‌های انسان‌نما و چندمنظوره خواهیم داشت. انواع مختلف سیستم‌های رباتیک را می‌بینیم. آنها در بیمارستان‌ها جراحی رباتیک انجام می‌دهند، در کارخانه‌ها به ساخت محصولات مشغول خواهند شد و در مزارع کشاورزی کار انجام خواهند داد. واقعاً تعداد سیستم‌های رباتیک شگفت‌آور است.»

اما سؤالات بعدی مجری درباره هوش مصنوعی و تأثیر آن روی میزان مشغله انسان و کاهش تعداد روزهای کاری بود. مجری برنامه Fox Business از جنسن هوانگ پرسید: «آیا خواهیم دید که کشورها به هفته کاری ۴ روزه روی بیاورند، چون افزایش بهره‌وری ناشی از هوش مصنوعی بسیار معنی‌دار بوده است؟ آیا چت‌بات‌ها تبدیل به دوستان مردم می‌شوند و اپلیکیشن‌های دوست‌یابی از بین می‌روند؟ به نظر شما چشم‌اندازهای آینده چیست؟»

هوانگ در پاسخ به این پرسش‌ها گفت: «باید اعتراف کنم که می‌ترسم بگویم در آینده مشغول‌تر از الان خواهیم بود؛ زیرا بسیاری کارها که انجام آنها زمان زیادی می‌برد، اکنون سریع‌تر انجام می‌شوند و من همیشه منتظر تمام‌شدن کارها هستم؛ چون ایده‌های بیشتری دارم. پس هرچه پربازده‌تر شویم، فرصت بیشتری خواهیم داشت تا به‌سراغ ایده‌های جدید برویم. من انتظار دارم GDP رشد کند. انتظار دارم بهره‌وری افزایش یابد. حقیقت این است که انتظار دارم کارهای بیشتری برای انجام‌دادن داشته باشیم.»

البته مدیرعامل انویدیا گفت امیدوار است انسان‌ها در آینده هفته‌های کاری کوتاه‌تر چهار روزه داشته باشند. او ابراز امیدواری کرد که مردم بتوانند آخر هفته‌ها زمان بیشتری را با خانواده سپری کنند و سفر بروند یا کتاب بخوانند.

ایده کوتاه‌تر شدن هفته‌های کاری در نتیجه هوش مصنوعی اخیراً توسط افرادی مانند بیل گیتس و ایلان ماسک نیز مطرح شده است. گیتس اخیراً گفته بود که هوش مصنوعی حتی می‌تواند هفته‌های کاری را به ۲ روز کاهش دهد.