قابلیت گفتگوی زنده هوش مصنوعی جمینای گوگل بهبود یافت

خواندن این مطلب 2 دقیقه زمان میبرد

گوگل با معرفی هوش مصنوعی Gemini، تجربه گفتگو با دستیارهای صوتی را بسیار طبیعی‌تر از دوران Google Assistant کرد. اما این فناوری هنوز جای پیشرفت دارد. در همین راستا، گوگل امروز آپدیت مهمی را برای مدل Gemini 2.5 Flash Native Audio منتشر کرد که تمرکز اصلی آن بر بهبود گفتگوی زنده جمینای و رفع برخی از آزاردهنده‌ترین مشکلات تعامل صوتی است.

محتوا پنهان

1 خلاصه و نکات کلیدی

2 سه محور اصلی آپدیت جدید چیست؟

2.1 ۱. فراخوانی دقیق‌تر توابع (Sharper Function Calling)

2.2 ۲. پیروی بهتر از دستورات

2.3 ۳. گفتگوهای روان‌تر

3 حل مشکل «پریدن وسط حرف» کاربر

4 دسترسی و پلتفرم‌ها

4.1 نظر شما چیست؟

4.2 سایر نوشته‌های پیشنهادی

خلاصه و نکات کلیدی

🔹بهبود قابلیت فراخوانی توابع (Function Calling) برای دریافت دقیق‌تر اطلاعات لحظه‌ای بدون قطع جریان مکالمه.
🔹افزایش دقت مدل در پیروی از دستورات پیچیده به نرخ ۹۰ درصد.
🔹حل مشکل قطع کردن صحبت کاربر؛ جمینای اکنون هنگام مکث‌های طولانی وسط جمله، صبر می‌کند.
🔹اضافه شدن قابلیت قطع میکروفون (Mute) هنگام صحبت کردن جمینای برای جلوگیری از تداخل ناخواسته.
🔹انتشار آپدیت برای سرویس‌های Gemini Live، Search Live و Google AI Studio.

سه محور اصلی آپدیت جدید چیست؟

گوگل در این به‌روزرسانی که برای مدل صوتی جمینای ۲.۵ فلش عرضه شده، روی سه حوزه کلیدی تمرکز کرده است تا تعامل کاربر با هوش مصنوعی روان‌تر شود:

۱. فراخوانی دقیق‌تر توابع (Sharper Function Calling)

قابلیت اطمینان جمینای در استفاده از ابزارهای خارجی افزایش یافته است. اکنون این هوش مصنوعی بهتر تشخیص می‌دهد که چه زمانی باید در حین گفتگو به دنبال اطلاعات آنلاین و لحظه‌ای (Real-time) بگردد. نکته مهم اینجاست که جمینای این داده‌ها را به‌صورت یکپارچه در پاسخ صوتی خود می‌گنجاند، بدون اینکه وقفه آزاردهنده‌ای در جریان مکالمه ایجاد شود.

۲. پیروی بهتر از دستورات

دقت مدل در اجرای دستورات توسعه‌دهندگان و کاربران بهبود چشمگیری داشته است. طبق آمار گوگل، نرخ پیروی از دستورات از ۸۴٪ در نسخه قبلی به ۹۰٪ در نسخه جدید رسیده است. این یعنی جمینای اکنون در مدیریت دستورالعمل‌های پیچیده و ارائه خروجی‌های قابل‌اعتماد، توانمندتر شده است.

۳. گفتگوهای روان‌تر

مدل جدید اکنون قدرت بیشتری در به یاد آوردن و بازیابی محتوای بخش‌های قبلی مکالمه دارد. این ویژگی باعث می‌شود گفتگوها منسجم‌تر باشند و هوش مصنوعی درک بهتری از روند کلی بحث پیدا کند.

حل مشکل «پریدن وسط حرف» کاربر

علاوه بر بهبودهای فنی، «جاش وودوارد»، معاون بخش Google labs، از دو ویژگی کاربردی دیگر برای تجربه کاربری (UX) خبر داد که مستقیماً روی بهبود گفتگوی زنده جمینای تأثیر می‌گذارند:

نام ویژگی	مشکل قبلی	راهکار جدید
صبر هوشمند	قطع صحبت کاربر هنگام مکث برای تفکر	جمینای دیگر وسط جمله شما نمی‌پرد و هنگام مکث‌های طولانی صبر می‌کند.
کنترل میکروفون	تداخل صدای محیط یا کاربر با صحبت‌های جمینای	امکان قطع میکروفون (Mute) هنگام صحبت کردن هوش مصنوعی فراهم شده است.

دسترسی و پلتفرم‌ها

گوگل اعلام کرده است که هدف نهایی این به‌روزرسانی، توانمندسازی مدل برای مدیریت گردش کارهای پیچیده و ارائه مکالماتی با حس انسانی است. این آپدیت هم‌اکنون برای پلتفرم‌های زیر در حال انتشار است:

سرویس Gemini Live
جستجوی زنده (Search Live)
استودیوی هوش مصنوعی گوگل (Google AI Studio)
پلتفرم Vertex AI

نظر شما چیست؟

با این آپدیت، گوگل نشان داد که تنها به دنبال افزایش قدرت پردازشی نیست، بلکه به ظرافت‌های تعامل انسانی نیز اهمیت می‌دهد. حل مشکل قطع کردن صحبت کاربر و افزایش درک متقابل، گام بزرگی برای تبدیل کردن جمینای از یک «ماشین پاسخگو» به یک «هم‌صحبت هوشمند» است.

گوگل چگونه وب‌گردی هوشمند با جمینای را امن می‌کند؟

نظر شما چیست؟ شما چقدر از قابلیت Live هوش مصنوعی جمینای استفاده می‌کنید؟

Source link

تیم تحریریه ایران مگ 6 ساعت پیش

خواندن این مطلب 2 دقیقه زمان میبرد

قابلیت گفتگوی زنده هوش مصنوعی جمینای گوگل بهبود یافت

خلاصه و نکات کلیدی

سه محور اصلی آپدیت جدید چیست؟

۱. فراخوانی دقیق‌تر توابع (Sharper Function Calling)

۲. پیروی بهتر از دستورات

۳. گفتگوهای روان‌تر

حل مشکل «پریدن وسط حرف» کاربر

دسترسی و پلتفرم‌ها

نظر شما چیست؟

تیم تحریریه ایران مگ

نشانه‌های حیات سهام اپل در وال استریت

ناسا قصد دارد نشت فضاپیمای مریخ را تعمیر کند و سپس فضاپیما را در سال 2018 به فضا پرتاب کند

Spieth در خطر ناپدید شدن

خلاصه و نکات کلیدی

سه محور اصلی آپدیت جدید چیست؟

۱. فراخوانی دقیق‌تر توابع (Sharper Function Calling)

۲. پیروی بهتر از دستورات

۳. گفتگوهای روان‌تر

حل مشکل «پریدن وسط حرف» کاربر

دسترسی و پلتفرم‌ها

نظر شما چیست؟

سایر نوشته‌های پیشنهادی

تیم تحریریه ایران مگ

Subscribe to our mailing list to get the new updates!

نوشته های مشابه

توانایی‌های نویدبخش مدل هوش مصنوعی «GPT 5.2»

احتمال عرضه هم‌زمان شیائومی ۲۰ و آیفون ۲۰؛ حذف سری ۱۹ در سال ۲۰۲۷

مرکز فروش قطعات کامپیوتر در کرج

انتشار اولین آپدیت هواوی میت ۸۰؛ ویژگی‌های جدید دوربین و اتصال به آیفون

نشانه‌های حیات سهام اپل در وال استریت

ناسا قصد دارد نشت فضاپیمای مریخ را تعمیر کند و سپس فضاپیما را در سال 2018 به فضا پرتاب کند

Spieth در خطر ناپدید شدن