قابلیت گفتگوی زنده هوش مصنوعی جمینای گوگل بهبود یافت

گوگل با معرفی هوش مصنوعی Gemini، تجربه گفتگو با دستیارهای صوتی را بسیار طبیعیتر از دوران Google Assistant کرد. اما این فناوری هنوز جای پیشرفت دارد. در همین راستا، گوگل امروز آپدیت مهمی را برای مدل Gemini 2.5 Flash Native Audio منتشر کرد که تمرکز اصلی آن بر بهبود گفتگوی زنده جمینای و رفع برخی از آزاردهندهترین مشکلات تعامل صوتی است.
خلاصه و نکات کلیدی
- 🔹بهبود قابلیت فراخوانی توابع (Function Calling) برای دریافت دقیقتر اطلاعات لحظهای بدون قطع جریان مکالمه.
- 🔹افزایش دقت مدل در پیروی از دستورات پیچیده به نرخ ۹۰ درصد.
- 🔹حل مشکل قطع کردن صحبت کاربر؛ جمینای اکنون هنگام مکثهای طولانی وسط جمله، صبر میکند.
- 🔹اضافه شدن قابلیت قطع میکروفون (Mute) هنگام صحبت کردن جمینای برای جلوگیری از تداخل ناخواسته.
- 🔹انتشار آپدیت برای سرویسهای Gemini Live، Search Live و Google AI Studio.

سه محور اصلی آپدیت جدید چیست؟
گوگل در این بهروزرسانی که برای مدل صوتی جمینای ۲.۵ فلش عرضه شده، روی سه حوزه کلیدی تمرکز کرده است تا تعامل کاربر با هوش مصنوعی روانتر شود:
۱. فراخوانی دقیقتر توابع (Sharper Function Calling)
قابلیت اطمینان جمینای در استفاده از ابزارهای خارجی افزایش یافته است. اکنون این هوش مصنوعی بهتر تشخیص میدهد که چه زمانی باید در حین گفتگو به دنبال اطلاعات آنلاین و لحظهای (Real-time) بگردد. نکته مهم اینجاست که جمینای این دادهها را بهصورت یکپارچه در پاسخ صوتی خود میگنجاند، بدون اینکه وقفه آزاردهندهای در جریان مکالمه ایجاد شود.
۲. پیروی بهتر از دستورات
دقت مدل در اجرای دستورات توسعهدهندگان و کاربران بهبود چشمگیری داشته است. طبق آمار گوگل، نرخ پیروی از دستورات از ۸۴٪ در نسخه قبلی به ۹۰٪ در نسخه جدید رسیده است. این یعنی جمینای اکنون در مدیریت دستورالعملهای پیچیده و ارائه خروجیهای قابلاعتماد، توانمندتر شده است.
۳. گفتگوهای روانتر
مدل جدید اکنون قدرت بیشتری در به یاد آوردن و بازیابی محتوای بخشهای قبلی مکالمه دارد. این ویژگی باعث میشود گفتگوها منسجمتر باشند و هوش مصنوعی درک بهتری از روند کلی بحث پیدا کند.
حل مشکل «پریدن وسط حرف» کاربر
علاوه بر بهبودهای فنی، «جاش وودوارد»، معاون بخش Google labs، از دو ویژگی کاربردی دیگر برای تجربه کاربری (UX) خبر داد که مستقیماً روی بهبود گفتگوی زنده جمینای تأثیر میگذارند:
| نام ویژگی | مشکل قبلی | راهکار جدید |
|---|---|---|
| صبر هوشمند | قطع صحبت کاربر هنگام مکث برای تفکر | جمینای دیگر وسط جمله شما نمیپرد و هنگام مکثهای طولانی صبر میکند. |
| کنترل میکروفون | تداخل صدای محیط یا کاربر با صحبتهای جمینای | امکان قطع میکروفون (Mute) هنگام صحبت کردن هوش مصنوعی فراهم شده است. |
دسترسی و پلتفرمها
گوگل اعلام کرده است که هدف نهایی این بهروزرسانی، توانمندسازی مدل برای مدیریت گردش کارهای پیچیده و ارائه مکالماتی با حس انسانی است. این آپدیت هماکنون برای پلتفرمهای زیر در حال انتشار است:
- سرویس Gemini Live
- جستجوی زنده (Search Live)
- استودیوی هوش مصنوعی گوگل (Google AI Studio)
- پلتفرم Vertex AI
نظر شما چیست؟
با این آپدیت، گوگل نشان داد که تنها به دنبال افزایش قدرت پردازشی نیست، بلکه به ظرافتهای تعامل انسانی نیز اهمیت میدهد. حل مشکل قطع کردن صحبت کاربر و افزایش درک متقابل، گام بزرگی برای تبدیل کردن جمینای از یک «ماشین پاسخگو» به یک «همصحبت هوشمند» است.
گوگل چگونه وبگردی هوشمند با جمینای را امن میکند؟
نظر شما چیست؟ شما چقدر از قابلیت Live هوش مصنوعی جمینای استفاده میکنید؟
بفرست برای دوستات


