العلوم والذكاء الاصطناعي

جوجل تطلق نظام ترجمة صوتية فورية يدعم أكثر من 70 لغة ويحاكي الحديث الطبيعي

كشفت Google⁠ عن نموذجها الجديد Gemini 3.5 Live Translate، الذي يتيح ترجمة صوتية فورية بين أكثر من 70 لغة، في خطوة تهدف إلى جعل التواصل بين المتحدثين بلغات مختلفة أكثر سلاسة وطبيعية

كشفت Google⁠ عن نموذجها الجديد Gemini 3.5 Live Translate، الذي يتيح ترجمة صوتية فورية بين أكثر من 70 لغة، في خطوة تهدف إلى جعل التواصل بين المتحدثين بلغات مختلفة أكثر سلاسة وطبيعية.

ويعتمد النظام الجديد على تقنيات الذكاء الاصطناعي لتقديم ترجمة شبه لحظية أثناء الحديث، مع الحفاظ على نبرة الصوت الأصلية وإيقاع الكلام وطريقة التعبير، ما يمنح المستخدمين تجربة أقرب إلى المحادثة المباشرة دون الشعور بوجود وسيط تقني.

ويتميز النموذج بقدرته على التعرف تلقائياً على اللغة المستخدمة دون الحاجة إلى إعدادات مسبقة، كما يواصل ترجمة الحديث بشكل متزامن أثناء الحوار، بدلاً من انتظار انتهاء المتحدث من جملته كما هو الحال في العديد من أنظمة الترجمة التقليدية.

وأكدت جوجل أن التقنية الجديدة صُممت لتحقيق توازن بين سرعة الاستجابة ودقة الترجمة، بما يسمح بنقل الكلام إلى اللغة المستهدفة خلال ثوانٍ معدودة مع الحفاظ على انسيابية الحوار وتقليل فترات التوقف.

وبدأت الشركة توفير النموذج عبر عدد من خدماتها ومنصاتها، حيث أصبح متاحاً للمطورين من خلال Gemini Live API و Google AI Studio⁠، كما يجري دمجه تدريجياً في خدمات الاجتماعات والتواصل التابعة للشركة، إضافة إلى إتاحته للمستخدمين عبر تطبيق Google Translate⁠ على أنظمة أندرويد وiOS.

وتتوقع جوجل أن يسهم النظام الجديد في تطوير العديد من الاستخدامات العملية، مثل الترجمة الفورية للمكالمات الهاتفية والاجتماعات الدولية والمحاضرات التعليمية والبث المباشر وخدمات العملاء، إلى جانب دعم البيئات المهنية التي تتطلب تواصلاً فورياً بين أشخاص يتحدثون لغات مختلفة.

كما بدأت عدة شركات ومنصات تقنية في دمج التقنية داخل خدماتها، بهدف تطوير حلول جديدة للترجمة الفورية والتواصل متعدد اللغات، خاصة في القطاعات التي تعتمد بشكل كبير على المحادثات الصوتية المباشرة.

وفي إطار تحسين تجربة المستخدم، أضافت جوجل أيضاً ميزة جديدة داخل تطبيق الترجمة تتيح الاستماع إلى الترجمة مباشرة عبر سماعة الهاتف بطريقة مشابهة للمكالمات التقليدية، ما يوفر مستوى أكبر من الخصوصية والراحة أثناء الاستخدام.

وأكدت الشركة أنها تواصل تطبيق إجراءات الحماية المرتبطة بالمحتوى المُنشأ بالذكاء الاصطناعي، حيث تُرفق جميع المقاطع الصوتية المنتجة بواسطة نماذجها بعلامات رقمية غير مرئية تعتمد على تقنية SynthID، بهدف تسهيل التحقق من مصدر المحتوى والحد من مخاطر التلاعب أو التضليل الرقمي.

ويُنظر إلى Gemini 3.5 Live Translate باعتباره أحد أبرز التطورات الحديثة في مجال الترجمة الآنية، مع اقتراب تقنيات الذكاء الاصطناعي من إزالة الحواجز اللغوية وجعل التواصل العالمي أكثر سهولة وفاعلية

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى