سماعات ثورية تترجم عدة متحدثين في وقت واحد

سماعات ثورية تترجم عدة متحدثين في وقت واحد


طوّر باحثون في جامعة واشنطن بالولايات المتحدة نظاماً متقدماً لسماعات الرأس قادراً على ترجمة حديث عدة أشخاص في الوقت ذاته، مع الحفاظ على طبيعة أصواتهم واتجاهاتها أثناء الحوار، حتى في حال تحركهم داخل المكان.
ويحمل الابتكار اسم "ترجمة الكلام المكانية" "Spatial Speech Translation"، ويعتمد على سماعات رأس مزودة بخاصية إلغاء الضوضاء وميكروفونات مدمجة، إلى جانب خوارزميات ذكية تفصل بين المتحدثين وتتعرف على مواقعهم.
وأوضح الأستاذ شيام غولاكوتا، من قسم علوم الحاسوب والهندسة بالجامعة، أن معظم تقنيات الترجمة الحالية تفترض وجود متحدث واحد فقط، ما يؤدي إلى صوت آلي موحد لا يعكس تعدد الأشخاص أو اتجاهاتهم. وأضاف: "لأول مرة، أصبح بإمكاننا الحفاظ على طابع صوت كل متحدث واتجاهه ضمن المجموعة".
ويقدم النظام ثلاث ميزات رئيسية:
رصد المتحدثين تلقائياً: يكتشف عدد الأشخاص في أي مساحة، داخلية كانت أم خارجية، عبر مسح بزاوية 360 درجة.
الترجمة الفورية: يعيد تشغيل الحديث مترجماً بعد تأخير قصير يتراوح بين ثانيتين وأربع ثوانٍ، مع الحفاظ على التعبير الصوتي ومستوى الصوت الأصلي لكل متحدث.
تتبع ديناميكي للصوت: يتابع النظام حركة رؤوس المتحدثين، ويتكيف مع التغيرات في اتجاه الصوت وخصائصه أثناء الحديث.
وقال توتشاو تشين، الباحث الرئيسي المشارك وطالب الدكتوراة في الجامعة، إن النظام يعمل بطريقة شبيهة بالرادار، ويقوم بمسح وتحليل البيئة المحيطة بشكل دائم لتحديد مواقع المتحدثين بدقة.