شارك الخبر عبر:

طوّر باحثون في جامعة واشنطن بالولايات المتحدة نظاماً متقدماً لسماعات الرأس قادراً على ترجمة حديث عدة أشخاص في الوقت ذاته، مع الحفاظ على طبيعة أصواتهم واتجاهاتها أثناء الحوار، حتى في حال تحركهم داخل المكان.

إقرأ أيضا:

من “دمية لابوبو” إلى لعنة رقمية؟ كيف تحوّلت أيقونة الطفولة إلى ظاهرة عالمية مثيرة للجدل؟

ترامب يثير الجدل بفيديو ذكاء اصطناعي يُظهر اعتقال أوباما: حملة سياسية أم تحريض؟

رحيل نجم “المهمة المستحيلة” توم تروب عن 97 عاماً: مسيرة حافلة بين برودواي وهوليوود

فضل شاكر يرد على شائعات تسليم نفسه: “لن أخضع إلا لمحاكمة عادلة” ويواصل النجاح الفني

سيرين عبد النور تنتقد العالم:وتفتح النار على الإعلام ..انتقاد لاذع للنفاق الإعلامي

راغب علامة يوضح حقيقة فيديو الحفل المثير للجدل..و يوجه رسالة خاصة لمصطفى كامل

شيرين عبدالوهاب تستعيد حساباتها الرسمية بعد صلح مفاجئ أنهى أزمة الابتزاز الإلكتروني

إيقاف راغب علامة عن الغناء في مصر واستدعاؤه للتحقيق: “سلوك لا يليق بمسارح أم كلثوم وعبد الوهاب

ما علاقة نجم سهيل بانكسار حرارة الصيف؟

فيديو صادم أشعل مواقع التواصل..حجز البلوغر هدير عبدالرازق بتهمة التعدي على قيم المجتمع

 

ويحمل الابتكار اسم “ترجمة الكلام المكانية” (Spatial Speech Translation)، ويعتمد على سماعات رأس مزودة بخاصية إلغاء الضوضاء وميكروفونات مدمجة، إلى جانب خوارزميات ذكية تفصل بين المتحدثين وتتعرف على مواقعهم.

 

وأوضح الأستاذ شيام غولاكوتا، من قسم علوم الحاسوب والهندسة بالجامعة، أن معظم تقنيات الترجمة الحالية تفترض وجود متحدث واحد فقط، ما يؤدي إلى صوت آلي موحد لا يعكس تعدد الأشخاص أو اتجاهاتهم. وأضاف: “لأول مرة، أصبح بإمكاننا الحفاظ على طابع صوت كل متحدث واتجاهه ضمن المجموعة”.

ويقدم النظام ثلاث ميزات رئيسية:

رصد المتحدثين تلقائياً: يكتشف عدد الأشخاص في أي مساحة، داخلية كانت أم خارجية، عبر مسح بزاوية 360 درجة.

الترجمة الفورية: يعيد تشغيل الحديث مترجماً بعد تأخير قصير يتراوح بين ثانيتين وأربع ثوانٍ، مع الحفاظ على التعبير الصوتي ومستوى الصوت الأصلي لكل متحدث.

تتبع ديناميكي للصوت: يتابع النظام حركة رؤوس المتحدثين، ويتكيف مع التغيرات في اتجاه الصوت وخصائصه أثناء الحديث.

وقال توتشاو تشين، الباحث الرئيسي المشارك وطالب الدكتوراه في الجامعة، إن النظام يعمل بطريقة شبيهة بالرادار، ويقوم بمسح وتحليل البيئة المحيطة بشكل دائم لتحديد مواقع المتحدثين بدقة.

 

ويعمل النظام حالياً على أجهزة مثل Apple Vision Pro، وأجهزة الكمبيوتر المحمولة المزودة بشريحة Apple M2، دون الحاجة إلى الحوسبة السحابية، وهو خيار اتخذه الفريق لحماية الخصوصية ومنع إساءة استخدام تقنيات استنساخ الصوت.

 

وأثبت النظام فعاليته في اختبارات شملت 10 بيئات مختلفة داخلية وخارجية، كما أبدى 29 مشاركاً تفضيلهم لهذا الابتكار، مقارنة بنماذج لا تتيح تتبع المتحدثين.

شارك الخبر عبر:

قد يعجبك أيضا

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *