تعلن Microsoft أن تقنية التعرف على الكلام تقلل من معدل الأخطاء لديها وهي فعالة مثل البشر
إنها إحدى الركائز التي يؤكد عليها الكثيرون أن المنصات المختلفة ستنمو في المستقبل القريب. لا شيء للتفاعل مع الأوامر أو الإيماءات المكتوبة.يكمن المستقبل في التحدث إلى الآلاتولكن لا تتحدث مع الأوامر الآلية والأوامر غير الطبيعية. سنفعل ذلك بلغة طبيعية ، وهو أمر نقدره أكثر فأكثر في المساعدين الشخصيين. "
وإحدى الشركات التي لديها مهنة بارزة بهذا المعنى هي Microsoft ، وهي شركة لديها مسار تطوير تعمل فيه على تحسين التعرف على صوت الموظفين باستمرار ثم على منصاتهم.تكنولوجيا لدينا الآن أخبار عنها من فريق التطوير ، أخبار تتحدث عنتحسين كبير يضعها على نفس مستوى الدقة مثل تلك المستخدمة بين البشر
بهذا المعنى ، أعلنوا أنوصل نظام التعرف على الصوت إلى 5.1٪ في WER، أي الخطأ في المعدل من الكلمة المستخدمة. بالنسبة للكثيرين ، قد لا يقول هذا شيئًا ، لكن من المدهش أن نرى كيف أن هذا المعدل من ناحيةهو نفس المعدل الذي نجده في التواصل بين الأشخاص
للقيام بذلك ، من Redmondلقد اختاروا الاستفادة من نماذج محسّنة للغة اللفظية والصوتية على أساس استخدام الشبكات العصبيةيتم دمجها مع ذاكرة ثنائية الاتجاه طويلة المدى بحيث يتم تحسين النمذجة الصوتية ، وبالتالي تحسين التعرف بفضل التنبؤ بالكلمات التي يمكن استخدامها بناءً على تاريخ الاتصال.تحظى هذه التحسينات أيضًا بدعم السحابة بفضل الجهود التي بذلتها الشركة لتحسين البنية التحتية للحوسبة السحابية ، خاصة مع Azure.
بالإضافة إلى ذلك ، هذا يعني أنقد تم تخفيض معدل الخطأ هذا من حيث هامش الفشل، منذ ما قبل كان في 5.9٪ ، وبالتالي انخفاض من 12٪ ، وهو الرقم الذي كان لدى النظام قبل أقل من عام. لذلك ، حققت Microsoft نظامًا فعالاً للتعرف على الكلام مثل نظام البشر ورؤية التقدم الذي يحرزونه ، فليس من المستغرب أنهم سيحسنونه في الأشهر أو السنوات القادمة.
من يدري ما إذا كان التحدث إلى جهاز الكمبيوتر الشخصي الذي يعمل بنظام Windows أو التفاعل مع Cortana أو تطبيقات مثل Office في غضون بضع سنوات من الآن سيكون شيئًا طبيعيًا مثل ما جعلنا نحلم بالفعل (أو لدينا كوابيس ، من يدري) في السينما.
في Xataka | إنها ليست أصواتًا من وراء القبر ، إنها أوامر خفية يتعرف عليها المساعدون الصوتيون ولا يتعرف عليها البشر