ينشئ Microsoft Research نظامًا قادرًا على إنشاء تسميات توضيحية "ذكية" تلقائيًا

جدول المحتويات:
من المؤكد أنك صادفت تعليقًا محيرًا أو غير صحيح أو يقول القليل عن الصورة التي يشير إليها ؛ ومن الممكن أيضًا ، إذا كرست نفسك لنشر مقالاتك الخاصة ، أن تجد أنهمملةلملء هذا القسم. حسنًا ، أنشأ الأشخاص من ريدموند أداة تهدف إلى تسهيل الأمور عليك.
عمل نشرته شركة Microsoft Research يصف نفسه بأنه "نظام إنشاء تسميات توضيحية" قادر على محاكاة الخصائص السردية للغة البشرية ، أي تقنية يمكنها وصف لقطات الشاشة كما لو كانت تخص واحدًا منا ، مع سياقها المقابل.شيء عملت عليه شركات مثل Facebook و Microsoft و Google لبعض الوقت ، لكنه تجاوز التوقعات هذه المرة.
مما تتكون
بهذه الطريقة ، فإنsystemلديه القدرة حتى على سرد قصة كاملة من عدة صور ، ووصفها وإخبارها كما لو كان كتابا. أداة يمكن أن تصبح ، وفقًا للخبراء ، ميزة توفر لمسة إنسانية أكثر لتطبيقات معينة ، وتطبيقات التعرف على الصوت ، وتوليد الأوصاف تلقائيًا في مناطق أخرى وأكثر من ذلك بكثير.
والحقيقة هي أنالأداةلا تقتصر على قول ما "تراه" بإيجاز ، بل توفر نطاقًا أوسع سياق الموقف الذي ينعكس في الصورة ، وتحقيق "سياق سردي وأسلوب فريد للسرد" ، أوضح فرانك فيرارو ، أحد مؤلفي هذا العمل.لوضع أنفسنا في موقف ما ، فهو يعطينامثال
هكذا ،نقترحالحالة التالية: "لنتخيل أن لدينا ألبوم صور لبعض الأصدقاء الذين احتفلوا بعيد ميلادهم في حانة. يُظهر بعض الصور الأولى أشخاصًا يطلبون الجعة ويشربونها ، بينما تُظهر الصور الأخيرة شخصًا نائمًا على أريكة "، كما يعلق.
النظام التقليدي "يمكن ببساطة أن يشير إلى شيء مثل وجود شخص مستلق على الأريكة ، في حين أن نظامنا يمكن أن يتضمن أنه ربما يكون في هذا الموقف لأنهم في حالة سكر بعد تناول القليل من المشروبات". إضافة توفرفهموشحنة عاطفية معينة تنعكس أيضًا من خلال الصور والتعليقات التوضيحية للصور المدرجة في هذه المقالة.
عبر | MIT Technology Review
في Xataka Windows | أطلقت Microsoft تطبيقًا يحدد سلالة كلبك