المعايير: ما هو؟ ما هو التاريخ والأنواع والنصائح

جدول المحتويات:

التاريخ
أنواع المعايير
اعتبارات عند قياس الأداء
الخلاصة

تعد المقاييس جزءًا أساسيًا من تحليل الأجهزة اليومي ، فهي تتيح لنا أن نقدم لك قياسًا قابلاً للمقارنة علمياً بين المكونات المختلفة مثل وحدات المعالجة المركزية ، وبطاقات الجرافيكس ، ووحدات التخزين ، وما إلى ذلك. اليوم سنخصص بعض الخطوط لتاريخها ، ولأنواعها ، وكيفية عملها ، وما يقيسونه ، وما هي التدابير الأكثر شيوعًا ، وسنقدم لك أيضًا بعض النصائح حول كيفية تنفيذها وأيها يجب أن نثق به.

ما نعرفه اليوم في عالم الكمبيوتر الشخصي أو الهاتف المحمول كمعايير هو تقنيات موروثة من البيئة الصناعية التي سمحت ، منذ بداية هذه الثورة ، باتخاذ القرار بناءً على بيانات قابلة للمقارنة في بيئة خاضعة للرقابة.

يطبق عالم الحوسبة الحديثة هذه التقنيات تقريبًا على أي من نطاقاته المختلفة العديدة ، كما اعتمدها المستخدمون المنزليون أيضًا كوسيلة موثوقة للتعرف على أداء وقدرات أنظمتنا بالإضافة إلى نقطة مهمة من المعلومات عندما لاتخاذ قرارات مهمة ، مثل شراء جهاز الكمبيوتر الجديد ، والهاتف المحمول ، وبطاقة الجرافيكس ، وما إلى ذلك.

سنتحدث اليوم عن تاريخ معايير الكمبيوتر الشخصي ، وأنواع المعايير الموجودة ، ومكونات نظامنا الأكثر ملاءمة لهذا النوع من الاختبارات التي ليست مجرد أداء.

فهرس المحتويات

التاريخ

يطبق المعيار أو نظام القياس بيئة خاضعة للرقابة وتدابير يمكن التعرف عليها قابلة للمقارنة علمياً ويمكن التحقق منها وتعايشت مع عالم الكمبيوتر منذ وجوده. لقد تم إضفاء الطابع الديمقراطي على المعيار ، على هذا النحو ، إلى درجة فقدان جزء من جوهره الأساسي ، وهو أنه يمكن أن يكون قابلاً للتدقيق والتحقق من قبل أطراف ثالثة. الآن نستخدمه أكثر كمقارنة سريعة للأداء ، ولكن من المؤكد أن إمكانية تتبعه من قبل أطراف ثالثة قد فقدت إلى حد كبير.

لطالما أشارت الطرق المعيارية الأكثر كلاسيكية إلى سعة الحوسبة لوحدة المعالجة المركزية للنظام ، على الرغم من اختلافها في الآونة الأخيرة بين المكونات المختلفة ، حيث اكتسبت هذه الغالبية والأهمية داخل جهاز الكمبيوتر.

وحدتا القياس الأكثر كلاسيكية التي لا تزال مطبقة هما Dhrystones و Whetstones. لقد أصبح كلاهما ، بطريقة أو بأخرى ، أساسًا لجميع المعايير الاصطناعية التي نعرفها اليوم.

الأقدم هي Whetstones (مكان في المملكة المتحدة حيث يوجد قسم الطاقة الذرية لشركة الطاقة في المملكة المتحدة) وجاء Dhrystone لاحقًا باسم الأول (الرطب والجاف).

تم تصميم الأول في السبعينيات والثاني من الثمانينيات وكلاهما أساس الأداء المقارن الذي حققناه في السنوات المتتالية. عرضت شحذ الأحجار ، المبسطة ، نظرة ثاقبة على قوة الحوسبة للمعالج في عمليات النقطة العائمة ، والعمليات بأعداد كبيرة من الكسور العشرية.

Dhrystone هو نظيره لأنه مخصص للتعليمات الأساسية بدون الكسور العشرية ، وكلاهما أعطى صورة واضحة لأداء المعالج من نهجين مختلفين تمامًا ، ولكن مكملين. تم استخلاص الأحجار و Dhrystone من مفهومين نستخدمهما بشكل أكثر شيوعًا اليوم ، MIPS و FLOP.

بعد هذه القياسات جاء آخرون مثل FLOP ( حساب الفاصلة العائمة - حساب الفاصلة العائمة) وهو ، إلى حد كبير ، أكثر أهمية الآن في الكمبيوتر مما كان عليه في أي وقت مضى لأنه أساس الحساب المتقدم في العديد من التقنيات الحديثة. مثل خوارزميات الذكاء الاصطناعي والخوارزميات الطبية والتنبؤ بالطقس والمنطق الضبابي والتشفير وما إلى ذلك.

تم تطوير LINPACK من قبل المهندس Jack Dongarra في الثمانينيات ويستمر استخدامه اليوم لقياس سعة الحوسبة العائمة لجميع أنواع الأنظمة. يوجد حاليًا إصدارات محسنة حسب الهندسة ، الشركة المصنعة لوحدة المعالجة المركزية ، إلخ.

يملأ FLOPS مقالاتنا على بطاقات الجرافيكس (من المؤكد أن الدقة المفردة أو المزدوجة تبدو مألوفة) والمعالجات وهي أساس حساب متطلبات الطاقة وتطوير الأجهزة لأي كمبيوتر فائق قيد التشغيل أو التطوير.

يعد FLOP اليوم أكثر وحدات قياس الأداء المطلوبة في الصناعة ، ولكن تم دمجه دائمًا مع MIPS (ملايين التعليمات في الثانية) وهو مقياس قياس مثير للاهتمام ، نظرًا لأنه يعطينا عدد التعليمات الحساب الأساسي الذي يمكن للمعالج أن يؤديه في الثانية ، لكن هذا يعتمد على بنية المعالج (ARM ، RISC ، x86 ، إلخ) ولغة البرمجة أكثر من وحدات القياس الأخرى.

كما تقدم الأداء حدث مضاعفات. نقيس الآن أداء وحدات المعالجة المركزية المنزلية في GIPS و GFLOPS. تبقى القاعدة نفسها ، العمليات الحسابية الكلاسيكية. تواصل Sisoft Sandra تقديم هذا النوع من القياس لنا في بعض معاييرها الاصطناعية.

كما تم إرجاع MIPS أيضًا إلى وحدة المعالجة المركزية كعنصر كلاسيكي ، وقد امتد FLOP إلى مناطق مزدهرة أخرى مثل قدرة المعالجة أو الحساب العام للمعالجات السابقة الموجهة جدًا إلى مهام محددة مثل وحدات معالجة الرسومات التي نركبها جميعًا على معالجاتنا أو على بطاقات التوسع المخصصة لدينا.

لهذه المفاهيم الأساسية ، كان الوقت يضيف وحدات قياس جديدة أكثر أو أكثر أهمية من تلك الموجودة في الكمبيوتر الحديث أو الكمبيوتر العملاق. يعد نقل البيانات أحد هذه الإجراءات التي أصبحت مهمة جدًا ويتم قياسه حاليًا في عمليات الإدخال والإخراج (عمليات الإدخال والإخراج في الثانية) وأيضًا في أشكال أخرى مثل إجراءات تخزين MB / GB / TB مقارنة بالوقت الذي يستغرقه الانتقال من نقطة إلى أخرى (ميجابت في الثانية - ميجابايت في الثانية).

يمكن لـ AS-SSD قياس أداء القرص الثابت بالميجابايت أو IOPs.

حاليًا ، نستخدم أيضًا مقياس النقل ، بمضاعفاته المختلفة ، كوسيلة لتفسير سرعة نقل المعلومات بين نقطتين عندما نرسل بعض المعلومات التي يتعين علينا فعلاً توليدها المزيد من المعلومات. هذا يعتمد على البروتوكول المستخدم لنقل المعلومات.

يوجد مثال واضح ، ونستخدمه كثيرًا ، في واجهة PCI Express. بموجب هذا البروتوكول ، لكل 8 بتات من المعلومات التي نريد نقلها (0 أو 1s) ، يتعين علينا إنشاء 10 بتات من المعلومات لأن هذه المعلومات الإضافية هي للتحكم في الاتصال الذي يتم إرساله لتصحيح الأخطاء وتكامل البيانات وما إلى ذلك.

البروتوكولات الأخرى المعروفة التي تقدم أيضًا هذه "الخسارة" للمعلومات الحقيقية هي IP ، الذي تستخدمه لقراءة هذه المقالة وهذا يجعل اتصالك 300MT / s يوفر في الواقع سرعة أقل بقليل من 300mbps.

لذلك ، نستخدم Gigatransfer أو النقل عندما نشير إلى المعلومات الأولية المرسلة بواسطة الواجهة ، وليس إلى المعلومات التي تتم معالجتها بالفعل في جهاز الاستقبال. يرسل ناقل بيانات PCI Express 3.0 بسرعة 8 جيجابت / ثانية 6.4 جيجابايت من المعلومات لكل خط متصل بين النقاط. أصبح النقل مهمًا للغاية مع دمج بروتوكول PCI Express في جميع الحافلات الرئيسية لجهاز الكمبيوتر المنزلي والمهني.

في الآونة الأخيرة ، بدأنا أيضًا في دمج المقاييس كوسيلة لربط قوة المعالجة بعوامل أخرى مهمة جدًا في الحوسبة الحديثة ، مع كون الاستهلاك أحد هذه المقاييس التي تم تقديمها كمقياس مقارن بين أداء نظامين. إن كفاءة الطاقة اليوم هي أكثر أو أكثر أهمية من قوة العملية ، وبالتالي من السهل رؤية المعايير التي تقارن قوة العملية وفقًا لواط استهلاك العنصر في القياس.

في الواقع ، لا تشير إحدى القوائم العظيمة للحواسيب الفائقة كثيرًا إلى الطاقة الإجمالية للكمبيوتر بين جميع عُقد الحوسبة الخاصة به ، ولكن إلى تطوير تلك القوة بناءً على الواط أو الطاقة التي يستهلكها النظام بأكمله. قائمة Green500 (FLOPS لكل واط - FLOPS لكل وات) هي مثال واضح على كيف أن الاستهلاك أساسي الآن لأي معيار مرجعي يحترم نفسه ، على الرغم من أننا بلا شك نواصل النظر عن كثب في قائمة TOP500 التي لا تحتوي على هذا العامل كعامل تكييف.

أنواع المعايير

على الرغم من أنه يمكننا التحدث عن العديد من العائلات أو أنواع المعايير ، إلا أنني سأبسط القائمة في الفئتين الأكثر شيوعًا من الفئات الأقرب إلينا كمستخدمين أكثر أو أقل تقدمًا.

من ناحية ، لدينا المعايير الاصطناعية التي هي إلى حد كبير تلك التي تقدم لنا التدابير التي تحدثنا عنها من قبل. المقاييس التركيبية هي برامج تقوم باختبارات خاضعة للرقابة مع كود برنامج مستقر إلى حد ما موجه لمنصة وبنية محددة. إنها برامج تجري اختبارات محددة للغاية يمكنها دمج مكون واحد أو أكثر من مكوناتنا ، ولكن حيث يتم إجراء نفس الاختبار أو الاختبارات دائمًا ، دون تغييرات.

لطالما كان عرض الصورة طريقة جيدة لمعرفة أداء وحدة المعالجة المركزية في نظام حديث لأنها مهمة شاقة. يحتوي Cinebench R15 أيضًا على العديد من الاختبارات ، واحد لوحدة معالجة الرسومات واثنان لوحدة المعالجة المركزية ، حيث يمكننا معرفة أداء الأنظمة ذات النوى المتعددة وسلاسل العمليات.

توفر بيئة اختبار خاضعة للتحكم ، حيث لا توجد تغييرات باستثناء الإصدارات وحيث يتم توثيق هذه التغييرات بشكل صحيح بحيث يعرف المستخدم الإصدارات التي يمكن مقارنتها مع بعضها البعض. يمكن لهذه الأنواع من البرامج اختبار أنظمة فرعية مختلفة من جهاز الكمبيوتر الخاص بنا بشكل منفصل ، مع أجزاء أخرى من التعليمات البرمجية أو معايير محددة لأداء نوع معين من الاختبار ، أو مجتمعة يمكن أن تتأثر بأداء واحد أو اثنين أو أكثر من مكونات النظام. إن المعيار القياسي المدمج في لعبة ، أو برامج مثل Cinebench ، Sisoft Sandra ، SuperPI ، 3DMark ،… هي أمثلة واضحة على المعايير الاصطناعية.

المعايير الاصطناعية الأخرى التي يجب ألا نخلط بينها وبين المعايير الحقيقية هي تلك التي تحاكي تنفيذ برامج حقيقية ، أو التي تنفذ نصوصًا أكشن في برامج حقيقية ، كما أنها اصطناعية نظرًا لعدم وجود عشوائي في الاختبار ، PC Mark هو مثال واضح على برنامج مرجعي اصطناعي يمكننا الخلط بينه وبين معيار حقيقي.

المعيار الفعلي هو طريقة اختبار مختلفة تمامًا لأنه يقبل عشوائية استخدام برنامج لقياس أدائه. اعتاد اللاعبون على أداء هذا النوع من المعايير أو اختبار الأداء عندما نقوم بتعديل معايير الجودة للعبة على إمكانيات أجهزتنا.

يعتبر قياس أداء اللعبة أثناء اللعب معيارًا حقيقيًا.

عندما تفتح FPS التي تعطيها اللعبة وتحاول تحقيق 60FPS المطلوب باستمرار ، فإنهم يؤدون معيارًا حقيقيًا. يمكن استنتاج نفس الشيء لأي نوع آخر من البرامج وإذا كنت مطورًا ، عندما تقوم بتحسين كود البرنامج الخاص بك ، فأنت تقوم أيضًا باختبارات مرجعية حقيقية حيث التغييرات هي التعليمات البرمجية الخاصة بك ، أو طريقة تنفيذها ، على منصة أجهزة مستقرة أو متغيرة.

كلا النوعين من المعايير مهمان ، الأول يسمح لنا بمقارنة نظامنا مع الآخرين في بيئة خاضعة للرقابة والثاني هو وسيلة لتحسين عملياتنا حيث يتم أيضًا إضافة عاملين مهمين ، العشوائية في التنفيذ والعامل البشري. كلا العاملين يقدمان وجهة نظر إضافية حول أداء المكون أو المكونات التي نريد اختبارها.

اعتبارات عند قياس الأداء

لكي يكون المعيار مفيدًا وفعالًا ، يجب أن نأخذ في الاعتبار عوامل معينة مهمة حقًا. تقدم المقارنة بين الأنظمة الأساسية المختلفة والبنى عاملًا مهمًا لعدم اليقين ، وهذا هو السبب في أن هذا النوع من المعايير التي تمنحك القدرة على مقارنة هواتف iOS المحمولة مع أجهزة الكمبيوتر التي تعمل بنظام Windows x86 ، على سبيل المثال ، عليك أن تأخذها مع الملقط لأنه لا يتغير فقط نواة نظام التشغيل ، لكن معالجات المعالج مختلفة جدًا. يقدم مطورو هذا النوع من المقاييس (على سبيل المثال ، Geekbench) عوامل تصحيح بين إصداراتهم المختلفة التي يصعب التحكم فيها.

لذلك ، فإن المفتاح الأول لمقارنة المعيار بين الأجهزة المختلفة هو أن النظام البيئي للاختبار مشابه قدر الإمكان للنظام الأساسي ونظام التشغيل وبرامج التشغيل وإصدار البرنامج. سيكون هناك بالتأكيد عناصر هنا لا يمكننا التحكم في التجانس ، مثل وحدة تحكم الرسومات إذا اختبرنا رسومات AMD مقابل رسومات Nvidia ، ولكن علينا أن نحاول أن نجعلها مستقرة قدر الإمكان. في هذه الحالة ، سنقوم أيضًا بتضمين الأجهزة ، نظرًا لمقارنة بطاقات الرسومات ، فإن هدفك هو استخدام نفس نظام التشغيل ، والمعالج نفسه ، والذكريات نفسها وجميع معلمات التشغيل ، مع الاحتفاظ بها كما هي ، بما في ذلك معلمات الجودة ، الدقة والاختبار في المعيار. كلما كان نظامنا البيئي أكثر استقرارًا ، كلما كانت نتائجنا أكثر موثوقية وقابلة للمقارنة.

نوصي بقراءة كيفية معرفة ما إذا كان المعالج يعاني من اختناق؟

الشيء الآخر الذي يجب أن نأخذه بعين الاعتبار هو أن الاختبارات المعيارية عادة ما يكون لها عامل ضغط على الأجهزة التي سنقوم باختبارها وإخضاع هذا الجهاز عادة لحالات لا تحدث عادة في الاستخدام العادي للنظام. كل معيار نأخذه من محرك الأقراص الثابتة أو بطاقة الرسوميات أو المعالج ، يرسلها إلى المواقف التي يمكن أن تكون خطيرة على الأجهزة ، لذلك يجب علينا تحديد التدابير المناسبة حتى لا تصبح نقطة الضغط نقطة كسر أو أيضًا في عنصر لتقليل الأداء لأن العديد من المكونات لها أنظمة حماية تقلل من أدائها في حالة ، على سبيل المثال ، درجات الحرارة خارج نطاق استخدامها. التبريد الكافي ، فترات الراحة بين الاختبارات ، التغذية الصحيحة للمكونات قيد الاختبار… يجب أن يكون كل شيء في وضع مثالي حتى يعمل الاختبار بسلاسة.

من ناحية أخرى ، نستخدم أيضًا هذا النوع من المعايير بدقة من أجل إخضاع النظام للضغط من أجل رؤية استقراره في هذا النوع من الحالات ، إنها طريقة مختلفة لتطبيق معيار لأنه لا يسعى فقط إلى معرفة الأداء ولكن أيضًا ما إذا كان النظام مستقر وأكثر من ذلك ، إذا كان النظام يعمل كما ينبغي في هذه المواقف العصيبة.

الخلاصة

بالنسبة لأولئك منا المكرسين لاختبار أجهزة الكمبيوتر بشكل احترافي ، فإن المعيار هو أداة عمل وبفضلها ، فإن المستخدمين لديهم طريقة علمية ويمكن التحقق منها لمقارنة أو معرفة أداء جهاز الكمبيوتر القادم لدينا في كل نظام من أنظمةه الفرعية بدقة. مقارنة بالأدوات المستخدمة على المستوى الصناعي.

يسعى جدول الاختبار ، مثل الجدول الذي تراه في الصورة ، إلى توحيد طريقة الاختبار بدقة ، بحيث يكون المعيار المقارن موثوقًا قدر الإمكان وقابل للاختبار عند إدخال الاختلافات التي تعدل النتائج.

ولكن مثل أي اختبار "مختبري" ، لكي تكون موثوقة ، يجب أن تتوفر الظروف المناسبة لإجراء ذلك ، وأكثر من ذلك حتى تكون قابلة للمقارنة بين الأنظمة المختلفة.

لقد أخبرناك اليوم قليلاً عن تاريخ هذا النوع من البرامج وأنواعه المختلفة وكيفية عملها وكيفية الحصول على معلومات موثوقة منها. إنها مفيدة ، لكن بالنسبة لي ، فهي مجرد جزء واحد من المعلومات يجب أن تضعه في اعتبارك وسأضعه دائمًا خلف التجربة الشخصية والاختبار النشط مع البرامج الحقيقية التي سنستخدمها كل يوم.

لا بأس بالمعايير لوضع حد أدنى من بيانات الأداء في عملية اتخاذ القرار لدينا ، ولكن لا يجب أن تحدد هذه القرارات ، وكنصيحة أخيرة ، تجنب المعايير الاصطناعية التي تدعي أنها قادرة على مقارنة الأداء بين الهياكل وأنظمة التشغيل وما إلى ذلك.

جدول المحتويات:

التاريخ

أنواع المعايير

اعتبارات عند قياس الأداء

الخلاصة

اختيار المحرر