تعرِض هذه الوحدة مفاهيم الانحدار الخطي.
الانحدار الخطي هو أحد الأساليب الإحصائية التي تُستخدَم لمعرفة العلاقة بين المتغيّرات. في سياق التعلم الآلي، يحدِّد الانحدار الخطي العلاقة بين السمات وأحد التصنيفات.
على سبيل المثال، لنفترض أنّنا نريد توقّع كفاءة استهلاك الوقود في السيارة بالميل لكل غالون استنادًا إلى وزن السيارة، ولدينا مجموعة البيانات التالية:
الجنيهات بالآلاف (ميزة) | ميل لكل غالون (تصنيف) |
---|---|
3.5 | 18 |
3.69 | 15 |
3.44 | 18 |
3.43 | 16 |
4.34 | 15 |
4.42 | 14 |
2.37 | 24 |
إذا رسمنا هذه النقاط، سنحصل على الرسم البياني التالي:
الشكل 1: وزن السيارة (بالرطل) مقارنةً بتقييم الأميال لكل غالون كلما زاد وزن السيارة، انخفض معدّل استهلاكها للوقود بشكل عام.
يمكننا إنشاء نموذجنا الخاص من خلال رسم خط أقرب التطابق من خلال النقاط:
الشكل 2: خط أقرب التطابق الذي تم رسمه من خلال البيانات الواردة في الشكل السابق
معادلة الانحدار الخطي
في المصطلحات الجبرية، سيتم تعريف النموذج على النحو التالي: $ y = mx + b $، حيث
- $ y $ هي المسافة التي يقطعها مركبة في غالون واحد من الوقود، وهي القيمة التي نريد التنبؤ بها.
- $ m $ هو ميل الخط.
- $ x $ هي الجنيهات، وهي قيمة الإدخال.
- $ b $ هي نقطة التقاطع مع المحور العمودي y.
في تعلُّم الآلة، نكتب معادلة نموذج الانحدار الخطي على النحو التالي:
حيث:
- $ y' $ هو التصنيف المتوقّع، أي الناتج.
- يمثّل المتغيّر $ b $ التحيز للنموذج. ويُعدّ الانحياز هو نفسه مفهوم نقطة تقاطع y في العبارة الجبرية للخط. في تعلُّم الآلة، يُشار أحيانًا إلى الانحياز باسم $ w_0 $. والانحياز هو مَعلمة للنموذج ويتم احتسابه أثناء التدريب.
- $ w_1 $ هو الوزن للميزة. الوزن هو المفهوم نفسه للميل $ m $ في العبارة الجبرية للخط. "الوزن" هو أحد المَعلمات في النموذج ويتم محاسبته أثناء التدريب.
- $ x_1 $ هو سمة، وهي المدخل.
أثناء التدريب، يحسب النموذج الوزن والانحياز اللذَين ينتج عنهما أفضل نموذج.
الشكل 3: التمثيل الرياضي لنموذج خطي
في مثالنا، سنحسب الوزن والانحياز من الخط الذي رسمناه. الانحراف هو 34 (حيث يتقاطع الخط مع المحور الصادي)، ويكون المعدّل -4.6 (ميل الخط). سيتم تعريف النموذج على النحو التالي: y' = 34 + (-4.6)(x_1)، ويمكننا استخدامه لإجراء توقّعات. على سبيل المثال، باستخدام هذا النموذج، ستكون كفاءة الوقود المتوقّعة لسيارة تزن 4,000 رطل (1,814 كيلوغرام) هي 15.6 ميل (25.2 كيلومتر) لكل غالون.
الشكل 4: باستخدام النموذج، تبلغ كفاءة استهلاك الوقود المتوقّعة لسيارة تزن 4, 000 رطل (1,814 كجم) 15.6 ميل لكل جالون أمريكي (16.3 كيلومتر لكل لتر).
النماذج التي تتضمّن ميزات متعددة
على الرغم من أنّ المثال في هذا القسم يستخدم سمة واحدة فقط، وهي ثقل السيارة، قد يعتمد نموذج أكثر تعقيدًا على سمات متعددة، لكل منها وزن منفصل ($ w_1 $ و$ w_2 $ وما إلى ذلك). على سبيل المثال، يمكن كتابة نموذج يعتمد على خمس ميزات على النحو التالي:
$ y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $
على سبيل المثال، يمكن أن يستخدم النموذج الذي يتوقّع معدّل استهلاك الوقود أيضًا ميزات مثل ما يلي:
- سعة المحرك
- التسارع
- عدد الأسطوانات
- القدرة الحصانية
سيتم كتابة هذا النموذج على النحو التالي:
الشكل 5: نموذج يتضمّن خمس ميزات للتنبؤ بتقييم عدد الأميال التي تقطعها السيارة بالغالون
من خلال إنشاء رسم بياني لبعض هذه الميزات الإضافية، يمكننا ملاحظة أنّ لها أيضًا علاقة خطية بالعنوان، أي عدد الأميال التي يقطعها غالون الوقود:
الشكل 6 حجم محرك السيارة بالسنتمتر المكعب ومعدل استهلاكه للوقود بالميل لكل غالون كلما زاد حجم محرك السيارة، انخفض معدّل الأميال التي تقطعها السيارة لكلّ جالون بشكل عام.
الشكل 7 تسارع السيارة واستهلاكها للوقود كلما استغرقت عملية تسارع السيارة وقتًا أطول، زاد معدّل استهلاك الوقود بشكل عام.
الشكل 8 قدرة السيارة الحصانية واستهلاكها للوقود كلما زادت قوة حصان السيارة، انخفض معدّل الأميال لكل جالون بشكل عام.