![]() |
إن هذه الخوارزمية تُستخدم في مسائل التصنيف Classification،حيث يكون الـ output على شكل أحتمالية يمكن تقسيمه إلى فئتين أو نوعين Classes.ولدى هذه الخوارز |
أيجابيات وسلبيات خوارزمية Logistic Regression
أوضحنا في مقالة (خوارزمية
Logistic Regression)
إن هذه الخوارزمية تُستخدم في مسائل التصنيف Classification،حيث يكون
الـ output
على شكل أحتمالية يمكن تقسيمه إلى فئتين أو نوعين Classes.
ولدى هذه
الخوارزمية تأثير واضح في دقة التصنيف في العديد من المجالات أهمها: المجال الطبي
والعلوم الكيميائية ومختلف البيانات الرقمية.
سنتكلم في هذه المقالة عن أيجابيات وسلبيات خوارزمية Logistic Regression،لتكون لدينا رؤية واضحة عن نقاط القوة والضعف فيها وحتى نتأكد في أي نوع من البيانات ألتي تكون ملائمة للعمل مع هذه الخوارزمية، وسنبدأ اولاً في ذكر الأيجابيات:
الأيجابيات:
- أبسط خوارزمية في تعلم الآلة: تُعتبر خوارزمية Logistic Regression أحدى خوارزميات التعلم المُراقب Supervised Learning والتي يسهل بناءها وبرمجتها بشكل كبير،وذلك لأنها لاتحتاج إلى عمليات حسابية معقدة مقارنةً بالخوارزميات الأخرى مما يجعلها مناسبة لعملية التدريب في مجال تعلم الآلة Machine Learning.
- سهولة تحديث البراميترات (الأوزان): تسمح خوارزمية Logistic Regression للمستخدمين بسهولة تحديث الأوزان Weights أثناء عملية التدريب ولاتحتاج إلى خطوات معقدة أبداً على العكس من بقية الخوارزميات،حيث تتم عملية تحديث الأوزان بأستخدام خوارزمية stochastic gradient descent.
- مقاومة لظاهرة Overfitting : في مجموعة البيانات ذات الأبعاد القليلة، تكون خوارزمية Logistic Regression أقل عرضةً لظاهرة الـ Overfitting بينما إذا أصبحت مجموعة البيانات ذات أبعاد كبيرة ستكون هذه الخوارزمية أكثر تعرضاً لهذه الظاهرة،ومع ذلك يمكن التقليل من هذه الظاهرة بأستخدام تقنية التنظيم regularization.
- ذات دقة عالية: توفر دقة عالية لنتيجة تدريب على مجموعة البيانات البسيطة مقارنة بالخوارزميات الأخرى.أي أنها تعمل بصورة ممتازة مع الأبعاد القابلة للفصل بصورة خطية.
- يمكن تطويرها بسهولة: حيث يمكن تطوير قابلية خوارزمية Logistic Regression من التصنيف الثنائي إلى التصنيف المتعدد.
السلبيات:
- ظاهرة الـ Overfitting : عندما تكون مجموعة البيانات ذات ابعاد كبيرة،سيكون نموذج التدريب يعاني من مشكلة الـ Overfitting وبالتالي ستكون الدقة غير جيدة عند تفحصها على بيانات الأختبار test set.لذلك يجب أستعمال تقنية التنظيم regularization للحد من من ظاهرة overfitting ولكن هنالك ملاحظة مهمة وهي عندما تكون قيمة براميتر التنظيم عالية سيعاني النموذج من مشكلة الـ Underfitting وبالتالي سيؤدي ايضاً إلى خلل في دقة النموذج.
- عدم القدرة على تصنيف البيانات الغير خطية: المسائل الغير خطية لايمكن أستخدام خوارزمية Logistic Regression فيها،لذلك تحويل المسائل من الغير خطية إلى خطية ستكون غير مجدية بسبب استهلاكها وقتاً كبيراً.
- تحتاج إلى مجموعة بيانات كبيرة: من المعلوم أن خوارزمية Logistic Regression تُستخدم عندما يكون عدد بيانات التدريب أكبر من عدد الميزات، ولو حدث العكس فان نموذج التدريب سيعاني من مشكلة الـOverfitting.
إلى هنا وصلنا لنهاية الموضوع وأرجوا أن أكون موفقاً في إيصال التوضيح المناسب بأسلوب بسيط ومفهوم وأي أستفسار أتركوه لي في خانة التعليقات في الأسفل.
دمتم بود
م.م رسول حسن
تعليقات
إرسال تعليق