التعلم الآلي: التجارة الخوارزمية والمركبات ذاتية القيادة

أصبح التعلم الآلي باستخدام بيانات الأسهم لتداول الأسهم قادرًا الآن على إنشاء ألفا. يمكن أن يساعد مفهوم تعلم الآلة نفسه في التنبؤ بزاوية توجيه السيارة وعلامة المرور والمركبة واكتشاف خط الحارة باستخدام الرؤية وسرعة السيارة والتسارع وزاوية التوجيه وإحداثيات GPS وزوايا الجيروسكوب.


:تداول الأسهم
الحصول على البيانات ← المعالجة المسبقة ← ML ، الاختبار الخلفي ← بناء الاستراتيجيات ← المحاكاة مع تدفق البيانات ← التداول
خط أنابيب المركبات ذاتية القيادة:


يعد الحصول على البيانات أكثر تكلفة ومحدودًا حتى الآن بالنسبة للمركبات ذاتية القيادة. تعتبر مفاهيم قليلة مثل رؤية الكمبيوتر ودمج المستشعرات والتوطين وتخطيط المسار والتحكم نموذجية وتستخدم مفاهيم التعلم الآلي


التعلم الآلي لتداول الأسهم: أصبحت أنظمة التداول الآن قادرة على تحليل موجز الأخبار بسرعة من مصادر مختلفة مثل Bloomberg و Reuters والتغريدات ، ومعالجة الأرباح والتوقعات ، والتصنيفات ، وكشط المواقع الإلكترونية ، وبناء المشاعر عليها على الفور. يمكن لهذه الأنظمة (العديد من أنظمة السحابة) تمييز البيانات التي تم إنشاؤها بواسطة الأفراد أو العمليات التجارية أو أجهزة الاستشعار. بيانات المستوى الفردي التي تم إنشاؤها بواسطة منشورات وسائل التواصل الاجتماعي ، ومراجعات المنتجات ، واتجاهات البحث ، وما إلى ذلك ، حيث كمستوى العمليات التجارية حسب بيانات عادم الشركة ، والمعاملات التجارية ، وبيانات بطاقة الائتمان ، وما إلى ذلك ، وبيانات الاستشعار عن طريق بيانات صور الأقمار الصناعية ، وحركة مرور السيارات والقدم مواقع السفن ، إلخ. يمكن لخط أنابيب تداول الأسهم وضع إستراتيجية تداول وإنشاء ألفا.


:التحديات
لا يمكن للآلة أن تعمل بشكل جيد أثناء تغيير حالة السوق أو تغيير النظام أو نقطة تحول السوق. قد يؤدي هذا التحول إلى القفز لأعلى أو لأسفل. يمكن أن يكون سبب الانتقال السريع إلى بيانات مخزون النفط وبيانات الوظائف وبيانات مسؤولي البنوك المركزية والسياسيين. تتميز نماذج التعلم الآلي مثل Markov و PID وما إلى ذلك بدقة جيدة ولكن القيمة المعرضة للمخاطر مرتفعة جدًا بالنسبة لهذه النماذج.
مفاهيم مهمة:


صف: مراقبة قياس ، نقطة بيانات
الأعمدة: الميزات
اختيار الميزة: التعلم العميق القائم (غير الخاضع للإشراف) مقابل استخراج / اختيار الميزة تحت الإشراف (تعلم الميزة أو التعلم التمثيلي). تقنيات قليلة PCA و SVD والتحليل التمييزي الخطي LDA
مجموعات فرعية: مجموعة بيانات للتدريب والاختبار والتحقق من الصحة تم إنشاؤها من مجموعة البيانات الرئيسية
الهدف الناتج / الاستجابة
التحسين: الخسارة ، أو دالة التكلفة مثل الانحدار ، SGD ، RMSE
يستفيد تعلم الآلة من خوارزميات مختلفة للنمذجة والعثور تلقائيًا على أنماط في البيانات من خلال التعلم الخاضع للإشراف وغير الخاضع للإشراف وشبه الإشراف.


البيانات المصنفة: التعلم الخاضع للإشراف للبيانات التاريخية للحصول على نموذج
البيانات غير المصنفة: التعلم غير الخاضع للرقابة للبيانات التاريخية للعثور على أنماط غير معروفة.
التجميع (غير خاضع للإشراف) لاكتشاف تكوين وهيكل مجموعة معينة من البيانات أو لرؤية ظهور مجموعات مختلفة. تتميز كل مجموعة بمجموعة من نقاط البيانات ، ونقطة مركزية عنقودية.
تصنيفين أو تصنيف متعدد الفئات (خاضع للإشراف) هو تقدير الاحتمالات بأن الملاحظة تنتمي إلى كل فئة من الفئات المحددة.
الانحدار (خاضع للإشراف) للتنبؤ بالقيمة الدقيقة من السلاسل المستمرة / السلاسل الزمنية (OLS ، الانحدار اللوجستي ، ARIMA ، GARCH ، إلخ.)


كشف الشذوذ (غير الخاضع للإشراف والإشراف) من نقاط البيانات الخاطئة (العيوب)
طرق التجميع هي الجمع بين نماذج مختلفة (غابات عشوائية)
حدودي / غير حدودي
overfitting (النموذج لا يعمم جيدًا). التنظيم (L2 و L1) ، قيود القاعدة القصوى والتسرب وما إلى ذلك لتجنب ذلك.
وظيفة التنشيط: لإضافة اللاخطية إلى الإخراج. سيني ، تانه ، ريلو


الانحياز: الأوزان في NN
العقد: الإدخال والمخفية والإخراج
متعدد الطبقات Perceptron: إدخال +1 أو أكثر من الطبقة المخفية + الإخراج
التكاثر العكسي: تدريب NN من الأخطاء تحت الإشراف.
خوارزميات التعلم الآلي: قد يتم الإشراف على التعلم الآلي والتعلم غير الخاضع للإشراف والتعلم العميق والمعزز. الإشراف على البيانات المصنفة ، غير الخاضعة للإشراف للعلاقات الضمنية في البيانات غير المسماة والتعلم المعزز
إشراف


الانحدار: OLS و ARIMA و GARCH و Lasso و Ridge و k-Nearest Neighbours (k-NN) و Spline و XGBoost
التصنيف: SVM ، لوجستي ، عشوائي غابة ، مخفي ماركوف ، نايف بايز
أشجار القرار
طرق بيرسبترون والجماعة
غير خاضع للرقابة
التجميع: K- الوسائل ، البتولا ، الكتلة الخاصة وارد ، المجموعات الهرمية
تحليل العامل: PCA ، ICA ، NPF
تحليل القيمة الفردية (SVD)
تحليل المكونات المستقلة (ICA)
إكتشاف عيب خلقي
دعم آلة ناقلات (فئة واحدة SVM)
PCA (تحليل المكون الأساسي)
التعلم العميق: السلاسل الزمنية وغير المنظمة
MLP ، CNN ، LSTM ، RBM ، ANN ، RNN
الآخرين
التعلم المعزز ، Deep-Q ، شبه الإشراف ، التعلم النشط
خطوات ML
اختيار البيانات والمعالجة المسبقة ← تقسيم البيانات: تدريب بنسبة 80٪ واختبار 20٪ ← اختيار الميزات وهندسة الميزات ← نماذج بارامترية: تُسمى معاملات المصطلحات المعلمات (المنحدر ، معامل التقاطع ، مصطلح الخطأ …) ← اختيار النموذج ← النموذج ← الأداء / الدقة ← مقايضات النموذج