Machine learning for market volatility prediction
No Thumbnail Available
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Anticipating market volatility is one of the most common terms in today’s trading
market. Price movements, market volatility and trading risk are represented by realized
volatility. A small change in volatility affects the expected return for all assets.
In this research to forecast volatility, we used the data set provided by Kaggle Op-
tiver, a leading global electronic market maker committed to continuous improvement
of financial markets and improving access and pricing of options, exchange-traded funds
(ETFs), on several exchanges around the world, where the Cash Stocks, Bonds and For-
eign Exchange. In our study we used the following forecast models: LightGBM, XGBoost,
CatBoost and Linear Regression, and we concluded some related works on forecasting
volatility. Then we ran our models. The results show that the LightGBM model is the
best among these models, as it achieved the lowest root mean square error percentage
(RMSPE) score of: 0.286, And the highest score in the coefficient of determination R2
is: 0.817, and the RMSPE for other models: XGBoost, CatBoost and Linear regression
is, respectively: 0.303, 0.302 and 0.347, and the score of r2 is also: 0.791, 0.784, 0.766.
Then we computed our models using feature geometry, the results improved, and the best
improved result was in the LightGBM model and CatBoost model. Then we also applied
K-Fold Cross-Validation to the four models, and noticed that the LightGBM result is the
best result compared to the other models.
Through our study and after various experiments, we concluded that the lightGBM
model is the best model compared to the XGBoost, CatBoost and Linear Regression
models in predicting stock market fluctuations.يعد توقع تقلبات السـوق أحد أكثر المصطلحات شيو عـا في سوق التداول اليـوم. يتم تمثيـل
تحركات األسعار وتقلبات السوق ومخاطر التداول من خالل التقلبات المحققة. و يؤثر تغيير
طفيف في التقلب على العائد المتوقع لجميع األصول.
في هـذا البحـث للتنبـؤ بالتقلبات ، استخدمنا مجموعـة البيانات التي توفرهـا منصة Kaggle
Optiver، وهو صانع سوق إلكتروني عالمي رائد وملتزم بالتحسين المستمر لألسواق المالية و
تحسين الوصول وأسعار الخيارات ، والصناديق المتداولة في البورصة (ETFs ، (في العديد من
البورصات حول العالم ، حيث يتم تداول األسهم النقدية والسندات والعمالت األجنبية.فـي
دراستنـا استخدمنـا نمـاذج التنبـؤ التاليـة : LightGBM ، XGBoost ، CatBoost و Linear
Regression ،واستنتجنا بعض األعمال ذات الصلة حول التنبؤ بالتقلب. وبعد ذلك قمنا بتشغيل
نماذجنا . تظهر النتائج أن نموذج LightGBM هو األفضل من بين هاته النماذج ،حيث حقق
أدنى درجــة جـذر متوسط مربـع النسبـة المئويـة لفقدان الخطأ (RMSPE (وهي : 286.0 ،
وأعلى درجة في معامل التحديد R2 هي : 817.0 ، وأن RMSPE للنماذج األخرى :
، 0.302 ، 0.303 : التوالي على هي Linear Regression و CatBoost ،XGBoost
347.0 ، ودرجة r2 لها هي على التوالي ايضا : 791.0 ، 784.0 ، 766.0.ثم قمنا بحساب
نماذجنا باستخدام هندسة الميزات ، وتحسنت النتائج ، ولكن كانت أفضل نتيجة محسّنة في
نموذج LightGBM ونموذج CatBoost. ثم طبقنا أي ضا Validation-Cross Fold-K على
النماذج األربعة ، فالحظنا أن نتيجة lightGBM هي أفضل نتيجة مقارنة بالنماذج األخرى.
من خالل الدراسة التي قمنا بها وبعد التجارب المختلفة استخلصنا أن نموذج lightGBM هو
النموذج األفضل مقارنة بالنماذج XGBoost ،CatBoost و Regression Linear في توقع
تقلبات سـوق األسهم.
Description
mémoire master informatique
Keywords
Machine learning, prediction market volatility., تعلم الآلة والتنبؤ بتقلبات السوق.
Citation
university of el oued