Prognozowanie dziennych obrotów przedsiębiorstwa za pomocą algorytmu XGBoost – studium przypadku

Filip Wójcik

Abstract

The goal of this paper was to investigate use of the Extreme Gradient Boosting XGBoost algorithm as a forecasting tool. The data provided by the Rossman Company, with a request to design an innovative prediction method, has been used as a base for this case study. The data contains details about micro- and macro-environment, as well as turnover of 1115 stores. Performance of the algorithm was compared to classical forecasting models SARIMAX and Holt–Winters, using time-series cross validation and tests for statistical importance in prediction quality differences. Metrics of root mean squared percentage error (RMSPE), Theil’s coefficient and adjusted correlation coefficient were analyzed. Results where then passed to Rossman for verification on a separate validation set, via Kaggle.com platform. Study results confirmed, that XGBoost, after using proper data preparation and training method, achieves better results than classical models
Author Filip Wójcik (WUE)
Filip Wójcik,,
- Wrocław University of Economics
Journal seriesStudia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach, ISSN 2083-8611, (B 10 pkt)
Issue year2018
No275
Pages121-140
Publication size in sheets0.95
Keywords in Polishsztuczna inteligencja, uczenie maszynowe, prognozowanie
Keywords in English artificial intelligence, machine learning, forecasting
Abstract in PolishCelem niniejszego artykułu było zbadanie możliwości wykorzystania algorytmu Extreme Gradient Boosting (XGBoost) jako narzędzia prognozowania obrotów przedsiębiorstwa. Na studium przypadku wybrano udostępnione przez firmę Rossmann (wraz z prośbą o opracowanie innowacyjnej metody prognozowania) dane, obejmujące informacje z mikro- i makrootoczenia oraz obrotów 1115 oddziałów. Działanie algorytmu porównano z klasycznymi modelami SARIMAX i Holta–Wintersa, wykorzystując walidację krzyżową oraz testy statystycznej istotności różnic trafności predykcji. Badano metryki średniego błędu procentowego, współczynnik Theila oraz skorygowany współczynnik determinacji. Wyniki przekazano do weryfikacji firmie Rossmann. Potwierdzono, iż XGBoost po zastosowaniu odpowiedniej obróbki danych i sposobu uczenia osiąga lepsze rezultaty niż modele klasyczne
URL https://www.ue.katowice.pl/jednostki/wydawnictwo/czasopisma-naukowe/studia-ekonomiczne-zeszyty-naukowe/biezace-numery/2018/2018/se-37518.html
Languagepl polski
File
Wojcik_Prognozowanie_dziennych_obrotów_przedsiębiorstwa2018.pdf 536,94 KB
Score (nominal)10
ScoreMinisterial score = 10.0, 02-08-2019, ArticleFromJournal
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back