Previsão de séries temporais de produtos vendidos no varejo
Previsão. Séries temporais. Stacked generalization. Aprendizado de máquina. Famílias de produtos.
A previsão do volume de vendas das famílias de produtos de varejo é uma etapa indispensável no respectivo planejamento estratégico de negócios e no dimensionamento eficiente do gerenciamento da cadeia de suprimentos. Essa prática permite que as organizações antecipem a demanda por produtos, aprimorando a preparação para atender às necessidades dos consumidores. Nesse contexto, a adoção
de modelos de aprendizado de máquina (ML) para a previsão de séries temporais surge como uma ferramenta valiosa. Na presente pesquisa, o objetivo foi analisar a capacidade preditiva de modelos matemáticos individuais e combinados por meio de uma abordagem de stacked generalization, para previsão de séries temporais do volume de vendas de vinte famílias de produtos. Os modelos individuais (ou modelos base) foram treinados e, posteriormente, as cinco melhores previsões dentre os modelos k-NN, SVR, DTR, RFR, ETR, XGBoost, LightGBM, MLP e LSTM foram selecionadas com base no desempenho na métrica MAAPE, devido à sua robustez na análise de séries temporais com alta variabilidade. Por sua vez, os modelos combinados (ou meta-modelos) utilizaram as saídas dos cinco modelos base selecionados na primeira etapa para realizar a previsão final, sendo posteriormente selecionadas as quatro melhores previsões para cada série temporal dentre os meta-modelos k-NN, SVR, DTR, MLP e LSTM, assim como a utilização de combinadores baseados em medidas de estatística descritiva, tais como a média, a mediana e a mínima variância. Os experimentos envolvendo o cruzamento entre modelos resultaram em 100 combinações entre modelos base e 80 combinações entre meta-modelos para o conjunto de séries temporais analisadas nesta pesquisa. Subsequentemente, foi realizada uma comparação de desempenho entre os modelos propostos utilizando as métricas MAAPE, RMSLE e MAE. Uma análise comparativa das séries temporais analisadas mostrou que, de maneira geral, os modelos combinados se sobressaíram em relação aos modelos individuais, apresentando um desempenho marginalmente superior entre as métricas MAAPE, RMSLE e MAE. Esses experimentos contextualizam a complexidade da previsão de vendas de famílias de produtos e contribuem para a literatura em relação à otimização e aplicabilidade de modelos de ML na predição de séries temporais do volume de vendas em empresas do segmento de varejo.