万生优配:中国股票价格预测的时间序列预测模型

预测股票走势是金融领域一项重要的研究工作,可帮助交易员做出明智的决策以提高盈利能力。利用 Wind 平台的实际股票价格和相关因素,可以提出一种有效但复杂的预测方法。虽然以前的方法已经探索了这条途径,但它们遇到了挑战,包括对股票数据元素之间相互关系的理解有限、大序列的准确性降低以及异常点的困扰。本文介绍了一种用于股票价格预测的高级混合模型,称为 PMANet。PMANet 以多尺度时间特征注意为基础,融合了多尺度时间特征卷积和蚂蚁粒子群优化。该模型通过概率位置注意提高了对股票数据序列内依赖性和相互关系的理解。此外,编码器结合了多尺度时间特征卷积,增强了模型辨别多尺度和重要特征的能力,同时熟练地管理较长的输入序列。此外,通过用蚂蚁粒子群算法替代优化器,提高了模型对股票序列异常点的识别能力。为验证模型的有效性和适用性,我们以中国四大重点行业的股票进行了实证研究。实验结果表明,PMANet 具有可行性和通用性,预测结果与实际值较为接近,能够更有效地满足应用需求。

随着我国经济的发展,个人通过股票进行投资理财的兴趣日益浓厚,股票交易已成为投资者的一种基本投资方式1。股票投资市场风险与收益并存,获取更准确的股价信息对投资者有效规避一定风险至关重要。股票市场是金融领域的重要组成部分,与一国的经济活动密切相关,价格波动对一国经济发展具有重要影响,股市走势反映了一国经济格局的波动。通过技术手段预测股价走势,对指导理财、提高投资效率具有重要意义,有助于股市乃至全球经济的稳定增长。因此,个人为了获取更大的经济收益,纷纷利用各种算法预测股价走势2。然而,股票市场是一个复杂的非线性动态系统,数据的生成不仅是历史市场行为的结果,还受到企业财报、财经新闻、宏观经济、投资者情绪等多种因素的影响3。丰富的数据源增强了对股票市场的理解,从而可以做出更精确的预测。某些方法可以将历史数据与股票价格的未来走势联系起来,利用过去的数据来预测未来的趋势4。此外,股票的可预测性在很大程度上依赖于市场分析、信息的全面收集和获取、可用数据点的潜在整合、相关信息特征的识别以及预测模型和超参数的选择和优化。

在股票价格的初期,股价走势可用随机波动来描述,国内外学者多采用传统的统计模型来描述股票行为。传统统计模型包括指数平滑法(ES)5、多元线性回归法(MLR)6、自回归移动平均法(ARMA)7和自回归综合移动平均法(ARIMA)8 。由于影响股票价格的因素众多,影响机制复杂,传统统计模型难以预测信息不足、区域异质性和复杂模式的时间序列。因此,使用这些简单的数学模型9往往很难达到很好的预测精度。

人工智能的兴起吸引了研究人员对机器学习方法的关注,因为它们擅长对非线性时间序列进行建模。这些方法通过辨别底层数据模式来构建预测模型,以更少的假定模型提供卓越的适应性。最近,研究人员越来越多地转向机器学习方法来解决股价预测中数值模型的局限性。这些方法中突出的是支持向量机 (SVM) 10、决策树 (DT) 11和随机森林 (RF) 12。例如,Nayak 等人13引入了一个融合支持向量机 (SVM) 和 K 最近邻 (KNN) 方法来预测印度股市指数的混合框架。他们的研究深入全面分析了这些指数,采用了收盘价、波动性和股市动量等技术分析工具。实验结果强调了混合 SVM-KNN 模型与现有模型相比具有卓越的预测性能,展示了其在预测印度股市指数方面的有效性。 Zhang 等人14采用无监督启发式算法,根据收盘价的形状将股票交易数据细分为多个部分。他们利用随机森林、不平衡学习和特征选择来训练这些部分的预测模型。实验结果展示了该系统在预测股价趋势方面的有效性。在另一种方法中,Zhang 等人15引入了“状态框方法”,该方法通过将股票数据分类为具有三个不同状态的框来评估当前股价趋势并预测未来价格变化。然后应用机器学习技术对这些框进行分类,利用它们的状态来预测股价走势。实验结果突出了该方法的高分类准确率及其在解决股票转折点分类不平衡方面的成功。Vijh 等人16利用随机森林和人工神经网络模型预测各个行业的第二天收盘价。他们使用 RMSE 和 MAPE 等标准策略指标评估了该模型,这两个指标都显示出较低的值,表明该模型在预测股票收盘价方面是有效的。此外,Chen 等人17设计了一种新颖的投资组合构建方法,使用基于机器学习的混合模型进行股票预测,并结合均值方差 (MV) 进行投资组合选择。以上海证券交易所作为研究样本,他们的研究结果表明,所提出的方法在回报和风险方面均优于传统方法和基准方法。股市的非线性、噪声、非平稳性和复杂的影响因素对传统的机器学习方法18提出了重大挑战。这些方法在捕捉非线性趋势、应对数据噪声和防止过度拟合方面遇到困难。它们表现出一些局限性,特别是在对复杂的非线性关系进行建模时,并且通常需要手动干预进行特征选择。此外,这些模型通常对大量数据和计算资源的要求较低,这限制了它们处理高维数据和性质更复杂的大规模任务的功效。

相比之下,深度学习模型能够更高效地捕捉复杂关系,并通过并行计算19有效地训练大型神经网络,因此深度学习等更复杂的模型开始受到关注,它们可以从非平滑、非线性的股价数据中自动学习到复杂特征表示,同时弥补了机器学习只能实现局部最优的不足。卷积神经网络(CNN)20,21、循环神经网络(RNN)22,23 短期记忆网络(LSTM)24,25以及Transformer26,27众多深度学习方法已被应用于股价预测并表现出优异性能。张等28首次探索了深度学习在股市中的应用,使用卷积神经网络(CNN)和长短期记忆网络(LSTM)两种深度学习模型,结合技术指标和财经新闻文章进行预测。 Rezaei 等29提出了 CEEMD-CNN-LSTM 和 EMD-CNN-LSTM 算法,可以提取深度特征和时间序列,最终用于一步预测。实践研究的结果证实了这一说法,并表明 CNN 与 LSTM、CEEMD 或 EMD 的组合可以提高预测精度并优于其他同类算法。刘等30提出了一种新的股票价格预测模型 VML,为了利用无关元学习 (MAML) 算法的参数训练具有良好泛化能力的初始长短期记忆 (LSTM) 网络,提出了一种将分解子序列划分为多个任务的方法。实验结果表明,所提出的方法提高了预测精度。滕等31首次将局部描述符应用于股票趋势预测。他们的方法通过在股票价格序列上使用各种尺度的滑动窗口引入多样化的局部描述符。该过程丰富了多尺度信息,随后通过分层注意力机制和多分支LSTM结构整合了时间相关和多尺度相互作用。实验结果验证了该模型的高效性。刘等人32提出了一种独特的股票价格预测方法,即CapTE,该方法利用Transformer Encoder模型。该方法使用Transformer Encoder从社交媒体中提取深度语义特征,同时通过胶囊网络捕获文本结构关系,最终提高股票走势预测性能。Zhou等人33通过设计一种高效的基于Transformer的LSTF模型Informer,显著提高了股价预测性能。值得注意的是,该模型采用了ProbSparse自注意力机制、自注意力蒸馏和生成解码器,显著提高了扩展序列的预测精度和推理速度。尽管上述研究取得了良好的结果并证明了LSTM和Transformer家族在时间序列预测任务中的可行性,但它们的重点主要集中在短序列识别上。他们忽略了探索显着的长时间序列特征与网络结构之间的相关性。此外,这些研究并没有深入研究应变数据中的突变点对预测精度的影响。图 1展示了三种时间序列预测网络架构的比较。 Transformer 使用的标准自注意力机制由于其 O(L^2) 时间复杂度而面临挑战,使其不太适合处理较长的股票数据序列。另一方面,基于循环神经网络的 LSTM 严重依赖隐藏状态来捕获序列依赖关系,但它面临着较长序列中梯度消失和爆炸的挑战。然而,在股票预测领域仍然迫切需要进一步研究,以深入了解时间序列特征并增强网络功能。因此,我们选择 Informer 作为我们相关工作的基准网络,旨在解决这些关键差距并推动该领域的发展。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注