天狼50炒股软件与一般时间序列不同Wang, Heyuan & Wang, Tengjiao & Li, Shun & Guan, Shijie & Zheng, Jiayi & Chen, Wei. (2022). Heterogeneous Interactive Snapshot Network for Review-Enhanced Stock Profiling and Recommendation. 3937-3944. 10.24963/ijcai.2022/547.
股票推举正在今世量化贸易中起着合节影响。大方的社会媒体音信,如投资评论,委托激情驱动的身分,加上代价身手目标,酿成了不竭变革的股票墟市概略的 速照。然而,以前的斟酌平时对代价和媒体形式的时分轨迹举办寡少筑模,而马虎了它们之间的彼此影响。另外,他们合键是通过按次或留意力模子来提取评论语义,而富厚的文本合连学问正在很大水平上被马虎了。正在本文中,咱们提出了一种新型的
速照搜集,用于股票认识和推举。咱们将每个速照中的投资评论筑模为一个异质文档图(heterogeneous document graph),并开荒了一个机动的分层留意力撒播框架来逮捕细粒度的迫近特质。另外,为了练习股票
,咱们引入了一种新的twins-GRU方式,该方式以交叉互动的形式将媒体和代价平行序列精细连合起来,从而逮捕到连接速照之间的动态依赖。咱们的模子正在英文和中文基准的贸易模仿中,正在累积收益和危险调解后的收益方面优于最进步的身手,赶过7.6%。
切确预测股票走势是做出有利可图的投资决定的先决要求。 来自数学和深度练习社区的古板文献 [Nayak et al., 2015; Qin et al., 2017] 着重从汗青身手目标平分解股票的摇动形式。 然而,与普通时分序列区别,股票墟市的动态变革是高度随机的,而且容易受到非安稳举止的影响。 跟着互联网的兴盛,大方的正在线媒体评论(如财经信息和推文)为揭示墟市境遇变革供给了重大的潜力[Hu et al., 2018; Sawhney 等人,2021b]。 然而,先前合于文本巩固股票预测的斟酌正在语义暗示和时分依赖筑模方面存正在限定性。 本文从以下两个角度论说斟酌观点。
开始,现有的股票预测方式平时通过按次或留意力模子来逮捕投资评论的语义特质,而富厚的文本间相干学问正在很大水平上被马虎了。究竟上,连接交付的股票评论平时与上下文合连。通过重心和实体等内生文本方面将它们接连正在一同,为外明股价摇动供给了更平凡的音信。
图 1 显示了速照,囊括逐日身手信号和对 $AAPL 不竭变革的概略的媒体评论。正在第 t 个贸易日,第一和第三个文本都提到了“身手”和“产物”,而第二个和结尾一个文本是合于“投资”的主张。这些配合的对描画了针对特定重心的互补音信。另外,提到统一实体的第一个和结尾一个评论传达地揭示了公家对“产物宣布”带来的股票收益的指望。另外,区别实体(如“Apple”和“iPhone”)之间的合连性也是论说同一上下文的紧急标记,能够通过参考维基百科等附加学问来分辨。这启迪咱们为每个股票速照的媒体信号修建异构音信图,以满盈行使语义合连线索来通盘评估底层公司形态。
另一方面,为了归纳用于股票认识的众种墟市和媒体信号,先前的斟酌平时听从两种范式:(i)早期级联,即平等看待两种形式以正在每个时分点组成一个紧凑的输入;和(ii)结尾阶段的交互,不同对每品种型的按次数据举办筑模,然后正在结尾一层将它们搀和正在一同。
沿着这些思绪,本文将股票预测拟订为练习排名职业,并提出了一个异构交互式速照搜集(Heterogeneous Interactive Snapshot Network ,HISN),用于审查巩固的投资推举。 本文的合键功绩囊括:
本文将每个贸易日的股票媒体评论暗示为包蕴特地学问的异构文档图。 另外,开荒了具有机动节点和视图级集合器的分层留意撒播(hierarchical attentive propagation,HAP)框架,以摄取紧急的相近特质,以达成更切确的语义筑模。
本文提出了 twins-GRU,它以交叉交互的形式将墟市和媒体并行序列精细耦合,以逮捕区别形式之间随时分变革的彼此影响。 认识到时分衰减,股票动态速照的紧急埋伏形态被集成以练习股票筑设文献嵌入以得到预期的利润排名。
本文对超过种种证券贸易所墟市的英文和中文数据集举办了平凡的实行,以验证 HISN 的实用性。
累积和危险调解后的回报比最新身手(SOTA)跨过 7.6% 和 10.2% 以上
作家不同从身手认识与文本辅助认识两个方面论说了合连文献,感意思能够去阅读原文。
图 2 概述了本文提出的 HISN。 正在接下来的末节中,本文开始出现了若何为每个股票速照的投资评论修建异构文档图,并先容分层留意撒播方式来妥协众个相邻特质(第 3.2 节)。 然后,本文描摹了 twins-GRU,它正在回溯期(§3.3)中将双工媒体和墟市信号耦合到连接速照中。 结尾,本文连合紧急的埋伏形态来练习股票嵌入以正在贸易中举办利润排名(第 3.4 节)。
如图 1 所示,重心是揭示文本实质和公家合切点的紧急目标。因而,本文行使 LDA [Blei et al., 2003] 将通盘逐日评论文档的潜正在重心开采为图节点,并将每个文本接连到\bar o具有最大合连概率的重心节点。为了与之前的斟酌相似 [Sawhney et al., 2021b],本文通过对 BERT 结尾一层的令牌级别输出举办均匀来天生文本节点的初始形态 [Devlin et al., 2019]。每个重心节点都通过基于其正在词汇外上的概率散布加权词嵌入来暗示。
另外,连接交付的股票评论平时集结正在几个特定实体上,这些实体互补地描画了动态的公司形态。正在这方面,本文行使实体链接用具 TAGME (/group/tagme/)来识别每个文本中的蓄志义的点,并将它们映照到 Wikipedia 中的合连实体。然而,仅基于显式包蕴的实体酿成的文本干系大概是寥落的。受 [Hu et al., 2019] 的启迪,咱们进一步正在一致实体节点之间附加边,以督促语义练习中的音信扩散。全体来说,咱们应用正在维基百科注脚语料库上练习的 word2vec 来巩固实体嵌入。然后,借使它们的余弦一致度高于阈值\delta,则接连一对实体以最终确定图组织\mathcal{G}_i^\tau。
本文通过众头自留意力层达成\mathrm{Attention}_{\mathrm{node}}[Vaswani et al., 2017]。这么做的合键动机是来自统一干系类型的众个节点邻人能够正在外征特定公司概略方面彼此增补( 如 ,“Apple” 和 “iPhone”实体之间的隐含语义合连性,以及“身手改进”重心和“推出新产物”)。
映照后,self-attention 算子通过合切上下文节点(键)行使元素依赖干系来巩固v(盘查)的暗示:
暗示来自完全M个留意力头的输出向量的串联(concat),缩放点积(scaled dot product)丈量区别邻人的音信量以举办上下文总结。
正在L轮的图合连性层之后,行使基于两个众层感知机(暗示为f_1、f_2)的软门转换来整合完全文本节点的特质。 因为每条评论都正在当天的公家声响中发扬影响,而特别的评论更明晰地做出功绩,咱们合伙行使最大池化和均匀函数来天生\mathcal{F}_i^\tau的最终激情嵌入,界说为:
若何正在回想期内有用地整合动态速照中的众种音信,是察觉股票演化次序以举办异日走势预测的另一个合节题目。 遵照 EMH 和 BF 文献 [Malkiel, 2003; Shiller, 2003],股票代价能够实时对来自社交媒体的心思信号做出反响,进而胀动公家对新墟市处境的预期。 通过归纳筑模这种高度合连的左右开弓的身分来练习不竭变革的股票概略至合紧急。
如图 2 所示,本文将 twins-GRU 细胞中的神经单位暗示为\Psi。 以代价嵌入为例,正在每个时分步\tau处,新的输入向量p^*_{i,\tau}和来自代价和媒体序列c^p_{i,\tau-1},c^e_{i,\tau-1}的两个前身埋伏形态被输入\Psi,使得双音信同时被团结以外征动态上下文。 合于语义和代价身分的区别影响,\Psi中的\oplus运算符举办了留意力乞降:
此中\nu_c是留意力向量。\Psi中的模块\mathcal{J}通过群集层进一步转换同一的埋伏形态:
该框架的结尾一一面调和了通盘音信流,以练习股票的紧凑暗示以举办利润排名。 直观地说,汗青贸易日具有区别的预测影响,此中具有深远评论和热烈代价变革的日子平时会更热烈地激起投资者的举止。 同时,对金融界限霍克斯进程的斟酌阐明,新兴墟市变量的影响会跟着时分的推移而削弱 [Bacry et al., 2015]。因而,本文通过同时研究特质显着性和时分衰减来举办日级集合。\tau日的权重指定为:
本文通过将Z_t传达到一个带有LeakyReLU激活函数群集层以得到股票t日的预期回报率\hat{r}_{[1:N]}^t。基于逐点回归和成对排序耗费的合伙优化,正在坚持股票的相对按次的同时,最小化\hat{r}^t_{[1:N]}和线:N]}之间的分别:
[Xu and Cohen, 2018] 包蕴 2014 年 1 月至 2016 年 1 月时候的 109,915 条英语 Twitter 数据,涉及 88 只高血本范围的股票,这些股票来自大作的程序普尔 500 归纳指数,涵盖纳斯达克和纽约证券贸易所墟市的 9 个行业。 推文和股票应用股票代码的正则外达式盘查相干(比如,Apple 的 $AAPL)。 前 19 个月的样本用于练习,后 3 个月的样本用于测试,其余的则定时分按次举办验证。
[Huang et al., 2018] 正在 2015 年 1 月和 12 月时候从合键金融网站征求了 90,361 条中文信息头条。它针对 99 只贸易量最高的 A 股和港股股票,涵盖上海、深圳和香港贸易所墟市。 样本定时分按次划分,前 8 个月用于练习,后 3 个月用于测试,其余用于验证。
本文从 Wind 征求拆分调解后的开盘价、最高价、最低价、收盘价和成交量目标,组成完全股票的逐日代价向量。 本文坚持与之前的事务 [Sawhney 等人,2021b] 无别的配置,并行使连接 5 天的回溯贸易窗口(即 5 个逐日速照)来天生每个样本。为了修建异构文档图,本文将重心节点的数目
t-1天收盘时,贸易者买入预期收益最高的\kappa只股票,然后正在第二天收市时卖出买入的股票。
本文更迫近于正在语义和时分筑模中外明本文模子的留意力机制。图 5 的上半一面可视化了分拨给股票 $ABB 的随机抽样审查的节点级和类型级权重 HAP。文本自己和实体干系受到更高的合切。这意味着包蕴实体的内正在文本实质和合连学问(比如,智能家居、飞利浦,它们揭示了企业交易改进和互助伙伴干系的细粒度线索)是外征评论语义的最有效的音信。图 5 的左下角周到评释了正在给定下一个输入的处境下对区别形式(代价和媒体影象形态)的留意力。
本文提出了 HISN,一种用于股票认识和推举的异构交互速照搜集。 本文开始策画了一个机动的 HAP 框架,用于对每只股票的动态速照的媒体投资评论举办筑模,该框架连合了特地的音信来捕捉隐含的语义合连性。 本文还提出了一个twin-GRU,它以交叉交互的形式耦合墟市和媒体信号,以便沿着时分轨迹逮捕它们的细粒度彼此依赖干系。 大方实行阐明,HISN 能够识别不竭变革的股票形态,从而有利于投资推举的红利才干。
转载请注明出处。