期货高频交易波动率指标 期货高频交易波动率指标有哪些
什么是量化投资交易策略
一文看懂量化投资策略
闲话基
量化投资在近些年受到越来越多的关注,包括规模、策略、业绩。量化投资,是指通过借助统计学、数学方法,运用计算机从海量历史数据中,寻找能够带来超额收益的多种“大概率”策略,按照策略构建的数量模型严格执行投资,力求获得长期稳定可持续高于平均的超额回报。
跟传统的主动管理方法相比,量化投资是高投资颤芦广度、低投资深度的一种投资方法。量化投资强调纪律投资,可以克服投资者主观情绪的影响。
现在市场上运用的策略有很多种,下面来看看主流的几种策略。
一、市场中性策略
市场中性策略是国内使用最多的策略。根据CAPM理论,股票收益由两部分组成,一部分是市场整体风险的beta收益,一部分是股票自身风险带来的alpha收益。中性策略是从消除市场系统性风险的维度出发,通过同时构建多头和空头头寸对冲市场风险,以获得较稳定的绝对收益。国内通常使用的操作方法是,买入股票,同时卖空与股票等市值的股指期货。盈利模式是,所买股票超越大盘的涨跌幅度。市值对冲并不是完全的beta对冲,但可以减少计算量,降低调仓率,为国内投资机构普遍使用。
Alpha策略关键点是选出的股票组合收益要持续跑赢沪深300指数,在市场上涨时平均涨幅大于沪深300指数,在市场下跌时平均跌幅小于沪深300指数,并且可持续稳定。
通常管理人根据估值、成长性、市值、动量、预期变动、资金关注、技术指标、事件、业绩等多个维度进行量化选股,构造投资组合,同时以沪深300行业配置比例为基准,对系统筛选出的股票根据宏观经济和行业景气进行差异化配置,并定期根据各因子变动进行动态调整组合。
构建中性策略,买入100元股票组合,卖空100元股指期货,多头与空头组合价值相等:
1、市场上涨:股票组合(上涨赚钱)+指数收益(上涨亏钱)=10%+(-7%)=3%
2、市场下跌:股票组合(上涨赚钱)+指数收益(上涨亏钱)=(-7%)+10%=3%
3、市场震荡:股票组合(上涨赚钱)+指数收益(上涨亏钱)=10%+(7)=17%
Alpha策略最主要风险在于选股策略上。
选股模型可能会因为股票市场规律性变动、突发事件和统计模型本身的概率属性,在某些时间段出现失效,导致做多的股票跑输市场出现短期亏损。这需要基金经理能不断完善茄虚带投资模型和操作技巧提升获胜概率。此外,Alpha策略还收到基差的影响。大部分时候会有一定的升贴水损失,策略对基差的风控非常重要。
二、套利策略
1、统计套利
统计套利是对历史数据进行统计分析,估计相关变量的概率分布,结合基本面数据分析,用来进行套利交易。
运用统计分析工具,对一组相关联的价格之间的关系的历史数据进行研究分析,研究关系的历史稳定性,并估计其概率分布,确定分布中的极端区域,即否定域。当真实市场上的价格关系进入否定域,可以认为这种价格关系不可长久持续,此时有较高的成功概率进场套利。
2、期现套利
期现套利指利用期货与现货基差扩大产生的套利机会,做多被低估标的,做空被高估标的,待期现基差回归至合理范围后,平仓离场的低风险策略。
期现套利策略,根据沪深300股指期货与沪深300指数基差到期时必定收敛的交易机制。当期货指数与沪深300指数基差足够大时,可以通过构建一个反向组合,获得基差收敛过程中产生的收益。目前国内只能进行“做空基差”的正向套利,即当基差大于0的时候,买入股指ETF或者一揽子股票,同时卖出等市值股指期货,待价差收敛后平仓。当基差小于0时,由于融券不足,无法通过卖出股指ETF或者一揽子股票同时买入等市值的股指期货进行“做多基差”的反向套利。当期货价格深深贴水的时候,因融券存在障碍反向套利被切断,贴水状态自由发展,只能通过市场大幅度反弹,多头的投机者重新将价格抬升至升水的状态。这也是市场贴水一直无法及时恢复的重要原因。
期现套利的主要风险在于市场价格出现剧烈波动导致浮亏,具体表现为所跟踪标的之间的基差出现长时间不回归甚至反向逆转,期现收益无法有效覆盖交易成本、冲击成本、现金成本等风险。
3、ETF套利
ETF套利,是指投资者可以在一级誉空市场通过置顶的ETF交易商想基金管理公司,用一揽子股票组合申购ETF份额,或者把ETF份额赎回成一揽子股票组合,同时可以在二级市场以市场价格买卖ETF。
假设某只ETF成分股暴跌,使得该ETF净值迅速走低,但该ETF的市场价格未能及时跟上,两者短暂地出现一个价差,此时可以买入ETF一揽子股票组合申购成ETF,然后将ETF在二级市场卖出,实现低买高卖,获取价差。
ETF套利的两种交易顺序,一种是从股票二级市场买入一揽子股票,按一定比例换成ETF份额,然后在二级市场卖出ETF份额,前提是一揽子股票价格比ETF价格低,出现溢价;另一种是,从ETF二级市场买入份额,按照一定比例兑换成一揽子股票,在拿到股票二级市场卖出,这样的前提是ETF价格低于一揽子股票价格,出现折价。
4、分级基金套利
分级基金有2种套利模式。
一种方式是当母子基金比价出现折溢价时可进行套利。当A/B份额的组合价格大于母基金净值时,存在整体溢价套利机会。通过场内申购母基金份额,分拆成A和B并在二级市场卖出完成溢价套利。当A/B份额的组合价格小于母基金净值时,存在整体折价套利机会。通过在二级市场按比例买入A类份额和B类份额,申请合并成母份额并赎回完成折价套利。
但是折溢价套利不能实时完成,需要面临1-2个交易日的价格波动风险。可以通过股指期货对冲管理风险敞口。
一般在牛市中溢价套利机会比较多,在震荡市场中折价套利机会更多、胜率更高。
另一种套利方式是,市场下跌时,含下折算条款的分级基金A份额包含的期权价值套利,同时还有在整体折溢价套利基础上演的底仓-对冲溢价套利、循环折价套利。
三、CTA策略
CTA策略是投向期货市场,使用历史数据,通过统计、数学、编程的方法找到盈利规律。分为趋势策略和套利策略。
趋势策略是跟随者市场上涨做多,市场下跌做空,因此在任何一种期货商品进入趋势后,CTA策略就会获得良好的收益空间。
套利策略是通过跨期限、跨市场、跨品种等不同合约之间的“价差回归”,锁定套利空间。
跨期限是指同一交易品种,不同交易周期间的套利。历史数据表明期货不同合约价格相关性高,价差出现稳定的统计特征。当两个不同到期月份合约/不同品种合约之间的价差偏离合理区间时,可以通过在期货市场同时买入低估值合约和卖出高估值合约,在价差回归后进行反向平仓,进行跨期限套利交易。
更加具体地说,跨期套利是指不同月份期货支架的套利。通过多远空近或多近空远,来买卖同一市场同种商品不同到期月份的期货合约,利用不同到期月份合约的价差变动来获利的套利模式。
交易过程如下:
跨品种与跨期现套利逻辑相似,只是使用在同一期限不同品种合约之间,具体投资流程如下:
跨市场套利,在某个交易所买入(卖出)某一交割月份的某种商品合约,同时在另一个交易所卖出(买入)统一交割月份的同种商品合约,在有利时机分别在两个交易所对冲获利。
跨市场策略涉及外汇兑换、国际期货交易对冲,交易实现难度大,国内用得少。
由于期货具有杠杆属性,这类策略持仓的市值往往很大,有时候甚至超过产品资产总值,导致收益率的波动率是所有量化策略中最大的。在市场出现连续震荡行情时,这样策略由于杠杆属性会出现较大的回撤。另外一个对这类策略的一个限制是,目前市场上活跃交易的期货品种不多,高频交易很大程度倚重于品种成交量,开平仓时间间隔较短,使得策略容量不大。
期货日内高频短线比较好的指标有哪些
1.移动平均线(MA):MA是期货交易中常用的基础指标之一,可用于日内高频短喊高线交易。通常使用较短的MA(如5天或10天)来捕捉市场短期趋势。2.波动率指标(如ATR):波动率指标可以衡量市场的波动性,帮助交易者调整交易策略。例如,在高波动性环境中,采取较为保守的交易策略可能更为合适。3.相对强弱指标(RSI):RSI可用来度量市场超买和超卖程度,乱颂帮助交易者准确判断买入或卖出时机。4. Bollinger Bands(布林线):布林线是包含三条线的指标,可以反映市场价格的波动幅度。其中中间线是移动平均线,而上下线则是标准差的加减。当价格接近或越过上下线时郑陪尺,可能会发生市场趋势的反转。5.成交量指标:成交量指标可以反映市场的活跃程度和趋势,有利于交易者更好地把握市场走势。6. KDJ指标:KDJ指标是一种基于随机游动理论的技术指标,可用于衡量市场的超买和超卖状态。当KDJ线进入超买区时,意味着市场可能出现回调或反转的机会。
什么是波动率指数
原文链接:http://tecdat.cn/?p=19129
摘要
在学术界和金融界,分析高频财务数据的经济价值现在显而易见。它是每日风险监控和预测的基础,也是高频交易的基础。为了在财务决策中高效利用高频数据,高频时信碰代采用了最先进的技术,用于清洗和匹配交易和报价,以及基于高收益的流动性的计算和预测。
高频数据的处理
在本节中,我们讨论高频金融数据处理中两个非常常见的步骤:(i)清理和(ii)数据聚合。
> dim(dataraw);[1] 48484 7> tdata$report;initial number no zero prices select exchange48484 48479 20795sales condition merge same timestamp20135 9105> dim(afterfirstclean)[1] 9105 7
高频数据的汇总
通常不会在等间隔的时间点记录价格,而许多实际波动率衡量方法都依赖等实际间隔的收益。有几种方法可以将这些异步和/或不规则记录的序列同步为等距时间数据。
最受欢迎的方法是按照时间汇总,它通过获取每个网格点之前的最后价格来将价格强制为等距网格。
>#加载样本价格数据> data("sample");>#聚合到5分钟的采样频率:> head(tsagg5min);PRICE2008-01-04 09:35:00 193.9202008-01-04 09:40:00 194.6302008-01-04 09:45:00 193.5202008-01-04 09:50:00 192.8502008-01-04 09:55:00 190.7952008-01-04 10:00:00 190.420>#聚合到30秒的频率:>滑巧谈 tail(tsagg30sec);PRICE2008-01-04 15:57:30 191.7902008-01-04 15:58:00 191.7402008-01-04 15:58:30 191.7602008-01-04 15:59:00 191.4702008-01-04 15:59:30 191.8252008-01-04 16:00:00 191.670
在上面的示例中,价格被强制设置为5分钟和30秒的等距时间网格。此外,aggregates函数内置于所有已实现的度量中,可以通过设置参数align.by和align.period来调用该函数。在这种情况下,首先将价格强制等间隔的常规时间网格,然后根据这些常规时间段内执行观察值的收益率来计算实际度量。这样做的优点是,用户可以将原始价格序列输入到实际度量中宽蔽,而不必担心价格序列的异步性或不规则性。
带有时间和波动率计算的价格示例:
>#我们假设stock1和stock2包含虚拟股票的价格数据:>#汇总到一分钟:> Price_1min= cbind(aggregatePrice(stock1),aggregatePrice(stock2));>#刷新时间聚合:refreshTime(list(stock1,stock2));>#计算跳跃鲁棒的波动性指标>#基于同步数据rBPCov(Price_1min,makeReturns=TRUE);>#计算跳跃和噪声鲁棒的波动性度量>#基于非同步数据:
实际波动性度量
高频数据的可用性使研究人员能够根据日内收益的平方来估计实际波动性(Andersen等,2003)。实际上,单变量波动率估计的主要挑战是应对(i)价格的上涨和(ii)微观结构噪声。因此多变量波动率估计也引起了人们的注意。高频软件包实施了许多新近提出的实际波动率方法。
下面的示例代码说明了日内周期的估计:
>#计算并绘制日内周期> head(out); returns vol dailyvol periodicvol2005-03-04 09:35:00-0.0010966963 0.004081072 0.001896816 2.1515392005-03-04 09:40:00-0.0005614217 0.003695715 0.001896816 1.9483792005-03-04 09:45:00-0.0026443880 0.003417950 0.001896816 1.801941
波动性预测
学术研究人员普遍认为,如果进行适当的管理,对高频数据的访问将带来优势,可以更好地预测未来价格变化的波动性。早在2003年Fleming等人(2003年)估计,投资者将愿意每年支付50到200个点,来预测投资组合绩效的收益,这是通过使用高频收益率而不是每日收益率来进行波动率预测的。
尽管HAR和HEAVY模型的目标相同,即对条件波动率进行建模,但它们采用的方法不同。HAR模型专注于预测收盘价变化。HAR模型的主要优点是,它易于估计(因为它本质上是一种可以用最小二乘方估计的线性模型), HEAVY模型的主要优点在于,它可以模拟收盘价和收盘价的条件方差。此外,HEAVY模型具有动量和均值回归效应。与HAR模型相反,HEAVY模型的估计是通过正态分布的最大似然来完成的。接下来的本文更详细地介绍HAR模型和HEAVY模型,当然还要讨论并说明如何使用高频收益率来估计这些模型。
HAR模型
示例
将HARRV模型拟合到道琼斯工业指数,我们加载每日实际波动率。
>#每天获取样本实际波动率数据> DJI_RV= realized$DJI;#选择 DJI> DJI_RV= DJI_RV[!is.na(DJI_RV)];#删除缺失值
第二步,我们计算传统的异构自回归(HAR)模型。由于HAR模型只是线性模型的一种特殊类型,因此也可以通过以下方式实现:harModel函数的输出是lm的子级harModel lm,线性模型的标准类。图绘制了harModel函数的输出对象,水平轴上有时间,在垂直轴上有观察到的实际波动率和预测的实际波动率(此分析是在样本中进行的,但是模型的估计系数可以显然用于样本外预测)。从图的检查中可以清楚地看出,harModel可以相对快速地拟合波动水平的变化,
[1]"harModel""lm"> x;Model:RV1= beta0+ beta1* RV1+ beta2* RV5+ beta3* RV22Coefficients:beta0 beta14.432e-05 1.586e-01r.squared adj.r.squared0.4679 0.4608> summary(x);Call:"RV1= beta0+ beta1* RV1+ beta2* RV5+ beta3* RV22"Residuals:Min 1Q Median 3Q Max-0.0017683-0.0000626-0.0000427-0.0000087 0.0044331Coefficients:Estimate Std. Error t value Pr(>|t|)beta0 4.432e-05 3.695e-05 1.200 0.2315beta1 1.586e-01 8.089e-02 1.960 0.0512.beta2 6.213e-01 1.362e-01 4.560 8.36e-06***beta3 8.721e-02 1.217e-01 0.716 0.4745---Signif. codes: 0 ^a˘ A¨ Y***^a˘ A´ Z 0.001 ^a˘ A¨ Y**^a˘ A´ Z 0.01 ^a˘ A¨ Y*^a˘ A´ Z 0.05 ^a˘ A¨ Y.^a˘ A´ Z 0.1 ^a˘ A¨ Y ^a˘ A´ Z 1Residual standard error: 0.0004344 on 227 degrees of freedomMultiple R-squared: 0.4679, Adjusted R-squared: 0.4608F-statistic: 66.53 on 3 and 227 DF, p-value:< 2.2e-16
HARRVCJ模型拟合
估计harModel的更复杂版本。例如,在Andersen等人中讨论的HARRVCJ模型。可以使用示例数据集估算,如下所示:
> data= makeReturns(data);#获取高频收益数据> xModel:sqrt(RV1)= beta0+ beta1* sqrt(C1)+ beta2* sqrt(C5)+ beta3* sqrt(C10)+ beta4* sqrt(J1)+ beta5* sqrt(J5)+ beta6* sqrt(J10)Coefficients:beta0 beta1 beta2 beta3 beta4 beta5-0.8835 1.1957-25.1922 38.9909-0.4483 0.8084beta6-6.8305r.squared adj.r.squared0.9915 0.9661
最后一个示例是仅将日内收益作为输入就可以估算的一种特殊类型HAR模型。
HEAVY模型
将HEAVY模型拟合到道琼斯工业平均指数。第一步,我们加载道琼斯工业平均指数。然后,我们从该库中选择每日收益和每日实际核估计(Barndorff-Nielsen等,2004)。现在,作为HeavyModel输入的数据矩阵的第一列为收益率,第二列为Realized Kernel估计值。我们进一步将参数设置为采样期内日收益率和平均实际核估计方差。现在,我们来估算HEAVY模型。根据模型的输出,图绘制了由模型中的第二个方程式估算的条件方差。
># heavy模型在DJI上的实现:> returns= returns[!is.na(rk)]; rk= rk[!is.na(rk)];#删除NA> startvalues= c(0.004,0.02,0.44,0.41,0.74,0.56);#初始值> output$estparams[,1]omega1 0.01750506omega2 0.06182249alpha1 0.45118753alpha2 0.41204541beta1 0.73834594beta2 0.56367558
流动性
交易量和价格
交易量和价格通常作为单独的数据对象提供。对于许多与交易数据有关的研究和实际问题,需要合并交易量和价格。由于交易量和价格可能会收到不同的报告滞后影响,因此这不是一个简单的操作(Leeand Ready 1991)。函数matchTradesQuotes可用于匹配交易量和价格。根据Vergote(2005)的研究,我们将价格设置为2秒作为默认值。
流动性衡量
可以使用函数tqLiquidity根据匹配的交易量和价格数据计算流动性指标。表中计算了主要实现的流动性衡量指标,并且可以用作函数tqLiquidity的参数。
以下示例说明了如何:(i)匹配交易和报价,(ii)获取交易方向,以及(iii)计算流动性衡量指标。
>#加载数据样本>#匹配交易量和价格数据> tqdata= matchTradesQuotes(tdata,qdata);>#在tqdata中显示信息> colnames(tqdata)[1:6];[1]"SYMBOL""EX""PRICE""SIZE""COND""CORR">#根据Lee-Ready规则推断的交易方向>#计算有效价差> es= tqLiquidity(tqdata,type="es");
最受欢迎的见解
1.HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频波动率
2.WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较
3.波动率的实现:ARCH模型与HAR-RV模型
4.R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
5.使用R语言随机波动模型SV处理时间序列中的随机波动率
6.R语言多元COPULA GARCH模型时间序列预测
7.R语言基于ARMA-GARCH过程的VAR拟合和预测
8.R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
9.R语言对S&P500股票指数进行ARIMA+ GARCH交易策略