2023-02-21 17:13发布
什么是量化交易
在介绍统计套利之前,我们可以再温习一下量化交易的概念。量化交易是通过数学方法(特别是统计学方法)来分析历史数据,从而来识别交易的机会的交易方式。量化交易的方法论适用于从宏观经济事件到期货tick价格数据等各种可量化的信息。当量化交易模型被交易者使用时,其交易决策将严格基于计算机算法来进行。
统计套利就是将统计学分析方法应用于套利交易的一个例子。
2. 统计套利
套利交易本身有悠久的历史,我们可以认为人类的贸易活动,即利用商品在不同地点的定价不同来获利,就是最早的(跨市场)套利交易。
统计套利作为许多大型投资银行和对冲基金的常规量化交易策略已经有了较长的历史。统计套利起源于 20 世纪 80 年代,为摩根士丹利等银行率先使用。该策略其后在金融市场上得到了广泛的应用,一直持续到今天。投资者基于统计套利的框架设计了繁多的模型,也获得了可观的投资回报。
统计套利是包含一套定量驱动的交易策略,可以用简单的术语进行定义。这些策略通过分析标的资产的价格规律和多个资产之间的价格差异来获利。这种策略的最终目的是产生 alpha (高于正常市场回报率)。这里需要注意的一点是,有些投资者认为“统计套利”并不包含高频交易策略(high-frequency trading, HFT)。他们认为传统的统计套利交易周期在几个小时到几周内,属于“中频交易策略”。当然高频交易员也很喜爱统计套利的方法论,他们毫不犹豫地在秒级别或tick级别上采用这些价差交易的方法。
3. 统计套利策略中的概念
为了分析价格模式和价格差异,策略使用了很多的统计和数学模型。除了构建价差模型所必须的历史价格数据之外,统计套利策略还可以使用诸如市场超前/滞后效应的判断指标,企业活动,短期动量,资金流动等因素来设计。采用价格之外其他因子的统计套利方法也被称之为多因子统计套利模型。统计套利策略使用的各种概念包括:
时间序列分析(Time Series Analysis)
自回归和协整分析(AutoRegression and Co-integration)
波动率建模(Volatility modeling)
主成分分析(Principal Components Analysis)
模式发现技术(Pattern finding techniques)
机器学习技术(Machine Learning techniques)
有效边界分析(Efficient frontier analysis)
4. 统计套利策略的类型
不同的统计套利策略包括如下:
市场中性套利(Market Neutral Arbitrage)
跨资产类别套利(Cross Asset Arbitrage)
跨市场套利(Cross Market Arbitrage)
ETF 套利(ETF Arbitrage)
市场中性套利
该策略在被显著低估的资产中选择标的做多,同时在被显著高估的资产中选择标的做空。我们尽量挑选那些价格相关性较高且具有相似的波动率的资产。一部分的市场资产的增值,必定会导致一部分的市场资产的减值,这将降低我们的风险敞口。当市场资产价格恢复到正常价值时,做多和做空的资产的价差也会回归到正常值,使我们最终获利。
跨市场套利
该策略试图利用同一(或非常类似的)资产(比如原油)在不同市场(比如美国CME、欧洲ICE和中国的INE)上的价格差异来获利。投资者在该资产被相对低估的市场上做多,同时在被相对高估的市场上做空。其操作方式和现货贸易本身也有很多共同点。
跨资产套利
这个模型考虑了金融资产与其基础资产之间的价格差异。例如,股票指数期货和形成指数的一篮子股票之间。
ETF 套利
与跨资产套利类似,ETF 套利可以视为跨资产套利的一种形式,投资者识别 种类繁多的ETF 的价值与其相关资产之间的差异来进行交易。
配对交易(pair trading)
配对交易通过基于发掘具有较高相关性的两种资产出现异常的价差来交易。例如,当一只股票(比如微软)表现优于另一只股票(比如谷歌)时,表现较差的股票可能会随着投资者搜寻低估值股票的活动,从而缩小与高估值股票的价差。这个过程是通过投资者舍弃高估值资产、搜寻低估值资产的交易习惯获利。由于有大量的股票参与到统计套利策略中,所以投资组合的资金周转率非常高,而且配对交易投资者去捕捉的可获利价差有时也只出现在转瞬之间,所以这种策略通常是以自动化的方式实施的,且投资者高度重视通过各种技术手段来降低交易成本。
统计套利策略是如何运作的?
像股票或大宗商品这样的资产,随着经济变化或其供需变化,往往有明显的上涨和下跌的周期。定量的方法就是利用在不同周期中资产价差的变动来获利。
在上面的图片中,螺纹钢 和 热卷 的期货价格在过去六年内呈现非常强的相关性。我们可以从图中看到两个商品在整个时间段内价格走势几乎一致,只有一些特定的情况下才产生价格分离情况。正是这些价格分离情况,带来了套利机会,同时我们需要验证当价差出现后其是否会回归。
识别这种交易机会的关键点在于两个因素:
我们需要一些处理时间序列的方法,从而来识别两只资产价格走势是否强相关;
如何找到“最佳”价差,从而以比较低的风险开始建仓;
在很多的交易平台上面有很多的交易指标来帮助我们识别价差和进行交易。但是,很多时候,交易成本在总的交易过程中是至关重要的,很多投资者在计算预期收益时可能会忽略了交易成本。因此,建议算法交易者在进行套利交易回测时,将自己的统计套利成本考虑在内(比如在真格量化中设置适当的手续费及滑点),从而得到一个更接近实际的收益估算。
统计套利的风险
虽然统计套利策略历史上为投资者赚取了大量的利润,但是这些策略也可以带来一系列的交易风险,以下是一些经常碰到的风险:
该策略在很大程度上取决于价差回归到历史平均水平或者预测的正常水平,但是这在某些情况下可能不会发生,价格可能会继续偏离历史常态。
金融市场一直处于不断变化之中,并且基于全球发生的各种事件不断演变。我们基于历史数据得到的规律并不一定在未来持续有效。
— — — — — — E N D — — — — — —
往期文章:
Numpy处理tick级别数据技巧
真正赚钱的期权策略曲线是这样的
多品种历史波动率计算
如何实现全市场自动盯盘
AI是怎样看懂研报的
真格量化策略debug秘籍
真格量化对接实盘交易
常见高频交易策略简介
如何用撤单函数改进套利成交
Deque提高处理队列效率
策略编程选Python还是C++
如何用Python继承机制节约代码量
十大机器学习算法
如何调用策略附件数据
如何使用智能单
如何扫描全市场跨月价差
如何筛选策略最适合的品种
活用订单类型规避频繁撤单风险
真格量化回测撮合机制简介
如何调用外部数据
如何处理回测与实盘差别
如何利用趋势必然终结获利
常见量化策略介绍
期权交易“七宗罪”
波动率交易介绍
推高波动率的因素
波动率的预测之道
趋势交易面临挑战
如何构建知识图谱
机器学习就是现代统计学
AI技术在金融行业的应用
如何避免模型过拟合
低延迟交易介绍
架构设计中的编程范式
交易所视角下的套利指令撮合
距离概念与特征识别
气象风险与天气衍生品
设计量化策略的七个“大坑”
云计算在金融行业的应用
机器学习模型评估方法
真格量化制作期权HV-IV价差
另类数据介绍
TensorFlow中的Tensor是什么?
机器学习的经验之谈
用yfinance调用雅虎财经数据
容器技术如何改进交易系统
Python调用C++
如何选择数据库代理
真格量化可访问:
https://quant.pobo.net.cn
遇到了技术问题?欢迎加入真格量化Python技术交流QQ群 726895887
最多设置5个标签!
什么是量化交易
在介绍统计套利之前,我们可以再温习一下量化交易的概念。量化交易是通过数学方法(特别是统计学方法)来分析历史数据,从而来识别交易的机会的交易方式。量化交易的方法论适用于从宏观经济事件到期货tick价格数据等各种可量化的信息。当量化交易模型被交易者使用时,其交易决策将严格基于计算机算法来进行。
统计套利就是将统计学分析方法应用于套利交易的一个例子。
2. 统计套利
套利交易本身有悠久的历史,我们可以认为人类的贸易活动,即利用商品在不同地点的定价不同来获利,就是最早的(跨市场)套利交易。
统计套利作为许多大型投资银行和对冲基金的常规量化交易策略已经有了较长的历史。统计套利起源于 20 世纪 80 年代,为摩根士丹利等银行率先使用。该策略其后在金融市场上得到了广泛的应用,一直持续到今天。投资者基于统计套利的框架设计了繁多的模型,也获得了可观的投资回报。
统计套利是包含一套定量驱动的交易策略,可以用简单的术语进行定义。这些策略通过分析标的资产的价格规律和多个资产之间的价格差异来获利。这种策略的最终目的是产生 alpha (高于正常市场回报率)。这里需要注意的一点是,有些投资者认为“统计套利”并不包含高频交易策略(high-frequency trading, HFT)。他们认为传统的统计套利交易周期在几个小时到几周内,属于“中频交易策略”。当然高频交易员也很喜爱统计套利的方法论,他们毫不犹豫地在秒级别或tick级别上采用这些价差交易的方法。
3. 统计套利策略中的概念
为了分析价格模式和价格差异,策略使用了很多的统计和数学模型。除了构建价差模型所必须的历史价格数据之外,统计套利策略还可以使用诸如市场超前/滞后效应的判断指标,企业活动,短期动量,资金流动等因素来设计。采用价格之外其他因子的统计套利方法也被称之为多因子统计套利模型。统计套利策略使用的各种概念包括:
时间序列分析(Time Series Analysis)
自回归和协整分析(AutoRegression and Co-integration)
波动率建模(Volatility modeling)
主成分分析(Principal Components Analysis)
模式发现技术(Pattern finding techniques)
机器学习技术(Machine Learning techniques)
有效边界分析(Efficient frontier analysis)
4. 统计套利策略的类型
不同的统计套利策略包括如下:
市场中性套利(Market Neutral Arbitrage)
跨资产类别套利(Cross Asset Arbitrage)
跨市场套利(Cross Market Arbitrage)
ETF 套利(ETF Arbitrage)
市场中性套利
该策略在被显著低估的资产中选择标的做多,同时在被显著高估的资产中选择标的做空。我们尽量挑选那些价格相关性较高且具有相似的波动率的资产。一部分的市场资产的增值,必定会导致一部分的市场资产的减值,这将降低我们的风险敞口。当市场资产价格恢复到正常价值时,做多和做空的资产的价差也会回归到正常值,使我们最终获利。
跨市场套利
该策略试图利用同一(或非常类似的)资产(比如原油)在不同市场(比如美国CME、欧洲ICE和中国的INE)上的价格差异来获利。投资者在该资产被相对低估的市场上做多,同时在被相对高估的市场上做空。其操作方式和现货贸易本身也有很多共同点。
跨资产套利
这个模型考虑了金融资产与其基础资产之间的价格差异。例如,股票指数期货和形成指数的一篮子股票之间。
ETF 套利
与跨资产套利类似,ETF 套利可以视为跨资产套利的一种形式,投资者识别 种类繁多的ETF 的价值与其相关资产之间的差异来进行交易。
配对交易(pair trading)
配对交易通过基于发掘具有较高相关性的两种资产出现异常的价差来交易。例如,当一只股票(比如微软)表现优于另一只股票(比如谷歌)时,表现较差的股票可能会随着投资者搜寻低估值股票的活动,从而缩小与高估值股票的价差。这个过程是通过投资者舍弃高估值资产、搜寻低估值资产的交易习惯获利。由于有大量的股票参与到统计套利策略中,所以投资组合的资金周转率非常高,而且配对交易投资者去捕捉的可获利价差有时也只出现在转瞬之间,所以这种策略通常是以自动化的方式实施的,且投资者高度重视通过各种技术手段来降低交易成本。
统计套利策略是如何运作的?
像股票或大宗商品这样的资产,随着经济变化或其供需变化,往往有明显的上涨和下跌的周期。定量的方法就是利用在不同周期中资产价差的变动来获利。
在上面的图片中,螺纹钢 和 热卷 的期货价格在过去六年内呈现非常强的相关性。我们可以从图中看到两个商品在整个时间段内价格走势几乎一致,只有一些特定的情况下才产生价格分离情况。正是这些价格分离情况,带来了套利机会,同时我们需要验证当价差出现后其是否会回归。
识别这种交易机会的关键点在于两个因素:
我们需要一些处理时间序列的方法,从而来识别两只资产价格走势是否强相关;
如何找到“最佳”价差,从而以比较低的风险开始建仓;
在很多的交易平台上面有很多的交易指标来帮助我们识别价差和进行交易。但是,很多时候,交易成本在总的交易过程中是至关重要的,很多投资者在计算预期收益时可能会忽略了交易成本。因此,建议算法交易者在进行套利交易回测时,将自己的统计套利成本考虑在内(比如在真格量化中设置适当的手续费及滑点),从而得到一个更接近实际的收益估算。
统计套利的风险
虽然统计套利策略历史上为投资者赚取了大量的利润,但是这些策略也可以带来一系列的交易风险,以下是一些经常碰到的风险:
该策略在很大程度上取决于价差回归到历史平均水平或者预测的正常水平,但是这在某些情况下可能不会发生,价格可能会继续偏离历史常态。
金融市场一直处于不断变化之中,并且基于全球发生的各种事件不断演变。我们基于历史数据得到的规律并不一定在未来持续有效。
— — — — — — E N D — — — — — —
往期文章:
Numpy处理tick级别数据技巧
真正赚钱的期权策略曲线是这样的
多品种历史波动率计算
如何实现全市场自动盯盘
AI是怎样看懂研报的
真格量化策略debug秘籍
真格量化对接实盘交易
常见高频交易策略简介
如何用撤单函数改进套利成交
Deque提高处理队列效率
策略编程选Python还是C++
如何用Python继承机制节约代码量
十大机器学习算法
如何调用策略附件数据
如何使用智能单
如何扫描全市场跨月价差
如何筛选策略最适合的品种
活用订单类型规避频繁撤单风险
真格量化回测撮合机制简介
如何调用外部数据
如何处理回测与实盘差别
如何利用趋势必然终结获利
常见量化策略介绍
期权交易“七宗罪”
波动率交易介绍
推高波动率的因素
波动率的预测之道
趋势交易面临挑战
如何构建知识图谱
机器学习就是现代统计学
AI技术在金融行业的应用
如何避免模型过拟合
低延迟交易介绍
架构设计中的编程范式
交易所视角下的套利指令撮合
距离概念与特征识别
气象风险与天气衍生品
设计量化策略的七个“大坑”
云计算在金融行业的应用
机器学习模型评估方法
真格量化制作期权HV-IV价差
另类数据介绍
TensorFlow中的Tensor是什么?
机器学习的经验之谈
用yfinance调用雅虎财经数据
容器技术如何改进交易系统
Python调用C++
如何选择数据库代理
真格量化可访问:
https://quant.pobo.net.cn
遇到了技术问题?欢迎加入真格量化Python技术交流QQ群 726895887
一周热门 更多>