统计套利
统计套利(或 Stat Arb)是指利用均值回归分析在多达数千种证券的多样化投资组合中进行投资的交易策略,投资时间通常只有几秒钟,但也可能长达数天。
统计套利旨在通过两个阶段尽可能减少对贝塔的暴露:
- “评分”:根据投资的可取性对每只可用股票进行排名
- “风险降低”:将可取的股票组合成一个专门设计的投资组合,旨在降低风险
市场中性
统计套利策略是市场中性的,因为它们同时开立多头和空头头寸,以利用相关证券中的定价低效。
统计套利的风险
统计套利在很大程度上依赖于市场价格回归到历史或预测的正常水平。
然而,即使是同一行业的股票,由于微观和宏观因素的影响,也可能在相当长的时间内保持不相关。
因此,大多数统计套利策略利用高频交易算法来利用微小的低效。
需要在两只股票上持有大量头寸,以从如此微小的价格变动中获得足够的利润。这增加了统计套利策略的额外风险。
统计套利的关键点
- 统计套利是一组交易策略,采用大型、多样化的投资组合,并在非常短的时间内进行交易。
- 这种类型的交易策略为股票分配一个可取性排名,然后构建一个尽可能降低风险的投资组合。
- 统计套利在很大程度上依赖于计算机模型和分析。
配对交易
配对交易是一种市场中性的交易策略,涉及识别两个价格历史上一起波动且当前表现出一定程度价格背离的证券。该策略押注于这对证券回归其历史均值,当价格再次趋同时获利。
简化的统计套利策略:选择两个形成协整关系的资产,并利用均值回归方法构建交易策略。
这可以通过对两种资产(如一对 ETF)进行线性回归来实现,并使用此方法确定在特定阈值下每种资产的多头和空头头寸。
参考链接:
使用机器学习的 GOOG/GOOGL 配对交易策略 http://cs229.stanford.edu/proj2015/028_report.pdf
通过线性回归计算对冲比率
这种策略的主要问题之一是通过这种结构关系引入的任何参数(如两种资产之间的对冲比率)可能是时间变化的。
解决此问题的一种方法是使用带有回溯窗口的滚动线性回归。这涉及在每个时间段更新线性回归,以便斜率和截距项“跟随”协整关系的最新行为。
然而,这也引入了策略中的另一个自由参数,即回溯窗口长度。通常需要通过交叉验证来优化此参数。
卡尔曼滤波器
一种更复杂的方法是利用状态空间模型,将“真实”对冲比率视为未观察到的隐藏变量,并尝试用“噪声”观测值来估计它。在我们的例子中,这意味着每种资产的定价数据。
卡尔曼滤波器正是执行此任务的工具。卡尔曼滤波器可以被视为一种贝叶斯更新过程。
卡尔曼滤波器是一种递归算法,广泛应用于统计估计和控制系统领域。它在从一系列噪声测量中估计线性动态系统的状态方面特别有效。
状态方程
其中:
- $\hat{\mathbf{x}}_{n+1,n}$ 是时间步长 n+1 时的预测系统状态向量
- $\hat{\mathbf{x}}_{n,n}$ 是时间步长 n 时的估计系统状态向量
- $\hat{\mathbf{u}}_{n,n}$ 是控制变量或输入变量 - 可测量的(确定性)输入到系统
- $\mathbf{w}_n$ 是过程噪声或干扰 - 影响状态的不可测量输入
- $\mathbf{F}$ 是状态转移矩阵
- $\mathbf{G}$ 是控制矩阵或输入转移矩阵(将控制映射到状态变量)
测量方程
其中:
- $\mathbf{z}_n$ 是测量向量
- $\mathbf{x}_n$ 是真实的系统状态(隐藏状态)
- $\mathbf{v}_n$ 是随机噪声向量
- $\mathbf{H}$ 是观测矩阵
卡尔曼滤波器的工作原理
卡尔曼滤波器在噪声输入数据流上递归地运行,以产生系统状态的统计最优估计。以下是它的操作步骤:
初始化
在应用滤波器之前,需要设置初始状态估计和误差协方差。这包括:- 初始状态估计: 系统状态的初始猜测。
- 初始误差协方差: 初始估计不确定性的度量。
预测
卡尔曼滤波器使用系统的物理特性预测下一个系统状态,通常以线性方程的形式表示。这一步包括两个主要方程:状态预测方程: 基于当前状态估计预测下一个状态。
协方差预测方程: 预测下一个协方差估计,表示估计的不确定性。
更新
当有新的测量数据可用时,滤波器更新其估计:- 测量更新方程: 将新的测量值纳入状态估计。
- 协方差更新方程: 更新更新后估计的误差协方差。
卡尔曼滤波器的关键特点:
- 最优性: 在某些条件下(如高斯误差),卡尔曼滤波器是最优估计器。
- 估计和更新: 它不断估计系统状态,并根据新数据更新这一估计。
- 高效性: 它在处理当前测量值和上一状态来生成新状态时计算量较小。
由于其在处理不确定环境中的稳健性和高效性,卡尔曼滤波器广泛应用于跟踪和导航系统、金融时间序列预测等领域。
回忆线性回归的方程式
以向量形式重写
卡尔曼滤波器是一个线性状态空间模型,它递归地在噪声输入数据流上运行,以产生系统潜在状态的统计最优估计。卡尔曼滤波器状态空间模型的一般形式包括转移方程和观测方程:
其中 $x_t$ 和 $z_t$ 分别是时间 $t$ 时的隐藏状态和观测向量。$A_t$ 和 $H_t$ 是转移矩阵和观测矩阵。$w_t$ 和 $v_t$ 是均值为零的高斯噪声。
我们假设隐藏状态变量 $x_t$ 是上述向量 $\beta$ 表示的线性回归的斜率和截距。我们还假设斜率和截距遵循随机游走,将 $A_t$ 设置为单位矩阵。我们的转移方程现在看起来像
这只是说下一个时间步长的 $\beta$ 是当前 $\beta$ 加上一些噪声。
我们将把模型拟合到卡尔曼滤波器的观测方程。
为此,我们将一个资产价格设为观测值 $z_k$,观测矩阵 $H_k$ 是一个 1x2 的向量,其中包含另一个资产价格作为第一列,第二列为 1,与上述 $\beta_k$ 向量相同。
这只是两种资产之间的线性回归。
离场策略
对于对冲交易的有效管理,不仅需要明确的进场策略,还需要制定完善的离场策略,包括获利了结和止损的机制。
以下是几种在对冲交易中使用的退出信号方法:
固定止损和止盈水平: 最简单的退出方法是设置固定的止损或止盈阈值,如:
- 固定美元金额或百分比: 当损失超过某个美元金额或交易价值的一定百分比时平仓。
- 固定价差值: 由于对冲交易通常涉及两种资产的价差,当价差达到特定绝对值时平仓可能很有效。
标准差(波动率)止损: 由于对冲交易策略通常涉及统计测量,因此可以使用价差的标准差来设置动态止损或止盈水平:
- 止损: 如果价差从平均值偏离超过 X 个标准差,则触发平仓信号。这可以在意外市场波动发生时避免亏损恶化。
- 止盈: 相反地,如果价差收紧到平均值的一定标准差范围内,可以获利了结。
移动止损: 移动止损是动态的,会随着价差朝有利方向移动而调整。这种方法有助于锁定利润,同时给交易足够的空间:
- 按百分比或绝对值移动: 止损单设置在当前价差价格一定距离处,并随着价格改善而调整。
- 按波动率倍数移动: 类似于标准差止损,但止损点会随着价差波动性的变化而动态调整。
基于时间的出场: 有时,如果一个对冲交易在一定时间内没有回归平均值,考虑到机会成本和资金占用,及时平仓可能更合适:
- 最长持有期: 如果预期的均值回归在一定时间框架(如几天、几周或几个月)内没有发生,则平仓。
技术指标: 技术指标也可以提供对冲交易的出场信号。常见选择包括:
- 移动平均线: 当价差重新跨越移动平均线时平仓,表示均值回归可能结束。
- 相对强弱指数(RSI)或其他振荡指标: 这些可以表明价差相对最近走势处于超买或超卖状态,提供平仓依据。
经济或基本面信号: 特别是在对冲交易中,资产基本面或经济条件的变化都很重要。行业状况、监管环境或宏观经济因素的变化可能永久性改变历史相关性,这些都应该触发平仓。
实施退出策略
通常通过在券商平台设置条件单来实施这些策略。许多平台允许设置止损、移动止损等高级订单类型,可以根据退出策略的参数进行设置。
有效的退出策略要平衡上行潜力和下行风险,旨在最大化利润,同时最小化损失。通过回测来平衡这两者,可以显著提高对冲交易策略的有效性。
对冲交易的进一步工作
- 将卡尔曼滤波器的结果与简单的滚动线性回归进行比较
- 选择其他一些股票对来测试结果
- 讨论: 我们使用的方法是否存在样本内问题?
- 提出一种系统的方法来选择股票对