变点理论CUSUM在择时交易中的应用

发布时间:2025-05-25 01:18:36 作者:益华网络 来源:undefined 浏览量(1) 点赞(1)
摘要:之前看到一篇文章,变点理论CUSUM在量化交易中;列了一堆数据和公式,说结果不错。链接如下: https://max.book118.com/html/2017/0726/124391946.shtm 或者这个

之前看到一篇文章,变点理论CUSUM在量化交易中;列了一堆数据和公式,说结果不错。链接如下:

https://max.book118.com/html/2017/0726/124391946.shtm

或者这个,就是整理版,有很详细的公式推导,不过代码写的不清不楚的,应该没写完。

https://wizardforcel.gitbooks.io/python-quant-uqer/134.html

花了些时间研究下:

原理描述:CUSUM控制图的设计思想是对信息加以累积,将过程的小偏移累加起来,达到放大的结果,从而提高检验小偏移的灵敏度。CUSUM作为一个统计量,其由来具有严格的数学推理,总的来说,是一个变点假设检验通过极大似然法推导得到的统计量。

具体推导不研究了,直接看具体引用

其实就是我之前文章说到那个那个对数收益率,形成一个对数收益率的近似正太分布。如上图,这里有一个上下允偏量k,这里设为k = 0.02, 先说上阈值, 那么时序队列里面,下一个时段的对数收益率大于0.02,yi则差值为正;如果差值累计yi的和Ci大于h,比如h为0.5。则触发向上趋势。

其实就是如果多次超过 允偏量收益率发生,或者一次非常大的收益率情况发生,使得c值大于h 就会触发向上趋势判断。如果只是偶尔一次大于 允偏量,那么下一次小于k (0.02)时候,差值为负值,和值Ci就变小了,这里Max的作用就是保证C为正,不会因为多次低于k值为负值。向下趋势判断也是同理。

代码如下,这里调用ta-lib库来计算均值和标准差,速度比起用numpy还快一些。用标准差做为 允偏量k;5倍标准差为h 阈值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
# encoding: UTF-8
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import talib
def detect_via_cusum_lg(ts, istart=30, threshold_times=5):
"""
detect a time series using  cusum algorithm
:param ts: the time series to be detected
:param istart: the data from index 0 to index istart will be used as cold startup data to train
:param threshold_times: the times for setting threshold
:return:
"""
S_h = 0
S_l = 0
S_list = np.zeros(istart)
meanArray = talib.SMA(ts,timeperiod = istart)
stdArray = talib.STDDEV(np.log(ts/meanArray),timeperiod = istart)
for i in range(istart+1, len(ts)-1):
tslog = np.log(ts[i] / meanArray[i - 1])
S_h_ = max(0, S_h + tslog - stdArray[i-1])
S_l_ = min(0, S_l + tslog + stdArray[i-1])
if S_h_> threshold_times * stdArray[i-1]:
S_list = np.append(S_list,1)
S_h_ = 0
elif abs(S_l_)> threshold_times *  stdArray[i-1]:
S_list = np.append(S_list, -1)
S_l_ = 0
else:
S_list = np.append(S_list, 0)
S_h = S_h_
S_l = S_l_
return S_list
#数据导入
df5min =  pd.read_csv("bar5rb8888.csv")
dt0 = np.array(df5min["close"])
listup,listdown = [],[]
s_list = detect_via_cusum_lg(dt0,istart=30, threshold_times=5)
for i in range(0,len(s_list)):
if s_list[i] == 1:
listup.append(i)
elif s_list[i] == -1 :
listdown.append(i)
plt.subplot(2,1,1)
plt.plot(dt0, color=y, lw=2.)
plt.plot(dt0, ^, markersize=5, color=r, label=UP signal, markevery=listup)
plt.plot(dt0, v, markersize=5, color=g, label=DOWN signal, markevery=listdown)
plt.legend()
plt.subplot(2,1,2)
plt.title(s_list)
plt.plot(s_list,r-)
plt.show()

用5分钟螺纹钢数据跑出来,部分如下,好像有搞头。代码在我Github里面可以找到

二维码

扫一扫,关注我们

声明:本文由【益华网络】编辑上传发布,转载此文章须经作者同意,并请附上出处【益华网络】及本页链接。如内容、图片有任何版权问题,请联系我们进行处理。

感兴趣吗?

欢迎联系我们,我们愿意为您解答任何有关网站疑难问题!

您身边的【网站建设专家】

搜索千万次不如咨询1次

主营项目:网站建设,手机网站,响应式网站,SEO优化,小程序开发,公众号系统,软件开发等

立即咨询 15368564009
在线客服
嘿,我来帮您!