導航:首頁 > 全球股市 > 股票時間序列的相關系數分析

股票時間序列的相關系數分析

發布時間:2023-04-04 11:18:47

❶ 時間序列分析模型——ARIMA模型

姓名:車文揚 學號:16020199006

【嵌牛導讀】:什麼是 ARIMA模型

【嵌牛鼻子】: ARIMA

【嵌牛提問】: ARIMA模型可以具體應用到什麼地方?

【嵌牛正文】:

一、研究目的

傳統的經濟計量方法是以經濟理論為基礎來描述變數關系的模型。但經濟理論通常不足以對變數之間的動態聯系提供一個嚴密的說明,而且內生變數既可以出現在方程的左端又可以出現在方程的右端使得估計和推斷變得更加復雜。為了解決這些問題而出現了一種用非結構方法來建立各個變數之間關系的模型,如向量自回歸模型(vector autoregression,VAR)和向量誤差修正模型(vector error correction model,VEC)。

在經典的回歸模型中,主要是 通過回歸分析來建立不同變數之間的函數關系(因果關系),以考察事物之間的聯系 。本案例要討論如何 利用時間序列 數據本身建立模型,以研究事物發展自身的規律 ,並據此對事物未來的發展做出預測。研究時間序列數據的意義:在現實中,往往需要研究某個事物其隨時間發展變化的規律。這就需要通過研究該事物過去發展的歷史記錄,以得到其自身發展的規律。在現實中很多問題,如利率波動、收益率變化、反映股市行情的各種指數等通常都可以表達為時間序列數據,通過研究這些數據,發現這些經濟變數的變化規律(對於某些變數來說,影響其發展變化的因素太多,或者是主要影響變數的數據難以收集,以至於難以建立回歸模型來發現其變化發展規律,此時,時間序列分析模型就顯現其優勢——因為這類模型不需要建立因果關系模型,僅需要其變數本身的數據就可以建模),這樣的一種建模方式就屬於時間序列分析的研究范疇。而時間序列分析中,ARIMA模型是最典型最常用的一種模型。

二、ARIMA模型的原理

1、ARIMA的含義。 ARIMA包含3個部分,即AR、I、MA。AR——表示auto  regression,即自回歸模型;I——表示integration,即單整階數,時間序列模型必須是平穩性序列才能建立計量模型,ARIMA模型作為時間序列模型也不例外,因此首先要對時間序列進行單位根檢驗,如果是非平穩序列,就要通過差分來轉化為平穩序列,經過幾次差分轉化為平穩序列,就稱為幾階單整;MA——表示moving average,即移動平均模型。可見,ARIMA模型實際上是AR模型和MA模型的組合。

ARIMA模型與ARMA模型的區別:ARMA模型是針對平穩時間序列建立的模型。ARIMA模型是針對非平穩時間序列建模。換句話說,非平穩時間序列要建立ARMA模型,首先需要經過差分轉化為平穩時間序列,然後建立ARMA模型。

2、ARIMA模型的原理。 正如前面介紹,ARIMA模型實際上是AR模型和MA模型的組合。

AR模型的形式如下:

其中:參數為常數,是階自回歸模型的系數;為自回歸模型滯後階數;是均值為0,方差為的白雜訊序列。模型記做——表示階自回歸模型。

MA模型的形式如下:

其中:參數為常數;參數是階移動平均模型的系數;為移動平均模型滯後階數;是均值為0,方差為的白雜訊序列。模型記做——表示階移動平均模型。

ARIMA模型的形式如下:

模型記做。為自回歸模型滯後階數,為時間序列單整階數,為階移動平均模型滯後階數。當時,,此時ARIMA模型退化為MA模型;當時,,ARIMA模型退化為AR模型。

3、建立ARIMA模型需要解決的3個問題。 由以上分析可知,建立一個ARIMA模型需要解決以下3個問題:

(1)將非平穩序列轉化為平穩序列。

(2)確定模型的形式。即模型屬於AR、MA、ARMA中的哪一種。這主要是通過 模型識別 來解決的。

(3)確定變數的滯後階數。即和的數字。這也是通過 模型識別 完成的。

4、ARIMA模型的識別

ARIMA模型識別的工具為自相關系數(AC)和偏自相關系數(PAC)。

自相關系數: 時間序列滯後k階的自相關系數由下式估計:

其中是序列的樣本均值,這是相距k期值的相關系數。稱為時間序列的自相關系數,自相關系數可以部分的刻畫一個隨機過程的形式。它表明序列的鄰近數據之間存在多大程度的相關性。

偏自相關系數: 偏自相關系數是在給定的條件下,之間的條件相關性。其相關程度用偏自相關系數度量。在k階滯後下估計偏自相關系數的計算公式為:

其中是在k階滯後時的自相關系數估計值。稱為偏相關是因為它度量了k期間距的相關而不考慮k-1期的相關。如果這種自相關的形式可由滯後小於k階的自相關表示,那麼偏相關在k期滯後下的值趨於0。

識別:

AR(p) 模型 的自相關系數是隨著k的增加而呈現指數衰減或者震盪式的衰減,具體的衰減形式取決於AR(p)模型滯後項的系數;AR(p)模型的偏自相關系數是p階截尾的。因此可以通過識別AR(p)模型的偏自相關系數的個數來確定AR(p)模型的階數p。

MA(q) 模型 的自相關系數在q步以後是截尾的。MA(q)模型的偏自相關系數一定呈現出拖尾的衰減形式。

ARMA(p,q) 模型 是AR(p)模型和MA(q)模型的組合模型,因此ARMA(p,q)的自相關系數是AR(p)自相關系數和MA(q)的自相關系數的混合物。當p=0時,它具有截尾性質;當q=0時,它具有拖尾性質;當p,q都不為0,它具有拖尾性質。

通常,ARMA(p,q)過程的偏自相關系數可能在p階滯後前有幾項明顯的 尖柱 ,但從p階滯後項開始逐漸趨於0;而它的自相關系數則是在q階滯後前有幾項明顯的 尖柱 ,從q階滯後項開始逐漸趨於0。

三、數據和變數的選擇

本案例選取我國實際GDP的時間序列建立ARIMA模型,樣本區間為1978—2001。數據來源於國家統計局網站上各年的統計年鑒,GDP數據均通過GDP指數換算為以1978年價格計算的值。見表1:

表1:我國1978—2003年GDP(單位:億元)

年度GDP年度GDP年度GDP

19783605.6198610132.8199446690.7

19794074198711784.7199558510.5

19804551.3198814704199668330.4

19814901.4198916466199774894.2

19825489.2199018319.5199879003.3

19836076.3199121280.4199982673.1

19847164.4199225863.7200089340.9

19858792.1199334500.7200198592.9

四、ARIMA模型的建立步驟

1、單位根檢驗,確定單整階數。

由單位根檢驗的案例分析可知,GDP時間序列為2階單整的。即d=2。通過2次差分,將GDP序列轉化為平穩序列 。利用序列來建立ARMA模型。

2、模型識別

確定模型形式和滯後階數,通過自相關系數(AC)和偏自相關系數(PAC)來完成識別。

首先將GDP數據輸入Eviews軟體,查看其二階差分的AC和PAC。打開GDP序列窗口,點擊View按鈕,出現下來菜單,選擇Correlogram(相關圖),如圖:

打開相關圖對話框,選擇二階差分(2nd difference),點擊OK,得到序列的AC和PAC。(也可以將GDP序列先進行二階差分,然後在相關圖中選擇水平(Level))

從圖中可以看出,序列的自相關系數(AC)在1階截尾,偏自相關系數(PAC)在2階截尾。因此判斷模型為ARMA模型,且,。即:

3、建模

由以上分析可知,建立模型。首先將GDP序列進行二次差分,得到序列。然後在Workfile工作文件簿中新建一個方程對話框,採用 列表法 的方法對方程進行定義。自回歸滯後項用ar表示,移動平均項用ma表示。本例中自回歸項有兩項,因此用ar(1)、ar(2)表示,移動平均項有一項,用ma(1)表示,如圖:

點擊確定,得到模型估計結果:

從擬合優度看,,模型擬合效果較好,DW統計量為2.43,各變數t統計量也通過顯著性檢驗,模型較為理想。對殘差進行檢驗,也是平穩的,因此判斷模型建立正確。

❷ (19)時間序列分析

一)時間序列分析簡介

二)季節分解法

三)專家建模法

一、時間序列分析簡介

時間序列就是按時間順序排列的一組數據序列。

時間序列分析就是發現這組數據的變動規律並用於預測的統計技術。

時間序列分析有三個基本特點:

1)假設事物發展趨勢會延伸到未來

2)預測所依據的數據具有不規則性

3)不考慮事物發展之間的因果關系

目的:通過分析序列進行合理預測,做到提前掌握未來的發展趨勢,為業務決策提供依據,這也是決策科學化的前提。

並不是所有的時間序列都一定包含四種因素,如以年為單位的詩句就可能不包含季節變動因素。

四種因素通常有兩種組合方式。

1)四種因素相互獨立,即時間序列是四種因素直接疊加而成的,可用加法模型表示。

   Y=T+S+C+I

2)四種因素相互影響。即時間序列是四種因素相互綜合的結果,可用乘法模型表示。

   Y=T*S*C*I

其中,原始時間序列值和長期趨勢可用絕對數表示;

季節變動、循環變動、不規則變動可用相對數(變動百分比)表示。

二、季節分解法

當我們對一個時間序列進行預測時,應該考慮將上述四種因素從時間序列中分解出來。

為什麼要分解這四種因素?

1)分解之後,能夠克服其他因素的影響,僅僅考量一種因素對時間序列的影響。

2)分解之後,也可以分析他們之間的相互作用,以及他們對時間序列的綜合影響。

3)當去掉這些因素後,就可以更好的進行時間序列之間的比較,從而更加客觀的反映事物變化發展規律。

4)分界之後,序列可以用來建立回歸模型,從而提高預測精度。

所有的時間序列都要分解這四種因素嗎?

通常情況下,我們考慮進行季節因素的分解,也就是將季節變動因素從原時間序列中去除,並生成由剩餘三種因素構成的序列來滿足後續分析需求。

為什麼只進行季節因素的分解?

1)時間序列中的長期趨勢反映了事物發展規律,是重點研究的對象;

2)循環變動由於周期長,可以看做是長期趨勢的反映;

3)不規則變動由於不容易測量,通常也不單獨分析。

4)季節變動有時會讓預測模型誤判其為不規則變動,從而降低模型的預測精度

綜上所述:當一個時間序列具有季節變動特徵時,在預測值錢會先將季節因素進行分解。

步驟:

1、定義日期標示變數

即先將序列的時間定義好,才能分析其時間特徵。

2、了解序列發展趨勢

即序列圖,確定乘性還是加性

3、進行季節因素分解

4、建模

5、分析結果解讀

6、預測

1、定義日期標示變數

時間序列的特點就是數據根據時間點的順序進行排列,因此分析之前,SPSS需要知道序列的時間定義,然後才能進行分析時間特徵。

根據源數據的格式進行選擇,並輸入第一個個案的具體數值。

此時會在源文件中生成三個新的變數。

2、了解序列發展趨勢

完成日期標示變數的定義之後,需要先對時間序列的變化趨勢有所了解,便於選擇合適的模型。即通過序列圖,確定模型是乘性還是加性。

變數為」銷售數據「,時間軸標簽為」DATE--「,也就是我們自定義的時間。

數據銷量序列圖

如何根據序列圖來判斷模型的乘性或加性?

1)如果隨著時間的推移,序列的季節波動變得越來越大,則建議使用乘法模型。

2)如果序列的季節波動能夠基本維持恆定,則建議使用加法模型。

本例很明顯:隨著時間變化,銷售數據的季節波動越來越大,那麼使用乘法模型會更精確。

3、進行季節因素分解

變數為」銷售數據「,且根據序列圖我們知道時間序列模型為乘性。

提示您會新生成四個變數

1)ERR(誤差序列)

從時間序列中移除季節因素、長期趨勢、和循環變動之後留下的序列,也就是原始序列中的不規則變動構成的序列。

2)SAS(季節因素校正後序列):是移除原始序列中的季節因素後的校正序列。

3)SAF(季節因子):是從序列中分解出的季節因素。其中的變數值根據季節周期的變動進行重復,如本例中季節周期為12個月,所以這些季節因子沒12個月重復一次。

4)STC(長期趨勢和循環變動趨勢):這是原始序列中長期趨勢和循環變動構成的序列。

如圖,周期為12個月,季節因子12個月循環一次。

完成季節因素分解後的序列和原始序列之間有什麼差異?

通過回執序列圖的方法把原始序列和除去季節因子的三個序列(誤差序列、季節因素校正後序列、長期無視和循環變動序列)進行比較。

要做四個序列圖,會有四個變數

原始序列:使用變數」銷售數據「;

誤差序列:使用變數」ERR「;

季節因素校場後序列:使用變數」SAS「

長期趨勢和循環變動序列:使用變數」STC「

藍色線:原始序列

紫色線:長期趨勢和循環變動序列

淺棕色:季節因素校正後序列

綠色線:誤差序列(不規則變動)

因為誤差序列數值非常小,所以長期趨勢和循環變動序列(長期趨勢+循環變動)與季節因素校正後序列(長期趨勢+循環變動+不規則變動,即誤差)能夠基本重合。

在單獨做」季節因子SAF「的序列圖

因為是做」季節因子「的序列圖,所以只有一個變數」季節因子SAF「

我們看出:季節因素的周期是12個月,先下降,然後上升到第一個頂點,再有略微的下降後,出現明顯的上升趨勢,到第七個月時達到峰值,然後一路下跌,直到最後一個月份有所回升,之後進入第二個循環周期。

通過對原始序列的季節分解,我們更好的掌握了原始序列所包含的時間特徵,從而選用適當的模型進行預測。

三、專家建模法

時間序列的預測步驟有四步:

1)繪制時間序列圖觀察趨勢

2)分析序列平穩性並進行平穩化

3)書劍序列建模分析

4)模型評估與預測

平穩性主要是指時間序列的所有統計性質都不會隨著時間的推移而發生變化。

對於一個平穩的時間序列,具備以下特徵:

1)均數和方差不隨時間變化

2)自相關系數只與時間間隔有關,與所處的時間無關

自相關系數是研究序列中不同時期的相關系數,也就是對時間序列計算其當前和不同滯後期的一系列相關系數。

平穩化的方法----差分

差分就是指序列中相鄰的兩期數據之差。

一次差分=Yt-Yt-1

二次差分=(Yt-Yt-1)-(Yt-1-Yt-2)

具體的平穩化操作過程會有專家建模法自動處理,我們只需要哼根據模型結果獨處序列經過了幾階差分即可。

時間序列分析操作:

要分析所有變數,所以選擇」銷售數據「

【專家建模器】--【條件】,勾選」專家建模器考慮季節性模型「

勾選」預測值「,目的是生成預測值,並保存模型

時間序列分析結果解讀

該表顯示了經過分析得到的最優時間序列模型及其參數,最優時間U型獵魔性為ARIMA(0,1,1)(0,1,1)

求和自回歸移動平均模型ARIMA(p,d,q)(P,D,Q)

p:出去季節性變化之後的序列所滯後的p期,通常為0或1,大於1的情況很少;

d:除去季節性變化之後的序列進行了d階差分,通常取值為0,1或2;

q:除去季節性變化之後的序列進行了q次移動平均,通常取值0或1,很少會超過2;

P,D,Q分別表示包含季節性變化的序列所做的事情。

因此本例可解讀為:

對除去季節性變化的序列和包含季節性變化的序列分別進行了一階差分和一次移動平均,綜合兩個模型而建立出來的時間序列模型。

該表主要通過R方或平穩R方來評估模型擬合度,以及在多個模型時,通過比較統計量找到最優模型。

由於原始變數具有季節性變動因素,所以平穩的R方更具有參考意義,等於32.1%,擬合效果一般。

該表提供了更多的統計量可以用來評估時間序列模型的擬合效果。

雖然平穩R方僅僅是32.1%,但是」楊-博克斯Q(18)「統計量的顯著性P=0.706,大於0.05(此處P>0.05是期望得到的結果),所以接受原假設,認為這個序列的殘差符合隨機分布,同時沒有離群值出現,也都反映出數據的擬合效果還可以接受。

時間序列應用預測:

未來一年是到2016年12月,手動輸入即可

這是未來一年的銷售趨勢

如果想從全局來觀察預測趨勢,可以在把這一年的趨勢和以前的數據連接起來

此時的變數應該是」原始的銷售數量「和」2016年的預測銷售數量「

也可以在表中查看具體的數值

❸ 時間序列分析介紹

姓名:車文揚 學號:16020199006

【嵌牛導讀】:時間序列是什麼

【嵌牛鼻子】:時間序列

【嵌牛提問】:時間序列具體應用是什麼?

【嵌牛正文】:

時間序列是時間間隔不變的情況下收集的不同時間點數據集合,這些咐襪集合被分析用來了解長期發展趨勢及為了預測未來。

時間序列與常見的回歸問題的不同點在於:

1、時間序列是跟時間有關的;而線性回歸模型的假設:觀察結果是獨立的在這種情況下是不成立的。

2、隨著上升或者下降的趨勢,更多的時間序列出現季節性趨勢的形式;

常用的時間序列模型有AR模型(Autoregressive model:自回歸模型)、MA模型(moving average model:滑動平均模型)、ARMA模型(Auto-Regressive and Moving Average Model:自回歸滑動平均模型)和ARIMA模型(Autoregressive Integrated Moving Average Model:自回歸積分滑動平均模型)等。

時間序列的預處理(使數據平穩化和隨機化)

拿到一個觀察值序列之後,首先要對它的平穩性和純隨機性進行檢驗,這兩個重要的檢驗稱為序列的預處理。根據檢驗的結果可以將序列分為不同的類型,對不同類型的序列我們會採用不同的分析方法。

平穩化處理

平穩 就是圍繞著一個常數上下波動且波動范圍有限,即有常數均值和常數方差。如果有明顯的趨勢或周期性,那它通常不是平穩序列。序列平穩不平穩,一般採用三種方法檢驗:

時序圖檢驗

看看上面這個圖,很明顯的增長趨勢,不平穩。

利用自相關系數和偏相關系數

自相關系數和偏相關系數的概念可參考《演算法模型— 概率論基礎—相關系數相關》

下面是不平穩數據的自相關和偏相關系數的一種情形。

左邊第一個為自相關圖(Autocorrelation),第二個偏相關圖(Partial Correlation)。

平穩的序列的自相關圖和偏相關圖要麼拖尾,要麼是截尾。截尾就是在某階之後,系數都為 0 。怎麼理解呢,看上面偏相關的圖,當階數為 1 的時候,系數值還是很大, 0.914;二階長的時候突然就變成了 0.050. 後面的值都很小,認為是趨於 0 ,這種狀況就是截尾。什麼是拖尾,拖尾就是有一個緩慢衰減的趨勢,但是不都為 0 。

自相關圖既不是拖尾也不是截尾。以上的圖的自相關是一個三角對稱的形式,這種趨勢是單調趨勢的典型圖形,說明這個序列不是平穩序列。

平穩序列的自相關系數會快速衰減。

單位根檢驗

單位磨簡喊根檢驗是指檢驗序列中是否存在單位根,如果存在單瞎野位根就是非平穩時間序列。

單位根檢驗:ADF是一種常用的單位根檢驗方法,他的原假設為序列具有單位根,即非平穩,對於一個平穩的時序數據,就需要在給定的置信水平上顯著,拒絕原假設。ADF只是單位根檢驗的方法之一,如果想採用其他檢驗方法,可以安裝第三方包arch,裡面提供了更加全面的單位根檢驗方法,個人還是比較鍾情ADF檢驗。以下為檢驗結果,其p值大於0.99,說明並不能拒絕原假設。

利用差分將序列數據轉換為平衡序列

差分可以將數據轉換為平穩序列。

一階差分指原序列值相距一期的兩個序列值之間的減法運算;k階差分就是相距k期的兩個序列值之間相減。如果一個時間序列經過差分運算後具有平穩性,則該序列為差分平穩序列,可以使用ARIMA模型進行分析。

確定不平穩後,依次進行1階、2階、3階…差分,直到平穩為止。

隨機化處理

對於純隨機序列,又稱白雜訊序列,序列的各項數值之間沒有任何相關關系,序列在進行完全無序的隨機波動,可以終止對該序列的分析。白雜訊序列是沒有信息可提取的平穩序列。對於平穩非白雜訊序列,它的均值和方差是常數。通常是建立一個線性模型來擬合該序的發展,藉此提取該序列的有用信息。ARMA模型是最常用的平穩序列擬合模型。

平穩時間序列建模

某個時間序列經過預處理,被判定為平穩非白雜訊序列,就可以進行時間序列建模。

建模步驟:

(1)計算出該序列的自相關系數(ACF)和偏相關系數(PACF);

(2)模型識別,也稱模型定階。根據系數情況從AR§模型、MA(q)模型、ARMA(p,q)模型、ARIMA(p,d,q)模型中選擇合適模型,其中p為自回歸項,d為差分階數,q為移動平均項數。

若平穩序列的偏相關函數是截尾的,而自相關函數是拖尾的,可斷定序列適合AR模型;若平穩序列的偏相關函數是拖尾的,而自相關函數是截尾的,則可斷定序列適合MA模型;若平穩序列的偏相關函數和自相關函數均是拖尾的,則序列適合ARMA模型。(截尾是指時間序列的自相關函數(ACF)或偏自相關函數(PACF)在某階後均為0的性質(比如AR的PACF);拖尾是ACF或PACF並不在某階後均為0的性質(比如AR的ACF)。)

(3)估計模型中的未知參數的值並對參數進行檢驗;

(4)模型檢驗;

(5)模型優化;

(6)模型應用:進行短期預測。

❹ SPSS-數據分析之時間序列分析

當數據與時間息息相關,常具有周期性的變化規律,此時,時間序列分析是一個很好的發現分析及預測其發展變化的統計方法,接下來簡要分享統計分析軟體SPSS中時間序列分析的操作。

問:什麼是時間序列?

答:時間序列是時間間隔不變的情況下收集的不同時間點數據集合。

問:那時間序列分析又是什麼?

答:時間序列分析是通過研究歷史數據的發展變化規律來預測事物的未來發展的統計學方法。公司營業額、銷售額,人口數量,股票等方面的變化預測皆可通過此統計方法。

SPSS中的操作

首先,對數據進行 預處理:

1.查看數據是否有缺失,若有,不便後續處理,則需進行替換缺失值。

轉換→替換缺失值→選擇新變數→輸入新變數名稱、選擇替換缺失值方法。

2.定義日期

數據→定義日期和時間

3.平穩性檢驗(平穩性指的是期望不變,方差恆定,協方差不隨時間改變)

檢驗方法:時序圖檢驗、自相關圖檢驗等。可通過創建時間序列實現數據的平穩化

轉換→創建時間序列

結果(例:運行中位數——跨度為1,則等於原數據)

數據預處理後對數據進行分析研究——序列圖、譜分析、自相關等。

1.序列圖:分析→時間序列預測→序列圖→根據需要選擇變數、時間軸標簽等。

結果(例):可觀察數據的大致波動情況。

2.譜分析:分析→時間序列預測→譜分析→根據需要選擇變數、圖表。

結果(例)

對於周期變化的數據,主要用於偵測系統隱含的周期或者節律行為;

對於非周期的數據,主要用於揭示系統演化過程的自相關特徵。

3.自相關:分析→時間序列預測→自相關→選擇變數及其他。

結果:

解讀:直條高低代表自相關系數的大小,橫軸1-16代表自相關的階數,上下線之間是不具有統計學意義的,偏自相關是去除自相關系數的關聯性傳遞性之後,用偏自相關系數考察剩餘的相關性是否還存在。

關於SPSS時間序列分析的簡要介紹就結束啦!

END

文 | FM

❺ 時間序列分析:求理論偏自相關系數

一、自協方差和自相關系數

p階自回歸AR(p)

自協方差 r(t,s)=E[X(t)-EX(t)][X(s)-EX(s)]

自相關系數ACF=r(s,t)/[(DX(t).DX(s))^0.5]

二、平穩時間序列自協方差與自相關系數

1、平穩時間序列可以定義r(k)為時間序列的延遲k自協方差函數:

r(k)=r(t,t+k)=E[X(t)-EX(t)][X(t+k)-EX(t+k)]

2、平穩時間序列的方差冊緩漏相等DX(t)=DX(t+k)=σ2,

所以DX(t)*DX(t+k)=σ2*σ2,

所以[DX(t)*DX(t+k)]^0.5=σ2

而r(0)=r(t,t)=E[X(t)-EX(t)][X(t)-EX(t)]=E[X(t)-EX(t)]^2=DX(t)=σ2

簡而言之,r(0)就是自己與自己的協方差,就是方差,

所以,平穩時間序列延遲k的自相關系數ACF等於:

p(k)=r(t,t+k)/[(DX(t).DX(t+k))^0.5]=r(k)/σ2=r(k)/r(0)

3、平穩AR(p)的自相關系數具有兩個顯著特徵:一是拖尾性;二是呈負指數衰減。

三、偏相關系數

對於一個平穩AR(p)模型,求出滯後k自相關系數p(k)時,實際上得到並不是x(t)與x(t-k)之間單純的相關關系。因為x(t)同時還會受到中間k-1個隨機變數x(t-1)、x(t-2)、……、x(t-k+1)的影響,而這k-1個隨機變數又都和x(t-k)具有相關關系,所以自相關系數p(k)里實際摻州爛雜了其他變數對x(t)與x(t-k)的影響。

為了哪冊能單純測度x(t-k)對x(t)的影響,引進偏自相關系數的概念。

對於平穩時間序列{x(t)},所謂滯後k偏自相關系數指在給定中間k-1個隨機變數x(t-1)、x(t-2)、……、x(t-k+1)的條件下,或者說,在剔除了中間k-1個隨機變數x(t-1)、x(t-2)、……、x(t-k+1)的干擾之後,x(t-k)對x(t)影響的相關程度。用數學語言描述就是:

p[(x(t),x(t-k)]|(x(t-1),……,x(t-k+1)={E[(x(t)-Ex(t)][x(t-k)-Ex(t-k)]}/E{[x(t-k)-Ex(t-k)]^2}

這就是滯後k偏自相關系數的定義

❻ 如何快速比較股票間的相關性

股票相關性指的是多隻股票的股價或收益率,在一個時段內的相關聯系,通常用相關系數來表示。通常而言在股票市場中的上市公司間相同行業的相關性較高,相似行業的相關性次之,對屬於完全不同行業的則相關性最低。根據現有研究成果可知,股票關聯性對資本市場性風險的衡量及資產組合的構建都具有重大價值,所以股票相關性成為了個人投資者或者投資機構衡量股票市場風險以及構建資產組合的有效性的重要參考依據。相關性的性質表明,股票間的相關程度越高,其所組成的市場的系統風險越強,由股票所組成的資產組合的有效性相應的也就越差。

❼ 兩個時間序列的相關系數能否反映它們之間的相似性

從概念上說基本可以。在應用學科里,斗吵分析相關系數,是很普遍的做法。

舉個例子:很多金融分析,就通過做兩支股票價格波動(實際上是兩個時間序列)的相關,來判斷他們之間的關系,這個做法在行業里非常普遍,比如基金經理,就要分析他的portfolio里各支股票之間的相關系數,來達到最大化收益(portfolio期望值)同時最小化風險(portfolio標准方差)的目的。

比如,同一板塊里(比如高科技板塊)的股票價格波動,經常是正相關。直接競爭行業或公司之間的股票價格波動,不少是負相關。

下面是詞條里抄的:

相關系數又稱線性相關系數.它是衡量變數之間線性相關程度的指標。樣本相關系數用r表示,總體相關系數用ρ表示,相關系數的取值范圍為[-1,1]。|r|值越大,誤差Q越小,變數之間的線性相關程度越高;|r|值越接近0,Q越大,變數之間的線性相關程度越低。

相關系數又稱皮(爾生)氏積矩相關系數,說明兩個現象之間相關關系密切程度的統計分析指標。相關系數用希臘字母γ表示,γ值的范圍在-1和+1之間。γ>0為正相關,γ<0為負相關。γ=0表示不相關;γ的絕對值越大,相關程度越高。

兩個現象之間的相關程度,一般劃分為四級:

如兩者呈正相關,r呈正值,r=1時為完全正相關;如兩者呈負相關則r呈負值,而r=-1時為完全負相關。完全正相關或負相關時,所有圖點都在直線回歸線上;點子的分布在直線回歸線上下越離散,r的絕對值越小。當例數相等時,相關系數的絕對值越接近1,相關禪銷碰越密切;越接近於0,相關越不密切。當r=0時,說明X和Y兩個變數賀談之間無直線關系。通常|r|大於0.8時,認為兩個變數有很強的線性相關性。

❽ 時間序列分析方法

時間序列是指一組在連續時間上測得的數據,其在數學上的定義是一組向量x(t), t=0,1,2,3,...,其中t表示數據所在的時間點,x(t)是一組按時間順序(測得)排列的隨機變數。包含單個變數的時間序列稱為單變數時間序列,而包含多個變數的時間序列則稱為多變數。

時間序列在很多方面多有涉及到,如天氣預報,每天每個小時的氣溫,股票走勢等等,在商業方面有諸多應用,如:

下面我們將通過一個航班數據來說明如何使用已有的工具來進行時間序列數據預測。常用來處理時間序列的包有三個:

對於基於AR、MA的方法一般需要數據預處理,因此本文分為三部分:

通過簡單的初步處理以及可視化可以幫助我們有效快速的了解數據的分布(以及時間序列的趨勢)。

觀察數據的頻率直方圖以及密度分布圖以洞察數據結構,從下圖可以看出:

使用 statsmodels 對該時間序列進行分解,以了解該時間序列數據的各個部分,每個部分都代表著一種模式類別。借用 statsmodels 序列分解我們可以看到數據的主要趨勢成分、季節成分和殘差成分,這與我們上面的推測相符合。

如果一個時間序列的均值和方差隨著時間變化保持穩定,則可以說這個時間序列是穩定的。

大多數時間序列模型都是在平穩序列的前提下進行建模的。造成這種情況的主要原因是序列可以有許多種(復雜的)非平穩的方式,而平穩性只有一種,更加的易於分析,易於建模。

在直覺上,如果一段時間序列在某一段時間序列內具有特定的行為,那麼將來很可能具有相同的行為。譬如已連續觀察一個星期都是六點出太陽,那麼可以推測明天也是六點出太陽,誤差非常小。

而且,與非平穩序列相比,平穩序列相關的理論更加成熟且易於實現。

一般可以通過以下幾種方式來檢驗序列的平穩性:

如果時間序列是平穩性的,那麼在ACF/PACF中觀測點數據與之前數據點的相關性會急劇下降。

下圖中的圓錐形陰影是置信區間,區間外的數據點說明其與觀測數據本身具有強烈的相關性,這種相關性並非來自於統計波動。

PACF在計算X(t)和X(t-h)的相關性的時候,挖空在(t-h,t)上所有數據點對X(t)的影響,反應的是X(t)和X(t-h)之間真實的相關性(直接相關性)。

從下圖可以看出,數據點的相關性並沒有急劇下降,因此該序列是非平穩的。

如果序列是平穩的,那麼其滑動均值/方差會隨著時間的變化保持穩定。

但是從下圖我們可以看到,隨著時間的推移,均值呈現明顯的上升趨勢,而方差也呈現出波動式上升的趨勢,因此該序列是非平穩的。

一般來講p值小於0.05我們便認為其是顯著性的,可以拒絕零假設。但是這里的p值為0.99明顯是非顯著性的,因此接受零假設,該序列是非平穩的。

從上面的平穩性檢驗我們可以知道該時間序列為非平穩序列。此外,通過上面1.3部分的序列分解我們也可以看到,該序列可分解為3部分:

我們可以使用數據轉換來對那些較大的數據施加更大的懲罰,如取對數、開平方根、立方根、差分等,以達到序列平穩的目的。

滑動平均後數據失去了其原來的特點(波動式上升),這樣損失的信息過多,肯定是無法作為後續模型的輸入的。

差分是常用的將非平穩序列轉換平穩序列的方法。ARIMA中的 'I' 便是指的差分,因此ARIMA是可以對非平穩序列進行處理的,其相當於先將非平穩序列通過差分轉換為平穩序列再來使用ARMA進行建模。

一般差分是用某時刻數值減去上一時刻數值來得到新序列。但這里有一點區別,我們是使用當前時刻數值來減去其對應時刻的滑動均值。

我們來看看剛剛差分的結果怎麼樣。

讓我們稍微總結下我們剛剛的步驟:

通過上面的3步我們成功的將一個非平穩序列轉換成了一個平穩序列。上面使用的是最簡單的滑動均值,下面我們試試指數滑動平均怎麼樣。

上面是最常用的指數滑動平均的定義,但是pandas實現的指數滑動平均好像與這個有一點區別,詳細區別還得去查pandas文檔。

指數滑動均值的效果看起來也很差。我們使用差分+指數滑動平均再來試試吧。

在上面我們通過 取log+(指數)滑動平均+差分 已經成功將非平穩序列轉換為了平穩序列。

下面我們看看,轉換後的平穩序列的各個成分是什麼樣的。不過這里我們使用的是最簡單的差分,當前時刻的值等於原始序列當前時刻的值減去原始序列中上一時刻的值,即: x'(t) = x(t) - x(t-1)。

看起來挺不錯,是個平穩序列的樣子。不過,還是檢驗一下吧。

可以看到,趨勢(Trend)部分已基本被去除,但是季節性(seasonal)部分還是很明顯,而ARIMA是無法對含有seasonal的序列進行建模分析的。

在一開始我們提到了3個包均可以對時間序列進行建模。

為了簡便,這里 pmdarima 和 statsmodels.tsa 直接使用最好的建模方法即SARIMA,該方法在ARIMA的基礎上添加了額外功能,可以擬合seasonal部分以及額外添加的數據。

在使用ARIMA(Autoregressive Integrated Moving Average)模型前,我們先簡單了解下這個模型。這個模型其實可以包括三部分,分別對應著三個參數(p, d, q):

因此ARIMA模型就是將AR和MA模型結合起來然後加上差分,克服了不能處理非平穩序列的問題。但是,需要注意的是,其仍然無法對seasonal進行擬合。

下面開始使用ARIMA來擬合數據。

(1) 先分訓練集和驗證集。需要注意的是這里使用的原始數據來進行建模而非轉換後的數據。

(2)ARIMA一階差分建模並預測

(3)對差分結果進行還原

先手動選擇幾組參數,然後參數搜索找到最佳值。需要注意的是,為了避免過擬合,這里的階數一般不太建議取太大。

可視化看看結果怎麼樣吧。

(6)最後,我們還能對擬合好的模型進行診斷看看結果怎麼樣。

我們主要關心的是確保模型的殘差(resial)部分互不相關,並且呈零均值正態分布。若季節性ARIMA(SARIMA)不滿足這些屬性,則表明它可以進一步改善。模型診斷根據下面的幾個方面來判斷殘差是否符合正態分布:

同樣的,為了方便,我們這里使用 pmdarima 中一個可以自動搜索最佳參數的方法 auto_arima 來進行建模。

一般來說,在實際生活和生產環節中,除了季節項,趨勢項,剩餘項之外,通常還有節假日的效應。所以,在prophet演算法裡面,作者同時考慮了以上四項,即:

上式中,

更多詳細Prophet演算法內容可以參考 Facebook 時間序列預測演算法 Prophet 的研究 。

Prophet演算法就是通過擬合這幾項,然後把它們累加起來得到時間序列的預測值。

Prophet提供了直觀且易於調整的參數:

Prophet對輸入數據有要求:

關於 Prophet 的使用例子可以參考 Prophet example notebooks

下面使用 Prophet 來進行處理數據。

參考:
Facebook 時間序列預測演算法 Prophet 的研究
Prophet example notebooks
auto_arima documentation for selecting best model
數據分析技術:時間序列分析的AR/MA/ARMA/ARIMA模型體系
https://github.com/advaitsave/Introction-to-Time-Series-forecasting-Python
時間序列分析
My First Time Series Comp (Added Prophet)
Prophet官方文檔: https://facebookincubator.github.io

❾ 如何計算兩個股票的相關系數(correlation)(急)

計算公式為相關系數=協方差/兩個項目標准差之積。
相關系數:度量兩個隨機變數間關聯程度的量。相關系數的取值范圍為(-1,+1)。當相關系數小於0時,稱為負相關;大於0時,稱為正相關;等於0時,稱為零相關。
拓展資料:
1.協方差:如果兩個變數的變化趨勢一致,也就是說如果其中一個大於自身的期望值,另外一個也大於自身的期望值,那麼兩個變數之間的協方差就是正值。 如果兩個變數的變化趨勢相反,即其中一個大於自身的期望值,另外一個卻小於自身的期望值,那麼兩個變數之間的協方差就是負值。
2.標准差(Standard Deviation) :標准差也稱均方差(mean square error),是各數據偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用σ表示。標准差是方差的算術平方根。標准差能反映一個數據集的離散程度。平均數相同的,標准差未必相同。 格雷厄姆在1949年的著作《聰明的投資者》里說過:「經驗表明在大多事例中,安全依賴於收益能力,如果收益能力不充分的話,資產就會喪失大部分的名譽(或帳面)價值。」
3.相關系數是反映兩種證券之間相關性的統計方法。換句話說,這個統計告訴我們一個證券與另一個證券有多密切相關。當兩種證券向上或向下同向移動時,相關系數為正。當兩種證券向相反方向移動時,相關系數為負。確定兩種證券之間的關系對分析跨市場關系,行業/股票關系以及行業/市場關系很有用。該指標還可以幫助投資者通過識別與股市低或負相關的證券進行多樣化。 解釋 相關系數在-1和+1之間振盪。這不是一個動量振盪器。
4.相反,它從正相關周期移動到周期負相關。+1被認為是完美的正相關,這是罕見的。0到+1之間的任何值表示兩個證券向相同的方向移動。正相關的程度可能隨時間而變化。石油股和石油大部分時間呈正相關。下面的例子顯示了一隻石油股股價和石油價格的關系。不出所料,20日相關系數仍然大幅上漲,經常上探+75。這兩種證券之間顯然存在著積極的關系。一般來說,任何超過0.50的數據都表現出強烈的正相關。

❿ 數據分析之時間序列分析

顧名思義,時間序列就是按照時間順利排列的一組數據序列。時間序列分析就是發現這組數據的變動規律並用於預測的統計技術。該技術有以下三個基本特點:

1.假設事物發展趨勢會延伸到未來;

2.預測所依據的數據具有不規則性;

3.不考慮事物發展之間的因果關系。

對時間序列進行分析的最終目的,是要通過分析序列進行合理預測,做到提前掌握其未來發展趨勢,以此為業務決策提供依據。

移動平均法褲褲和指數平滑法的局限

移動平均法是一種簡單平滑預測技術,它的基本思想是:根據時間序列資料逐項推移,胡運簡依次計算包含一定項數的序時平均值,以反映長期趨勢。但這種方法不適合預測具有復雜趨勢的時間序列。指數平滑法是移動平均法的改進方法,通過對歷史數據的遠近不同賦予不同的權重進行預測。但在實際應用中,指數平滑法的預測值通常會滯後於實際值,尤其是所預測的時間序列存在長期趨勢時,這種滯後的情況更加明顯。

在實際進行時間序列預測時,遇到的數據會比較復雜,所以我們需要用到更專業的預測方法來對數據進行合理預測。通常情況下一個時間序列包含四種因素,它們會通過不同的組合方式影響時間序列的發展變化。

時間序列四種因素有兩種組合方式。

1.四種因素相互獨立,即時間序列是由四種因素直接疊加而形成的,可用加法模型表示:

Y=T+S+C+I

2.四種因素相互影響,即時間序列是綜合四種因素而形成的,可用乘法模型表示:

Y=T×S×C×I,通常遇到的時間序列都是乘法模型。其中,原始時間序列值和長期趨勢可用絕對數表示,季節變動、循環變動和不規則變動則用相對數(通常是變動百分比)表示。

當我們需要對一個時間序悄鍵列進行預測時,需要將上述四種因素從時間序列中分解出來。原因是:

1.把因素從時間序列中分解出來後,就能克服其他因素的影響,僅考量某一種因素對時間序列的影響;

2.分解這四種因素後,也可以分析他們之間的相互作用,以及它們對時間序列的綜合影響;

3.當去掉某些因素後,就可以更好地進行時間序列之間的比較,從而更加客觀地反映事物變化發展規律;

4.分解這些因素後的序列可以用於建立回歸模型,從而提高預測精度。

通常情況,我們會考慮進行季節因素的分解,也就是將季節變動因素從原時間序列中去除,並生成由剩餘的三種因素構成的序列來滿足後續分析需求。

如果時間序列圖的趨勢隨著時間的推移,序列的季節波動變得越來越大,則建議使用乘法模型;如果序列的季節波動能夠基本維持恆定,則建議使用加法模型。

時間序列的預測步驟主要分為四步:

(1)繪制時間序列圖觀察趨勢;

(2)分析序列平穩性並進行平穩化;

(3)時間序列建模分析;

(4)模型評估與預測;

平穩性是指時間序列的所有統計性質都不會隨著時間的推移而發生變化,對於一個平穩的時間序列來說,需要具有以下特徵:

(1)均數和方差不隨時間變化;

(2)自相關系數只與時間間隔有關,與所處的時間無關。

相關系數是用來量化變數之間的相關程度。自相關系數研究的是一個序列中不同時期的相關系數,也就是時間序列計算其當前期和不同滯後期的一系列相關系數。

目前主流的時間序列預測方法都是針對平穩的時間序列進行分析的,但是實際上,我們遇到的大多數時間序列都不平穩,所以在分析時,需要首先識別序列的平穩性,並且把不平穩的序列轉換為平穩序列。一個時間序列只有被平穩化處理過,才能被控制和預測。

將時間序列平穩化的方式有很多,基礎的方法是差分,因為這個方法有助於我們解讀時間序列模型。差分,就是指序列中前後相鄰的兩期數據之差。

ARIMA模型是時間序列分析中常用的一種模型,其全稱為求和自回歸移動平均模型。該模型形式為:ARIMA(p,d,q)(P,D,Q)。該模型有6個參數,前3個參數(p,d,q)針對季節性變化後的序列,後三個參數(P,D,Q)主要用來描述季節性變化,兩個序列是相乘的關系,因此,該模型也稱為復合季節模型。

其中:p,是指移除季節性變化後的序列所滯後的p期,取值通常為0或1,大於1的情況較少;d,是指移除季節性變化後的序列進行了d階差分,取值通常為0、1或2;q,是指移除季節性變化後的序列進行了q次移動平均,取值通常為0或1,很少會超過2。大寫的P,D,Q的含義相同,只是應用在包含季節性變化的序列上。本例中,該模型可解讀為,對移除季節因素的序列和包含季節因素的序列分別進行一階差分和一次移動平均,綜合兩個模型而構建出的時間序列模型。

模型擬合度主要通過R平方或平穩的R平方來評估模型擬合優度,以及在比較多個模型的情況下,通過比較統計量從而找到最優模型。本例中,由於原始序列具有季節變動因素,所以,平穩的R平方則更具參考意義。該值等於32.1%,所以,該時間序列模型的擬合效果一般。

模型統計提供了更多的統計量用以評估時間序列的數據擬合效果。本例中,雖然平穩的R平方值為32.1%,但是「楊-博克斯Q(18)」統計量的顯著性(P值)=0.706,大於0.05(此處的顯著性(P值)>0.05是期望得到的結果),則接受原假設,認為這個序列的殘差符合隨機序列分布,同時也沒有離群值的出現,這些也都反映出數據的擬合效果還是可以接受的。

閱讀全文

與股票時間序列的相關系數分析相關的資料

熱點內容
股票數據成交筆數 瀏覽:45
買星st股票有限制嗎 瀏覽:596
銀行股票都哪些 瀏覽:706
股票的上合時間什麼意思 瀏覽:988
平安股票賬戶自動購買國債 瀏覽:251
民生銀行股票歷年業績 瀏覽:56
同花順股票軟體使用說明 瀏覽:303
股票回購影響WACC 瀏覽:340
匯通信息股票操作app 瀏覽:752
如何辦理個人股票賬戶 瀏覽:587
股票賬戶過橋 瀏覽:28
有關ipdn股票信息 瀏覽:611
股票轉入資金有時間限制嗎 瀏覽:500
如何看一隻股票主力佔多少 瀏覽:760
微信群教股票投資 瀏覽:465
萬科股票的最新價格 瀏覽:687
股票交易軟體是通達還是同花順好 瀏覽:469
聞泰科技股票走勢圖同花順網 瀏覽:64
任選一隻股票進行分析論文 瀏覽:783
民生證券股票交易手續費 瀏覽:399