❶ 時間序列分析
時間序列 概念 :同一現象在不同時間上的相繼觀察值排列而成的數列
形式上由現象所屬的時間和現象在不同時間上的觀察值兩部分組成
排列的時間可以是年、季度、月...
時間序列的 分類 :
1.絕對數序列:
一系列絕對數按時間順序排列而成;最基本的表現形式;反映在不同時間上所達到的絕對水平(時期序列,一段時期內總量的排序、時點序列,某一瞬間時點上總量的排序)
2.相對數序列:一系列相對數按時間順序排列而成
3.平均數序列:一系列平均數按時間順序排列而成
時間序列的 編制原則 :
時間長短一致
總體范圍一致
指標內容一致
計算方法和口徑一致
一、時間序列的對比分析
水平分析:
1.發展水平:現象在不同時間上的觀察值;說明現象在某一時間上所達到的水平;
2.平均發展水平:現象在不同時間上取值的平均數,又稱序時平均;說明現象在一段時間內所達到的一般水平;(不同序列的類型選擇不同的計算方法-時期、連續時點(逐日排序)、不等距時點(加權)、等距時點(不等距的特例));
#相對數:兩個絕對數相除
#相對數的序時平均數:分子的平均數與分母的平均數相除
3.增長量:報告期水平與基期水平之差,說明現象在觀察期內增長的絕對數量
分為逐期增長量(報告期水平與前一期水平之差)與累計增長量(報告期水平和某一固定時期水平之差)--各逐期增長量之和等於最末期的累計增長量
4.平均增長量:各逐期增長量的平均數,等於逐期增長量之和/逐期增長量個數(也就是觀察值個數-1)
速度分析:
1.發展速度:報告期水平與基期水平之比,說明現象在觀察期內相對的發展變化程度,
分為環比發展速度(報告期水平和前一期水平之比)與定期發展速度(報告期與某一固定時期水平之比)--各環比發展速度之積等於最末期定期發展速度;
2.增長速度(增長率):增長量與基期水平之比,說明現象的相對增長程度,
等於發展速度-1;分為環比增長速度和定基增長速度;
3.平均發展速度:觀察期內各環比發展速度的平均數,說明現象在整個觀察期內平均發展變化的程度(幾何法算平均數)
4.平均增長速度:等於平均發展速度-1
二、時間序列的趨勢分析
可以採用移動平均、最小二乘法等...
三、季節變動分析
季節變動:現象在一年內隨著季節更換形成的有規律變動;各年變化強度大體相同,且沒年重現;
擴展:對一年內由於社會、政治、經濟、自然因素影響,形成的以一定時期為周期的有規則的重復變動;
測定目的:確定現象過去的季節變化規律,消除時間序列中的季節因素;
分析原理:將季節變動規律歸納為一種典型的季節模型;季節模型由季節指數所組成;季節指數的平均數等於100%;根據季節指數與其平均數的偏差程度測定季節變動的程度;
季節指數:1.反映季節變動的相對數;2.以全年或季資料的平均數為基礎計算的;3.平均數等於100%;4.指數越遠離其平均數季節變動程度越大;5.同期平均法和趨勢剔除法
同期平均法:
根據原時間序列通過簡單平均計算季節指數
假定時間序列沒有明顯的長期趨勢和循環波動
步驟:1.計算同期平均數;2.計算全部數據總季的平均數;3.計算季節指數S=同期平均數/總季平均數
趨勢剔除法:
先將時間序列中長期趨勢予以消除,在計算季節指數
步驟:1.計算移動平均趨勢值Y;2.從序列中剔除趨勢值Y/T;3.按上述方法計算季節指數
四項移動平均後再進行二項移動平均(四項做年的去掉季節,二項更為穩定)
季節變動的調整:將季節變動剔除,方法是江源時間序列除以相應的季節指數
四、循環波動分析
循環波動:近乎規律性的從低到高再從高至低的周而復始的變動;不同於趨勢變動,他不是朝著單一方向的持續運動,而是漲落相間的交替波動;不同於季節波動,其變化無固定規律,變動周期多在一年以上,且周期長短不一
目的是探索現象活動的規律性
測定方法:採取剩餘法
計算步驟:1.先消除趨勢值,求得無長期趨勢數據資料;2.再消去季節變動(原始數據/季節指數),求得循環及不規則波動相對數;3.將結果移動平均,以消除不規則波動,即得循環波動值
❷ 時間序列分析方法
時間序列是指一組在連續時間上測得的數據,其在數學上的定義是一組向量x(t), t=0,1,2,3,...,其中t表示數據所在的時間點,x(t)是一組按時間順序(測得)排列的隨機變數。包含單個變數的時間序列稱為單變數時間序列,而包含多個變數的時間序列則稱為多變數。
時間序列在很多方面多有涉及到,如天氣預報,每天每個小時的氣溫,股票走勢等等,在商業方面有諸多應用,如:
下面我們將通過一個航班數據來說明如何使用已有的工具來進行時間序列數據預測。常用來處理時間序列的包有三個:
對於基於AR、MA的方法一般需要數據預處理,因此本文分為三部分:
通過簡單的初步處理以及可視化可以幫助我們有效快速的了解數據的分布(以及時間序列的趨勢)。
觀察數據的頻率直方圖以及密度分布圖以洞察數據結構,從下圖可以看出:
使用 statsmodels 對該時間序列進行分解,以了解該時間序列數據的各個部分,每個部分都代表著一種模式類別。借用 statsmodels 序列分解我們可以看到數據的主要趨勢成分、季節成分和殘差成分,這與我們上面的推測相符合。
如果一個時間序列的均值和方差隨著時間變化保持穩定,則可以說這個時間序列是穩定的。
大多數時間序列模型都是在平穩序列的前提下進行建模的。造成這種情況的主要原因是序列可以有許多種(復雜的)非平穩的方式,而平穩性只有一種,更加的易於分析,易於建模。
在直覺上,如果一段時間序列在某一段時間序列內具有特定的行為,那麼將來很可能具有相同的行為。譬如已連續觀察一個星期都是六點出太陽,那麼可以推測明天也是六點出太陽,誤差非常小。
而且,與非平穩序列相比,平穩序列相關的理論更加成熟且易於實現。
一般可以通過以下幾種方式來檢驗序列的平穩性:
如果時間序列是平穩性的,那麼在ACF/PACF中觀測點數據與之前數據點的相關性會急劇下降。
下圖中的圓錐形陰影是置信區間,區間外的數據點說明其與觀測數據本身具有強烈的相關性,這種相關性並非來自於統計波動。
PACF在計算X(t)和X(t-h)的相關性的時候,挖空在(t-h,t)上所有數據點對X(t)的影響,反應的是X(t)和X(t-h)之間真實的相關性(直接相關性)。
從下圖可以看出,數據點的相關性並沒有急劇下降,因此該序列是非平穩的。
如果序列是平穩的,那麼其滑動均值/方差會隨著時間的變化保持穩定。
但是從下圖我們可以看到,隨著時間的推移,均值呈現明顯的上升趨勢,而方差也呈現出波動式上升的趨勢,因此該序列是非平穩的。
一般來講p值小於0.05我們便認為其是顯著性的,可以拒絕零假設。但是這里的p值為0.99明顯是非顯著性的,因此接受零假設,該序列是非平穩的。
從上面的平穩性檢驗我們可以知道該時間序列為非平穩序列。此外,通過上面1.3部分的序列分解我們也可以看到,該序列可分解為3部分:
我們可以使用數據轉換來對那些較大的數據施加更大的懲罰,如取對數、開平方根、立方根、差分等,以達到序列平穩的目的。
滑動平均後數據失去了其原來的特點(波動式上升),這樣損失的信息過多,肯定是無法作為後續模型的輸入的。
差分是常用的將非平穩序列轉換平穩序列的方法。ARIMA中的 'I' 便是指的差分,因此ARIMA是可以對非平穩序列進行處理的,其相當於先將非平穩序列通過差分轉換為平穩序列再來使用ARMA進行建模。
一般差分是用某時刻數值減去上一時刻數值來得到新序列。但這里有一點區別,我們是使用當前時刻數值來減去其對應時刻的滑動均值。
我們來看看剛剛差分的結果怎麼樣。
讓我們稍微總結下我們剛剛的步驟:
通過上面的3步我們成功的將一個非平穩序列轉換成了一個平穩序列。上面使用的是最簡單的滑動均值,下面我們試試指數滑動平均怎麼樣。
上面是最常用的指數滑動平均的定義,但是pandas實現的指數滑動平均好像與這個有一點區別,詳細區別還得去查pandas文檔。
指數滑動均值的效果看起來也很差。我們使用差分+指數滑動平均再來試試吧。
在上面我們通過 取log+(指數)滑動平均+差分 已經成功將非平穩序列轉換為了平穩序列。
下面我們看看,轉換後的平穩序列的各個成分是什麼樣的。不過這里我們使用的是最簡單的差分,當前時刻的值等於原始序列當前時刻的值減去原始序列中上一時刻的值,即: x'(t) = x(t) - x(t-1)。
看起來挺不錯,是個平穩序列的樣子。不過,還是檢驗一下吧。
可以看到,趨勢(Trend)部分已基本被去除,但是季節性(seasonal)部分還是很明顯,而ARIMA是無法對含有seasonal的序列進行建模分析的。
在一開始我們提到了3個包均可以對時間序列進行建模。
為了簡便,這里 pmdarima 和 statsmodels.tsa 直接使用最好的建模方法即SARIMA,該方法在ARIMA的基礎上添加了額外功能,可以擬合seasonal部分以及額外添加的數據。
在使用ARIMA(Autoregressive Integrated Moving Average)模型前,我們先簡單了解下這個模型。這個模型其實可以包括三部分,分別對應著三個參數(p, d, q):
因此ARIMA模型就是將AR和MA模型結合起來然後加上差分,克服了不能處理非平穩序列的問題。但是,需要注意的是,其仍然無法對seasonal進行擬合。
下面開始使用ARIMA來擬合數據。
(1) 先分訓練集和驗證集。需要注意的是這里使用的原始數據來進行建模而非轉換後的數據。
(2)ARIMA一階差分建模並預測
(3)對差分結果進行還原
先手動選擇幾組參數,然後參數搜索找到最佳值。需要注意的是,為了避免過擬合,這里的階數一般不太建議取太大。
可視化看看結果怎麼樣吧。
(6)最後,我們還能對擬合好的模型進行診斷看看結果怎麼樣。
我們主要關心的是確保模型的殘差(resial)部分互不相關,並且呈零均值正態分布。若季節性ARIMA(SARIMA)不滿足這些屬性,則表明它可以進一步改善。模型診斷根據下面的幾個方面來判斷殘差是否符合正態分布:
同樣的,為了方便,我們這里使用 pmdarima 中一個可以自動搜索最佳參數的方法 auto_arima 來進行建模。
一般來說,在實際生活和生產環節中,除了季節項,趨勢項,剩餘項之外,通常還有節假日的效應。所以,在prophet演算法裡面,作者同時考慮了以上四項,即:
上式中,
更多詳細Prophet演算法內容可以參考 Facebook 時間序列預測演算法 Prophet 的研究 。
Prophet演算法就是通過擬合這幾項,然後把它們累加起來得到時間序列的預測值。
Prophet提供了直觀且易於調整的參數:
Prophet對輸入數據有要求:
關於 Prophet 的使用例子可以參考 Prophet example notebooks
下面使用 Prophet 來進行處理數據。
參考:
Facebook 時間序列預測演算法 Prophet 的研究
Prophet example notebooks
auto_arima documentation for selecting best model
數據分析技術:時間序列分析的AR/MA/ARMA/ARIMA模型體系
https://github.com/advaitsave/Introction-to-Time-Series-forecasting-Python
時間序列分析
My First Time Series Comp (Added Prophet)
Prophet官方文檔: https://facebookincubator.github.io
❸ 請股票高手給我解釋一下江恩時間序列的奧秘
一、啥時買,啥時賣?
A、什麼時候買入股票
1、大盤相對低點時買入股票。一般股民想在最低點買入股票,實際上這是辦不到的(即使做到也是偶然的),能做到大盤相對低點,或者說是大盤處於低位,這時入市比較安全。
2、個股價位處於低位時買入股票。
3、證券營業部里投資者已稀稀拉拉時買入股票。
B、買什麼股票
1、買有穩定業績的績優股。買股票一定要看準股票業績。該買的股票業績要穩定,千萬不要買業績大起大落的股票(業績大起大落的股票適於炒作,不適於工薪階層投資)避免股票業績下降,股價下降,深度套牢,難以解放。
2、買成長性好的高科技股。這個前提既是高科技又具有成長性,否則,乾脆不要買。
3、與左鄰右舍相比較,屬於價位相對低的股票。如有幾個股票行業性質相同,業績差不多,盤子基本相同,而其中一隻價位偏低,市盈率低,那麼這個股票可以介入。
總之,買股票要再三考慮、分批建倉。當在大盤低迷時,某股票業績穩定,價位低的股票就可開始分散分批建倉。
C、什麼時候賣出股票
1、自己設定一個盈利點。如盈利20%出局,假如某一股票10元,該股票漲到12元多一點即可賣出。
2、自己設定一個止損點。如虧損8-10%賣出。
3、當大盤進入某一高位時,當證券市場里人頭濟濟時,就應該賣出。
4、賣出時要果斷
❹ 時間序列分析模型——ARIMA模型
姓名:車文揚 學號:16020199006
【嵌牛導讀】:什麼是 ARIMA模型
【嵌牛鼻子】: ARIMA
【嵌牛提問】: ARIMA模型可以具體應用到什麼地方?
【嵌牛正文】:
一、研究目的
傳統的經濟計量方法是以經濟理論為基礎來描述變數關系的模型。但經濟理論通常不足以對變數之間的動態聯系提供一個嚴密的說明,而且內生變數既可以出現在方程的左端又可以出現在方程的右端使得估計和推斷變得更加復雜。為了解決這些問題而出現了一種用非結構方法來建立各個變數之間關系的模型,如向量自回歸模型(vector autoregression,VAR)和向量誤差修正模型(vector error correction model,VEC)。
在經典的回歸模型中,主要是 通過回歸分析來建立不同變數之間的函數關系(因果關系),以考察事物之間的聯系 。本案例要討論如何 利用時間序列 數據本身建立模型,以研究事物發展自身的規律 ,並據此對事物未來的發展做出預測。研究時間序列數據的意義:在現實中,往往需要研究某個事物其隨時間發展變化的規律。這就需要通過研究該事物過去發展的歷史記錄,以得到其自身發展的規律。在現實中很多問題,如利率波動、收益率變化、反映股市行情的各種指數等通常都可以表達為時間序列數據,通過研究這些數據,發現這些經濟變數的變化規律(對於某些變數來說,影響其發展變化的因素太多,或者是主要影響變數的數據難以收集,以至於難以建立回歸模型來發現其變化發展規律,此時,時間序列分析模型就顯現其優勢——因為這類模型不需要建立因果關系模型,僅需要其變數本身的數據就可以建模),這樣的一種建模方式就屬於時間序列分析的研究范疇。而時間序列分析中,ARIMA模型是最典型最常用的一種模型。
二、ARIMA模型的原理
1、ARIMA的含義。 ARIMA包含3個部分,即AR、I、MA。AR——表示auto regression,即自回歸模型;I——表示integration,即單整階數,時間序列模型必須是平穩性序列才能建立計量模型,ARIMA模型作為時間序列模型也不例外,因此首先要對時間序列進行單位根檢驗,如果是非平穩序列,就要通過差分來轉化為平穩序列,經過幾次差分轉化為平穩序列,就稱為幾階單整;MA——表示moving average,即移動平均模型。可見,ARIMA模型實際上是AR模型和MA模型的組合。
ARIMA模型與ARMA模型的區別:ARMA模型是針對平穩時間序列建立的模型。ARIMA模型是針對非平穩時間序列建模。換句話說,非平穩時間序列要建立ARMA模型,首先需要經過差分轉化為平穩時間序列,然後建立ARMA模型。
2、ARIMA模型的原理。 正如前面介紹,ARIMA模型實際上是AR模型和MA模型的組合。
AR模型的形式如下:
其中:參數為常數,是階自回歸模型的系數;為自回歸模型滯後階數;是均值為0,方差為的白雜訊序列。模型記做——表示階自回歸模型。
MA模型的形式如下:
其中:參數為常數;參數是階移動平均模型的系數;為移動平均模型滯後階數;是均值為0,方差為的白雜訊序列。模型記做——表示階移動平均模型。
ARIMA模型的形式如下:
模型記做。為自回歸模型滯後階數,為時間序列單整階數,為階移動平均模型滯後階數。當時,,此時ARIMA模型退化為MA模型;當時,,ARIMA模型退化為AR模型。
3、建立ARIMA模型需要解決的3個問題。 由以上分析可知,建立一個ARIMA模型需要解決以下3個問題:
(1)將非平穩序列轉化為平穩序列。
(2)確定模型的形式。即模型屬於AR、MA、ARMA中的哪一種。這主要是通過 模型識別 來解決的。
(3)確定變數的滯後階數。即和的數字。這也是通過 模型識別 完成的。
4、ARIMA模型的識別
ARIMA模型識別的工具為自相關系數(AC)和偏自相關系數(PAC)。
自相關系數: 時間序列滯後k階的自相關系數由下式估計:
其中是序列的樣本均值,這是相距k期值的相關系數。稱為時間序列的自相關系數,自相關系數可以部分的刻畫一個隨機過程的形式。它表明序列的鄰近數據之間存在多大程度的相關性。
偏自相關系數: 偏自相關系數是在給定的條件下,之間的條件相關性。其相關程度用偏自相關系數度量。在k階滯後下估計偏自相關系數的計算公式為:
其中是在k階滯後時的自相關系數估計值。稱為偏相關是因為它度量了k期間距的相關而不考慮k-1期的相關。如果這種自相關的形式可由滯後小於k階的自相關表示,那麼偏相關在k期滯後下的值趨於0。
識別:
AR(p) 模型 的自相關系數是隨著k的增加而呈現指數衰減或者震盪式的衰減,具體的衰減形式取決於AR(p)模型滯後項的系數;AR(p)模型的偏自相關系數是p階截尾的。因此可以通過識別AR(p)模型的偏自相關系數的個數來確定AR(p)模型的階數p。
MA(q) 模型 的自相關系數在q步以後是截尾的。MA(q)模型的偏自相關系數一定呈現出拖尾的衰減形式。
ARMA(p,q) 模型 是AR(p)模型和MA(q)模型的組合模型,因此ARMA(p,q)的自相關系數是AR(p)自相關系數和MA(q)的自相關系數的混合物。當p=0時,它具有截尾性質;當q=0時,它具有拖尾性質;當p,q都不為0,它具有拖尾性質。
通常,ARMA(p,q)過程的偏自相關系數可能在p階滯後前有幾項明顯的 尖柱 ,但從p階滯後項開始逐漸趨於0;而它的自相關系數則是在q階滯後前有幾項明顯的 尖柱 ,從q階滯後項開始逐漸趨於0。
三、數據和變數的選擇
本案例選取我國實際GDP的時間序列建立ARIMA模型,樣本區間為1978—2001。數據來源於國家統計局網站上各年的統計年鑒,GDP數據均通過GDP指數換算為以1978年價格計算的值。見表1:
表1:我國1978—2003年GDP(單位:億元)
年度GDP年度GDP年度GDP
19783605.6198610132.8199446690.7
19794074198711784.7199558510.5
19804551.3198814704199668330.4
19814901.4198916466199774894.2
19825489.2199018319.5199879003.3
19836076.3199121280.4199982673.1
19847164.4199225863.7200089340.9
19858792.1199334500.7200198592.9
四、ARIMA模型的建立步驟
1、單位根檢驗,確定單整階數。
由單位根檢驗的案例分析可知,GDP時間序列為2階單整的。即d=2。通過2次差分,將GDP序列轉化為平穩序列 。利用序列來建立ARMA模型。
2、模型識別
確定模型形式和滯後階數,通過自相關系數(AC)和偏自相關系數(PAC)來完成識別。
首先將GDP數據輸入Eviews軟體,查看其二階差分的AC和PAC。打開GDP序列窗口,點擊View按鈕,出現下來菜單,選擇Correlogram(相關圖),如圖:
打開相關圖對話框,選擇二階差分(2nd difference),點擊OK,得到序列的AC和PAC。(也可以將GDP序列先進行二階差分,然後在相關圖中選擇水平(Level))
從圖中可以看出,序列的自相關系數(AC)在1階截尾,偏自相關系數(PAC)在2階截尾。因此判斷模型為ARMA模型,且,。即:
3、建模
由以上分析可知,建立模型。首先將GDP序列進行二次差分,得到序列。然後在Workfile工作文件簿中新建一個方程對話框,採用 列表法 的方法對方程進行定義。自回歸滯後項用ar表示,移動平均項用ma表示。本例中自回歸項有兩項,因此用ar(1)、ar(2)表示,移動平均項有一項,用ma(1)表示,如圖:
點擊確定,得到模型估計結果:
從擬合優度看,,模型擬合效果較好,DW統計量為2.43,各變數t統計量也通過顯著性檢驗,模型較為理想。對殘差進行檢驗,也是平穩的,因此判斷模型建立正確。
❺ 股票指數的周數據,指的是當周最後一天的數據,還是應該為當周所有交易日的平均值
股票指數的周數據指的是當周所有交易日的數據, 不是當周所有交易日的平均值。
股市指數,簡單來說,就是由證券交易所或金融服務機構編制的、表明股票行市變動的一種供參考的數字。
指數是各個股票市場漲跌的重要指標,通過觀察指數,我們可以對當前整個股票市場的漲跌有直觀的認識。
股票指數的編排原理對我們來說還是有點難度,我就不做過多的解釋了,點擊下方鏈接,教你快速看懂指數:新手小白必備的股市基礎知識大全
一、國內常見的指數有哪些?
會對股票指數的編制方法和它的性質來進行一個分類,股票指數有這五種形式的分類:規模指數、行業指數、主題指數、風格指數和策略指數。
其中,出現頻率最多的是規模指數,比如說,各位都很清楚的「滬深300」指數,說明了交易比較活躍的300家大型企業的股票在滬深市場上都具有比較好的代表性和流動性一個整體狀況。
再譬如說,「上證50 」指數也是一個規模指數,說的是上證市場規模較大的50隻股票的整體情況。
行業指數它其實是某一行業整體狀況的一個代表。好比「滬深300醫葯」就是一個行業指數,代表滬深300指數樣本股中的多支醫葯衛生行業股票,也對該行業公司股票整體表現作出了一個反映。
像人工智慧、新能源汽車等這些主題的整體狀況就是通過主題指數來反映,那麼還有一些相關指數「科技龍頭」、「新能源車」等。
想了解更多的指數分類,可以通過下載下方的幾個炒股神器來獲取詳細的分析:炒股的九大神器免費領取(附分享碼)
二、股票指數有什麼用?
從上文可以了解到,指數一般是選起了市場中可以起明顯作用的股票,所以,如果我們就可以通過指數比較迅速的獲得市場整體漲跌狀況的信息,那麼我們就能順勢看出市場熱度如何,甚至可以預測未來的走勢是怎麼樣的。具體則可以點擊下面的鏈接,獲取專業報告,學習分析的思路:最新行業研報免費分享
應答時間:2021-09-06,最新業務變化以文中鏈接內展示的數據為准,請點擊查看
❻ 時間序列在股市有哪些應用
時間序列分析在股票市場中的應用
摘要
在現代金融浪潮的推動下,越來越多的人加入到股市,進行投資行為,以期得到豐厚的回報,這極大促進了股票市場的繁榮。而在這種投資行為的背後,越來越多的投資者逐漸意識到股市預測的重要性。
所謂股票預測是指:根據股票現在行情的發展情況地對未來股市發展方向以及漲跌程度的預測行為。這種預測行為只是基於假定的因素為既定的前提條件為基礎的。但是在股票市場中,行情的變化與國家的宏觀經濟發展、法律法規的制定、公司的運營、股民的信心等等都有關聯,因此所謂的預測難於准確預計。
時間序列分析是經濟預測領域研究的重要工具之一,它描述歷史數據隨時間變化的規律,並用於預測經濟數據。在股票市場上,時間序列預測法常用於對股票價格趨勢進行預測,為投資者和股票市場管理管理方提供決策依據。
❼ 股市的原理、股票漲跌的原理是什麼
影響股票漲跌的因素有很多:供求關系、上市公司的盈利能力、投資者的信心、國家政策、其他投資品種收益的高低等。一般情況下,影響股票價格變動的最主要因素是股票的供求關系。
❽ 應用計量經濟學時間序列分析在股票預測上有多大的作用
作用沒有想像中的大,你可以用股票的滯後變數來進行回歸分析,滯後2~3期就夠了,不過數據必須具體點,最好細分到每季度、每月的上證指數,還有時間上怎麼也要十年左右吧!
我以前在論文附錄中做過分析,數據都是自己按季度整理的,挺麻煩的呢,如果需要的話就發給你~
還有就是,我覺得寫關於股票的預測方面的實際用處並不是很大,畢竟股票的影響因素太多,單單的憑藉以前的走勢而預期太不好了。。我自己也炒股票,就像那些macd、kdj之類的指標根本就起不到太大的作用,如果那個能預期的話,股市豈不就成了提款機了?現在你做的這個就像是那些指標一樣,要知道,股市是活的,人是活的,而指標確實死的!說這么多的意思就是股市不是能簡單預測的,你做的那個用處不大。。
如果你想做的話,建議換個題目,我當時的寫的是對弗里德曼的貨幣需求理論在中國市場的分析。你可以寫寫貨幣供應量對通貨膨脹的時滯性,分析下在我國市場的滯後期大概是多少~數據在國家統計局和中國人民銀行都可以找到的,樣本空間一定要足夠大,在對滯後變數分析時候主要考慮各自的T檢驗是否通過,一般從通過之後大概就是那個的滯後期!這個比較直接反而有些許用處~
要是能分析出國家的一般性政策對實體市場的影響就更好了,更有用了~
呵呵,以上只是自己的建議~有什麼其他的問題就給我留言吧~
❾ 什麼是時間序列分析法
時間序列是按時間順序的一組數字序列。時間序列分析就是利用這組數列,應用數理統計方法加以處理,以預測未來事物的發展。時間序列分析是定量預測方法之一,它的基本原理:一是承認事物發展的延續性。應用過去數據,就能推測事物的發展趨勢。二是考慮到事物發展的隨機性。任何事物發展都可能受偶然因素影響,為此要利用統計分析中加權平均法對歷史數據進行處理。該方法方法簡單易行,便於掌握,但准確性差,一般只適用於短期預測。
❿ 如何深入理解時間序列分析中的平穩性
聲明:本文中所有引用部分,如非特別說明,皆引自Time Series Analysis with Applications in R.
接觸時間序列分析才半年,盡力回答。如果回答有誤,歡迎指出。
對第一個問題,我們把它拆分成以下兩個問題:
Why stationary?(為何要平穩?)
Why weak stationary?(為何弱平穩?)
Why stationary?(為何要平穩?)
每一個統計學問題,我們都需要對其先做一些基本假設。如在一元線性回歸中(),我們要假設:①不相關且非隨機(是固定值或當做已知)②獨立同分布服從正態分布(均值為0,方差恆定)。
在時間序列分析中,我們考慮了很多合理且可以簡化問題的假設。而其中最重要的假設就是平穩。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平穩的基本思想是:時間序列的行為並不隨時間改變。
正因此,我們定義了兩種平穩:
Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, · · ·, is the same as that of,, · · · ,for all choices of natural number n, all choices of time points ,, · · · , and all choices of time lag k.
強平穩過程:對於所有可能的n,所有可能的,, · · · , 和所有可能的k,當,, · · ·,的聯合分布與,, · · · ,相同時,我們稱其強平穩。
Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平穩過程:當①均值函數是常數函數且②協方差函數僅與時間差相關,我們才稱其為弱平穩。
此時我們轉到第二個問題:Why weak stationary?(為何弱平穩?)
我們先來說說兩種平穩的差別:
兩種平穩過程並沒有包含關系,即弱平穩不一定是強平穩,強平穩也不一定是弱平穩。
一方面,雖然看上去強平穩的要求好像比弱平穩強,但強平穩並不一定是弱平穩,因為其矩不一定存在。
例子:{}獨立服從柯西分布。{}是強平穩,但由於柯西分布期望與方差不存在,所以不是弱平穩。(之所以不存在是因為其並非絕對可積。)
另一方面,弱平穩也不一定是強平穩,因為二階矩性質並不能確定分布的性質。
例子:,,互相獨立。這是弱平穩卻不是強平穩。
知道了這些造成差別的根本原因後,我們也可以寫出兩者的一些聯系:
一階矩和二階矩存在時,強平穩過程是弱平穩過程。(條件可簡化為二階矩存在,因為)
當聯合分布服從多元正態分布時,兩平穩過程等價。(多元正態分布的二階矩可確定分布性質)
而為什麼用弱平穩而非強平穩,主要原因是:強平穩條件太強,無論是從理論上還是實際上。
理論上,證明一個時間序列是強平穩的一般很難。正如定義所說,我們要比較,對於所有可能的n,所有可能的,, · · · , 和所有可能的k,當,, · · ·,的聯合分布與,, · · · ,相同。當分布很復雜的時候,不僅很難比較所有可能性,也可能很難寫出其聯合分布函數。
實際上,對於數據,我們也只能估算出它們均值和二階矩,我們沒法知道它們的分布。所以我們在以後的模型構建和預測上都是在用ACF,這些性質都和弱項和性質有關。而且,教我時間序列教授說過:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考慮的是強平穩,我覺得可能連5%都沒有了。
對第二個問題:
教授有天在審本科畢業論文,看到一個寫金融的,用平穩時間序列去估計股票走勢(真不知這老兄怎麼想的)。當時教授就說:「金融領域很多東西之所以難以估計,就是因為其經常突變,根本就不是平穩的。」
果不其然,論文最後實踐階段,對於股票選擇的正確率在40%。連期望50%都不到(任意一點以後要麼漲要麼跌)。
暑假裡自己用了一些時間序列的方法企圖開發程序性交易程序。
剛開始收益率還好,越往後就越...後面直接虧損了...(軟體是金字塔,第二列是利潤率)
虧損的圖當時沒截,現在也沒法補了,程序都刪了。
所以應該和平穩沒關系吧,畢竟我的做法也沒假設是平穩的。如果平穩我就不會之後不盈利了。
(吐槽)自己果然不適合做股票、期貨什麼的...太高端理解不能...
以上