『壹』 用r語言進行時間序列分析如何顯示最終的方程
時間序列(time series)是一系列有序的數據。通常是等時間間隔的采樣數據。如果不是等間隔,則一般會標注每個數據點的時間刻度。
time series data mining 主要包括decompose(分析數據的各個成分,例如趨勢,周期性),prediction(預測未來的值),classification(對有序數據序列的feature提取與分類),clustering(相似數列聚類)等。
這篇文章主要討論prediction(forecast,預測)問題。 即已知歷史的數據,如何准確預測未來的數據。
『貳』 R語言畫時間序列圖
用xlim或者ylim命令。比如:
# Specify axis options within plot()
plot(x, y, main="title", sub="subtitle",
xlab="X-axis label", ylab="y-axix label",
xlim=c(xmin, xmax), ylim=c(ymin, ymax))
『叄』 r語言畫時間序列圖年份不出來
日期格式不正確腔念神。在R語言中,日期需要按照特定伍虧的格式進行處理才能正確顯示。例如數據中日期格式為2021/01/01,需要先將其轉換為"2021-01-01"的格式才能正確高坦繪制時間序列圖。
『肆』 金融時間序列分析用R語言畫簡單收益率和對數收益率的ACF圖!
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')
Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")
運行結果有以下錯誤,怎麼辦?
> int <- read.table("d-intc7208.txt", head=T)
錯誤於file(file, "rt") : 無法打開鏈結
此外: 警告信息:
In file(file, "rt") :
無法打開文件'd-intc7208.txt': No such file or directory
+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
錯誤: 意外的符號 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
錯誤: 意外的符號 in "log return"
『伍』 如何用R 語言 建立 股票價格的時間序列
在下想用R語言對股票價格進行時間序列分析。
問題出在第一步,如何將股票價格轉換為時間序列。
我想用的語句是 pri <- ts (data, start=(), frequency= )
但是我不知道frequency 項該如何填?
因為股票的交易日是一周五天的。 那麼這個frequency 該如何設置呢?
我知道通常frequency= 12 為月度數據,frequency= 4 為季度數據,frequency= 1 為年度數據 但日數據怎麼寫我就不知道了
初學R語言,還望各位大俠多多幫助。
『陸』 90-預測分析-R語言實現-時間序列1
時間序列(time series)是隨機變數Y 1 、Y 2 、……Y t 的一個序列,它是由等距的時間點序列索引的。
一個時間序列的均值函數就是該時間序列在某個時間索引t上的期望值。一般情況下,某個時間序列在某個時間索引t 1 的均值並不等於該時間序列在另一個不同的時間索引t 2 的均值。
自協方差函數及自相關函數是衡量構成時間序列的隨機變數在不同時間點上相互線性依賴性的兩個重要函數。自相關函數通常縮略為ACF函數。ACF函數是對稱的,但是無單位,其絕對值被數值1約束,即當兩個時間序列索引之間的自相關度是1或-1,就代表兩者之間存在完全線性依賴或相關,而當相關度是0時,就代表完全線性無關。
平穩性:實質描述的是一個時間序列的概率表現不會隨著時間的流逝而改變。常用的平穩性的性質有嚴格平穩和弱平穩兩個版本。tseries包的adf.test()函數可以檢驗時間序列的平穩性,返回的p值小於0.05則表示是平穩的。
白雜訊是一隱正告個平穩過程,因為它的均值和方差都是常數。
隨機漫步的均值是常數(不帶漂清空移的隨機漫步),但它的方差是隨著時灶明間的變化而不同的,因此它是不平穩的。
自回歸模型(Autoregressive models, AR)來源於要讓一個簡單模型根據過去有限窗口時間里的最近值來解釋某個時間序列當前值的想法。
自回歸條件異方差模型:ARIMA模型的關鍵前提條件是,雖然序列本身是非平穩的,但是我們可以運用某個變換來獲得一個平穩的序列。像這樣為非平穩時間序列構建模型的方法之一是作出一個假設,假設該模型非平穩的原因是該模型的方差會以一種可預見的方式隨時間變化,這樣就可以把方差隨時間的變化建模為一個自回歸過程,這種模型被稱為自回歸條件異方差模型(ARCH)。加入了移動平均方差成分的ARCH模型稱為廣義自回歸條件異方差模型(GARCH)。
任務:預測強烈地震
數據集:2000-2008年期間在希臘發生的強度大於里氏4.0級地震的時間序列。
不存在缺失值。
將經度和緯度之外的變數轉換為數值型。
從圖上可以看出,數據在30次左右波動,並且不存在總體向上的趨勢。
通過嘗試多個不同的組合來找到最優的階數參數p,d,q,確定最優的准則是使用參數建模,能使模型的AIC值最小。
定義一個函數,它會針對某個階數參數擬合出一個ARIMA模型,並返回模型的AIC值。如果某組參數導致模型無法收斂,就會產生錯誤,並且無法返回AIC,這時需要人為設置其AIC為無限大(InF)。
調用函數,選取最合適的模型。
然後找出最優的階數參數:
得到最合適的模型為ARIMA(1, 1, 1)。再次使用最優參數訓練模型。
使用forecast包預測未來值。
帶顏色的條帶是預測的置信區間,藍色線表示均值,結果表示在後續的10個月里,地震的數量會有小幅增加。
檢查自相關函數:
ACF繪圖:虛線顯示了一個95%的置信區間,特定延遲對應的ACF函數值如果處於該區間內,就不會被認為具有統計顯著性(大於0)。這個ACF輪廓表明,針對本數據集,簡單的AR(1)過程可能是一種合適的擬合方式。
PACF為偏自相關函數,是將時間延遲K的PACF定義為在消除了小於K的延遲中存在的任何相關性影響的情況下所產生的相關性。
『柒』 時間序列分析
在R中生成時間序列的前提是我們將分析對象轉成時間序列函數對象,包括觀測值、起始時間、種植時間、及周期(月、季度、年)的結構。這些都能通過ts( )函數實現。
R語言中,對時間序列數據進行分析處理時,使用差分函數要注意:差分函數diff()不帶參數名的參數指滯後階數,也就是與滯後第幾階的數據進行差分。如果要指定差分的階數,則一定要使用帶名稱的參數:diff=2。
例如: sample表示樣本數據。
1、diff(sample,2)表示是對滯後2階的數據進行差分,一階差分,等同於: diff(sample,lag=2)
2、diff(sample,diff=2)才是表示二階差分
意:在函數中盡量避免使用沒有命名的參數。在《時間序列分析及應用-R語言(第2版)》中,P315,描述到: 我們得到的教訓就是,除非完全了解相關參數的位置,否則使用未命名參數是非常危險的。
截尾是指時間序粗念早列的自相關函數(ACF)或偏自相關函數(PACF)在高辯某階後均為0的性質(比如AR的PACF);
拖尾是ACF或PACF並不在某階後均為0的性質(比如AR的ACF)。
拖尾 :始終有非零取值,不會在k大於某個常數後就恆等於零(或在0附近隨機波動)
截尾 :在大於某個常數k後快速趨於0為k階截尾
AR模型:自相關系數拖尾,偏自相關系數截尾;
MA模型:自相關系數截尾,偏自相關函數拖尾;
ARMA模型:自相關函數和偏自相關函數均拖尾。
根據輸出結果, 自相關函數圖拖尾,偏自岩雀相關函數圖截尾 ,且n從2或3開始控制在置信區間之內,因而可判定為AR(2)模型或者AR(3)模型。
『捌』 R語言里做時間序列分析有哪些包
直接谷歌一下,「時間序列分析
R語言」,就能得到你想要的結果
以下結果來自,
作者:詹鵬2012-9-20
22:46:46
【包】
library(zoo)寬告
#時間格式預處理
library(xts)
#同上
library(timeSeires)
#同上
library(urca)
#進行單位根源祥檢驗
library(tseries)
#arma模型
library(fUnitRoots)
#進行單位根檢驗
library(FinTS)
#調用其中的自回歸檢驗函數
library(fGarch)
#GARCH模型
library(nlme)雹巧搏
#調用其中的gls函數
library(fArma)
#進行擬合和檢驗
【基本函數】
數學函數
abs,sqrt:絕對值,平方根
log,
log10,
log2
,
exp:對數與指數函數
sin,cos,tan,asin,acos,atan,atan2:三角函數
sinh,cosh,tanh,asinh,acosh,atanh:雙曲函數
簡單統計量
sum,
mean,
var,
sd,
min,
max,
range,
median,
IQR(四分位間距)等為統計量,sort,order,rank與排序有關,其它還有ave,fivenum,mad,quantile,stem等
『玖』 r語言時間序列預測值為什麼都一樣
r語言時間序列預測值都一樣:證明模型錯誤賀畢。時間序列主要是根據歷史數據對未來進禪稿芹行預測,語言時敬困間序列預測值都一樣,證明模型錯誤。
『拾』 R語言做時間序列分析時,summary給出的結果都是什麼意思啊
這個段戚飢是自動適仔塵應參數估計的結果。
模型握返估計為ARIMA(4,0,2),即ARMA(4,2)
系數為:
ar1 ar2 ar3 ar4 ma1 ma2
-0.5505 0.2316 0.0880 -0.4325 -0.1944 -0.5977
s.e. 0.1657 0.1428 0.1402 0.1270 0.1766 0.1732
s.e.是系數的標准差,系數顯著性要自己算,|系數/se| > 1.96 即 95%的置信度
sigma^2 estimated 估計值方差
log likelihood 對數似然值
(這個不用解釋了吧)
AIC=709.13 AICc=710.73 BIC=725.63
再就是下面一堆誤差計算
ME Mean Error
RMSE Root Mean Squared Error
MAE Mean Absolute Error
MPE Mean Percentage Error
MAPE Mean Absolute Percentage
MASE Mean Absolute Scaled Error