‘壹’ 用r语言进行时间序列分析如何显示最终的方程
时间序列(time series)是一系列有序的数据。通常是等时间间隔的采样数据。如果不是等间隔,则一般会标注每个数据点的时间刻度。
time series data mining 主要包括decompose(分析数据的各个成分,例如趋势,周期性),prediction(预测未来的值),classification(对有序数据序列的feature提取与分类),clustering(相似数列聚类)等。
这篇文章主要讨论prediction(forecast,预测)问题。 即已知历史的数据,如何准确预测未来的数据。
‘贰’ R语言画时间序列图
用xlim或者ylim命令。比如:
# Specify axis options within plot()
plot(x, y, main="title", sub="subtitle",
xlab="X-axis label", ylab="y-axix label",
xlim=c(xmin, xmax), ylim=c(ymin, ymax))
‘叁’ r语言画时间序列图年份不出来
日期格式不正确腔念神。在R语言中,日期需要按照特定伍亏的格式进行处理才能正确显示。例如数据中日期格式为2021/01/01,需要先将其转换为"2021-01-01"的格式才能正确高坦绘制时间序列图。
‘肆’ 金融时间序列分析用R语言画简单收益率和对数收益率的ACF图!
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')
Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")
运行结果有以下错误,怎么办?
> int <- read.table("d-intc7208.txt", head=T)
错误于file(file, "rt") : 无法打开链结
此外: 警告信息:
In file(file, "rt") :
无法打开文件'd-intc7208.txt': No such file or directory
+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
错误: 意外的符号 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
错误: 意外的符号 in "log return"
‘伍’ 如何用R 语言 建立 股票价格的时间序列
在下想用R语言对股票价格进行时间序列分析。
问题出在第一步,如何将股票价格转换为时间序列。
我想用的语句是 pri <- ts (data, start=(), frequency= )
但是我不知道frequency 项该如何填?
因为股票的交易日是一周五天的。 那么这个frequency 该如何设置呢?
我知道通常frequency= 12 为月度数据,frequency= 4 为季度数据,frequency= 1 为年度数据 但日数据怎么写我就不知道了
初学R语言,还望各位大侠多多帮助。
‘陆’ 90-预测分析-R语言实现-时间序列1
时间序列(time series)是随机变量Y 1 、Y 2 、……Y t 的一个序列,它是由等距的时间点序列索引的。
一个时间序列的均值函数就是该时间序列在某个时间索引t上的期望值。一般情况下,某个时间序列在某个时间索引t 1 的均值并不等于该时间序列在另一个不同的时间索引t 2 的均值。
自协方差函数及自相关函数是衡量构成时间序列的随机变量在不同时间点上相互线性依赖性的两个重要函数。自相关函数通常缩略为ACF函数。ACF函数是对称的,但是无单位,其绝对值被数值1约束,即当两个时间序列索引之间的自相关度是1或-1,就代表两者之间存在完全线性依赖或相关,而当相关度是0时,就代表完全线性无关。
平稳性:实质描述的是一个时间序列的概率表现不会随着时间的流逝而改变。常用的平稳性的性质有严格平稳和弱平稳两个版本。tseries包的adf.test()函数可以检验时间序列的平稳性,返回的p值小于0.05则表示是平稳的。
白噪声是一隐正告个平稳过程,因为它的均值和方差都是常数。
随机漫步的均值是常数(不带漂清空移的随机漫步),但它的方差是随着时灶明间的变化而不同的,因此它是不平稳的。
自回归模型(Autoregressive models, AR)来源于要让一个简单模型根据过去有限窗口时间里的最近值来解释某个时间序列当前值的想法。
自回归条件异方差模型:ARIMA模型的关键前提条件是,虽然序列本身是非平稳的,但是我们可以运用某个变换来获得一个平稳的序列。像这样为非平稳时间序列构建模型的方法之一是作出一个假设,假设该模型非平稳的原因是该模型的方差会以一种可预见的方式随时间变化,这样就可以把方差随时间的变化建模为一个自回归过程,这种模型被称为自回归条件异方差模型(ARCH)。加入了移动平均方差成分的ARCH模型称为广义自回归条件异方差模型(GARCH)。
任务:预测强烈地震
数据集:2000-2008年期间在希腊发生的强度大于里氏4.0级地震的时间序列。
不存在缺失值。
将经度和纬度之外的变量转换为数值型。
从图上可以看出,数据在30次左右波动,并且不存在总体向上的趋势。
通过尝试多个不同的组合来找到最优的阶数参数p,d,q,确定最优的准则是使用参数建模,能使模型的AIC值最小。
定义一个函数,它会针对某个阶数参数拟合出一个ARIMA模型,并返回模型的AIC值。如果某组参数导致模型无法收敛,就会产生错误,并且无法返回AIC,这时需要人为设置其AIC为无限大(InF)。
调用函数,选取最合适的模型。
然后找出最优的阶数参数:
得到最合适的模型为ARIMA(1, 1, 1)。再次使用最优参数训练模型。
使用forecast包预测未来值。
带颜色的条带是预测的置信区间,蓝色线表示均值,结果表示在后续的10个月里,地震的数量会有小幅增加。
检查自相关函数:
ACF绘图:虚线显示了一个95%的置信区间,特定延迟对应的ACF函数值如果处于该区间内,就不会被认为具有统计显着性(大于0)。这个ACF轮廓表明,针对本数据集,简单的AR(1)过程可能是一种合适的拟合方式。
PACF为偏自相关函数,是将时间延迟K的PACF定义为在消除了小于K的延迟中存在的任何相关性影响的情况下所产生的相关性。
‘柒’ 时间序列分析
在R中生成时间序列的前提是我们将分析对象转成时间序列函数对象,包括观测值、起始时间、种植时间、及周期(月、季度、年)的结构。这些都能通过ts( )函数实现。
R语言中,对时间序列数据进行分析处理时,使用差分函数要注意:差分函数diff()不带参数名的参数指滞后阶数,也就是与滞后第几阶的数据进行差分。如果要指定差分的阶数,则一定要使用带名称的参数:diff=2。
例如: sample表示样本数据。
1、diff(sample,2)表示是对滞后2阶的数据进行差分,一阶差分,等同于: diff(sample,lag=2)
2、diff(sample,diff=2)才是表示二阶差分
意:在函数中尽量避免使用没有命名的参数。在《时间序列分析及应用-R语言(第2版)》中,P315,描述到: 我们得到的教训就是,除非完全了解相关参数的位置,否则使用未命名参数是非常危险的。
截尾是指时间序粗念早列的自相关函数(ACF)或偏自相关函数(PACF)在高辩某阶后均为0的性质(比如AR的PACF);
拖尾是ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。
拖尾 :始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)
截尾 :在大于某个常数k后快速趋于0为k阶截尾
AR模型:自相关系数拖尾,偏自相关系数截尾;
MA模型:自相关系数截尾,偏自相关函数拖尾;
ARMA模型:自相关函数和偏自相关函数均拖尾。
根据输出结果, 自相关函数图拖尾,偏自岩雀相关函数图截尾 ,且n从2或3开始控制在置信区间之内,因而可判定为AR(2)模型或者AR(3)模型。
‘捌’ R语言里做时间序列分析有哪些包
直接谷歌一下,“时间序列分析
R语言”,就能得到你想要的结果
以下结果来自,
作者:詹鹏2012-9-20
22:46:46
【包】
library(zoo)宽告
#时间格式预处理
library(xts)
#同上
library(timeSeires)
#同上
library(urca)
#进行单位根源祥检验
library(tseries)
#arma模型
library(fUnitRoots)
#进行单位根检验
library(FinTS)
#调用其中的自回归检验函数
library(fGarch)
#GARCH模型
library(nlme)雹巧搏
#调用其中的gls函数
library(fArma)
#进行拟合和检验
【基本函数】
数学函数
abs,sqrt:绝对值,平方根
log,
log10,
log2
,
exp:对数与指数函数
sin,cos,tan,asin,acos,atan,atan2:三角函数
sinh,cosh,tanh,asinh,acosh,atanh:双曲函数
简单统计量
sum,
mean,
var,
sd,
min,
max,
range,
median,
IQR(四分位间距)等为统计量,sort,order,rank与排序有关,其它还有ave,fivenum,mad,quantile,stem等
‘玖’ r语言时间序列预测值为什么都一样
r语言时间序列预测值都一样:证明模型错误贺毕。时间序列主要是根据历史数据对未来进禅稿芹行预测,语言时敬困间序列预测值都一样,证明模型错误。
‘拾’ R语言做时间序列分析时,summary给出的结果都是什么意思啊
这个段戚饥是自动适仔尘应参数估计的结果。
模型握返估计为ARIMA(4,0,2),即ARMA(4,2)
系数为:
ar1 ar2 ar3 ar4 ma1 ma2
-0.5505 0.2316 0.0880 -0.4325 -0.1944 -0.5977
s.e. 0.1657 0.1428 0.1402 0.1270 0.1766 0.1732
s.e.是系数的标准差,系数显着性要自己算,|系数/se| > 1.96 即 95%的置信度
sigma^2 estimated 估计值方差
log likelihood 对数似然值
(这个不用解释了吧)
AIC=709.13 AICc=710.73 BIC=725.63
再就是下面一堆误差计算
ME Mean Error
RMSE Root Mean Squared Error
MAE Mean Absolute Error
MPE Mean Percentage Error
MAPE Mean Absolute Percentage
MASE Mean Absolute Scaled Error