1. 使用Yahoo! Finance获取港股历史数据及简单事件分析法运用
前言
我为前老板进行港股数据研究,涉及获取实时历史数据与事件分析法应用。使用Yahoo! Finance获取数据,依赖港交所与香港银行公会获取基础信息。主要工具为Python(Jupyter Notebook与Spyder),辅用Stata。
获取港股数据
使用yfinance包下载Yahoo! Finance历史数据。需先安装yfinance包,可在cmd或Anaconda Prompt快速安装。
获取港股股票名单与预处理
通过港交所官方网站获取港股股票名单与代码,注意转换格式以匹配Yahoo! Finance的格式。在Stata中进行简单处理并筛选。
下载数据
设定时间范围,循环所有股票代码,合并数据以获取港股市场与恒生指数历史数据。使用pd.DataFrame.concat方法合并数据。
获取H股与红筹股名单
识别China-affiliated股票,通过港交所网站或爬虫获取H股与红筹股名单,分别储存。
获取无风险利率
参考Lam and Tam (2011 JBF),选取一个月的HIBOR作为无风险利率。直接从香港银行公会官网爬取数据。
时间分析法
完成所需数据收集后,进行近期事件的简单时间分析。针对港股市场与China-affiliated股票进行单独分析。
2. 怎么把股票代码转换为stata的格式
假设000001、000012、000123、002345、600356、600378为某些上市公司证券代码,上市公司实证研究中,常常需要用到上市公司证券代码,将字符型转为数值型比较容易,直接用destring命令即可实现,但是数值型转为字符型并且补齐6位数的命令比较少见。字符型转为数值型 destring Stkcd,replace数值型转为字符型 tostring Stkcd,replace replace Stkcd=substr("000000",1,6 length(Stkcd))+Stkcd
1、打开Stata15软件,然后点击左上角的“File(文件)”选项。2、在“File(文件)”选项中点击“import(插入)”选项。3、在“import(插入)”选项中点击“Excel spreadsheet”选项。4、在“import Excel”界面中,首先点击“browser(浏览)”选项,然后选择需要导入的Excel表格,最后点击“打开”按钮。5、点击需要导入Excel表格的数据范围,作者这里选择的范围是A1:O43,然后点击“OK”。6、返回至Stata15软件的主界面,点击左上方的“编辑”按钮。7、就可以查看导入的Excel表格中的数据了,然后在另存为stata数据格式就完成了。
3. estudy (Stata Command)
estudy 是用于在Stata中进行事件研究分析的命令。以下是关于estudy命令的详细解释:
功能:estudy命令主要用于分析特定事件对股票价格或其他金融指标的影响。它允许用户设定事件窗口、选择计算正常收益率的模型,并评估事件对不同股票或资产的影响。
数据集:在使用estudy命令时,需要有一个包含事件研究所需数据的数据集,如示例中的data_estudy.dta。数据集应包含股票的历史价格、事件发生日期等信息。
事件窗口:用户需要设定事件窗口,即事件发生前后的时间段。例如,表示事件发生前一天到发生后一天的时间段,则表示事件发生前三天到发生后三天的时间段。
正常收益率计算:estudy命令允许用户选择计算正常收益率的模型,如示例中采用的默认模型。正常收益率是指在没有事件发生的情况下,股票或资产预期会获得的收益率。
变量选择:用户需要选择用于计算正常和异常收益率的变量,如市场指数。这些变量将用于估计股票或资产在事件窗口内的预期表现。
结果分析:通过比较不同股票在事件前后表现的变化,用户可以评估事件对这些公司的影响。例如,观察股票价格的异常波动、计算异常收益率等。
高级方法:为了提升事件研究的精确性,用户可以采用更高级的方法,如Fama和French的三因素模型、Kolari及Pynnonen的测试等。这些方法可以提供更详细的统计分析和结果解释。
结果输出:estudy命令允许用户将事件研究的结果保存到Excel文件或Stata数据文件中,以便进行进一步的分析和利用。
4. 【Stata写论文】常见的画图命令有哪些
在Stata中,论文写作中常见的画图命令丰富多样,旨在帮助作者直观展示数据关系与趋势。以下是一些常用的画图命令及其应用场景:
1. **散点图+拟合线**:使用twoway(lfit price weight) (scatter price weight)来创建散点图并添加线性拟合线。这有助于评估两个变量之间的线性关系。如需调整范围、标签和判断调节变量对斜率的影响,可以使用xscale(range(1 10000)) xlabel(#5) ylabel(#5)和if m<2、if m>3等条件语句。添加lfitci命令可显示置信区间。
2. **分位数回归与绘图**:使用`qreg`命令进行分位数回归分析,通过`graph`命令展示结果,有助于理解数据分布特征。
3. **散点图**:表示变量Y(股票收盘价)与X(日期)之间的关系,适合展示时间序列数据的变动。
4. **线形图**:通过`immediate scatterplot`结合数据标签,展示变量随时间或其他连续变量的变化趋势。
5. **面积图**:用以显示数据区域的累计量,强调变化过程中的累积效果。
6. **条形图**:比较不同类别或组之间的数量,适合展示分类数据。
7. **刺形图**:用于显示数据点的分布和频率,尤其在统计学和概率分析中。
8. **范围阴影图**:通过阴影表示数据范围,常用于展示数据波动或不确定性。
9. **平滑线形图**:使用`spline`命令生成平滑曲线,帮助识别数据的趋势而非随机波动。
10. **LOWESS线形图**:利用局部加权线性回归,适用于非线性趋势的展示,能有效捕捉数据中的复杂模式。
这些画图命令在论文写作中扮演着重要角色,它们帮助作者清晰、直观地展示研究发现,增强论文的可读性和说服力。在使用时,需根据具体研究需求和数据特征灵活选择和调整。
5. Stata学习:CSMAR股票流动性数据库!
选择数据源时,优先考虑国泰安提供的CSMAR股票流动性数据库。该数据库包含了广泛的金融数据,适合深入研究股票市场。
在数据清洗阶段,需要关注单表和多表的数据整合。单表操作中,重点关注个股换手率表(日)(LIQ_TOVER_D),这是衡量股票交易活跃程度的重要指标。
同时,个股Amihud指标表(日)(LIQ_AMIHUD_D)也是另一重要数据,它能够反映股票市场的流动性状况,对投资者和研究者均具有极高价值。
处理这些数据时,只需更换文件名即可完成代码的调整,适用于不同表格的处理。
完成变量预览阶段,通过观察数据,进一步理解单表与多表的整合过程,确保数据的准确性和完整性。
总结完毕,CSMAR股票流动性数据库为深入分析股票市场提供了丰富资源,通过有效数据处理和整合,能够挖掘出有价值的信息,支持投资者决策和学术研究。