1. 使用Yahoo! Finance獲取港股歷史數據及簡單事件分析法運用
前言
我為前老闆進行港股數據研究,涉及獲取實時歷史數據與事件分析法應用。使用Yahoo! Finance獲取數據,依賴港交所與香港銀行公會獲取基礎信息。主要工具為Python(Jupyter Notebook與Spyder),輔用Stata。
獲取港股數據
使用yfinance包下載Yahoo! Finance歷史數據。需先安裝yfinance包,可在cmd或Anaconda Prompt快速安裝。
獲取港股股票名單與預處理
通過港交所官方網站獲取港股股票名單與代碼,注意轉換格式以匹配Yahoo! Finance的格式。在Stata中進行簡單處理並篩選。
下載數據
設定時間范圍,循環所有股票代碼,合並數據以獲取港股市場與恆生指數歷史數據。使用pd.DataFrame.concat方法合並數據。
獲取H股與紅籌股名單
識別China-affiliated股票,通過港交所網站或爬蟲獲取H股與紅籌股名單,分別儲存。
獲取無風險利率
參考Lam and Tam (2011 JBF),選取一個月的HIBOR作為無風險利率。直接從香港銀行公會官網爬取數據。
時間分析法
完成所需數據收集後,進行近期事件的簡單時間分析。針對港股市場與China-affiliated股票進行單獨分析。
2. 怎麼把股票代碼轉換為stata的格式
假設000001、000012、000123、002345、600356、600378為某些上市公司證券代碼,上市公司實證研究中,常常需要用到上市公司證券代碼,將字元型轉為數值型比較容易,直接用destring命令即可實現,但是數值型轉為字元型並且補齊6位數的命令比較少見。字元型轉為數值型 destring Stkcd,replace數值型轉為字元型 tostring Stkcd,replace replace Stkcd=substr("000000",1,6 length(Stkcd))+Stkcd
1、打開Stata15軟體,然後點擊左上角的「File(文件)」選項。2、在「File(文件)」選項中點擊「import(插入)」選項。3、在「import(插入)」選項中點擊「Excel spreadsheet」選項。4、在「import Excel」界面中,首先點擊「browser(瀏覽)」選項,然後選擇需要導入的Excel表格,最後點擊「打開」按鈕。5、點擊需要導入Excel表格的數據范圍,作者這里選擇的范圍是A1:O43,然後點擊「OK」。6、返回至Stata15軟體的主界面,點擊左上方的「編輯」按鈕。7、就可以查看導入的Excel表格中的數據了,然後在另存為stata數據格式就完成了。
3. estudy (Stata Command)
estudy 是用於在Stata中進行事件研究分析的命令。以下是關於estudy命令的詳細解釋:
功能:estudy命令主要用於分析特定事件對股票價格或其他金融指標的影響。它允許用戶設定事件窗口、選擇計算正常收益率的模型,並評估事件對不同股票或資產的影響。
數據集:在使用estudy命令時,需要有一個包含事件研究所需數據的數據集,如示例中的data_estudy.dta。數據集應包含股票的歷史價格、事件發生日期等信息。
事件窗口:用戶需要設定事件窗口,即事件發生前後的時間段。例如,表示事件發生前一天到發生後一天的時間段,則表示事件發生前三天到發生後三天的時間段。
正常收益率計算:estudy命令允許用戶選擇計算正常收益率的模型,如示例中採用的默認模型。正常收益率是指在沒有事件發生的情況下,股票或資產預期會獲得的收益率。
變數選擇:用戶需要選擇用於計算正常和異常收益率的變數,如市場指數。這些變數將用於估計股票或資產在事件窗口內的預期表現。
結果分析:通過比較不同股票在事件前後表現的變化,用戶可以評估事件對這些公司的影響。例如,觀察股票價格的異常波動、計算異常收益率等。
高級方法:為了提升事件研究的精確性,用戶可以採用更高級的方法,如Fama和French的三因素模型、Kolari及Pynnonen的測試等。這些方法可以提供更詳細的統計分析和結果解釋。
結果輸出:estudy命令允許用戶將事件研究的結果保存到Excel文件或Stata數據文件中,以便進行進一步的分析和利用。
4. 【Stata寫論文】常見的畫圖命令有哪些
在Stata中,論文寫作中常見的畫圖命令豐富多樣,旨在幫助作者直觀展示數據關系與趨勢。以下是一些常用的畫圖命令及其應用場景:
1. **散點圖+擬合線**:使用twoway(lfit price weight) (scatter price weight)來創建散點圖並添加線性擬合線。這有助於評估兩個變數之間的線性關系。如需調整范圍、標簽和判斷調節變數對斜率的影響,可以使用xscale(range(1 10000)) xlabel(#5) ylabel(#5)和if m<2、if m>3等條件語句。添加lfitci命令可顯示置信區間。
2. **分位數回歸與繪圖**:使用`qreg`命令進行分位數回歸分析,通過`graph`命令展示結果,有助於理解數據分布特徵。
3. **散點圖**:表示變數Y(股票收盤價)與X(日期)之間的關系,適合展示時間序列數據的變動。
4. **線形圖**:通過`immediate scatterplot`結合數據標簽,展示變數隨時間或其他連續變數的變化趨勢。
5. **面積圖**:用以顯示數據區域的累計量,強調變化過程中的累積效果。
6. **條形圖**:比較不同類別或組之間的數量,適合展示分類數據。
7. **刺形圖**:用於顯示數據點的分布和頻率,尤其在統計學和概率分析中。
8. **范圍陰影圖**:通過陰影表示數據范圍,常用於展示數據波動或不確定性。
9. **平滑線形圖**:使用`spline`命令生成平滑曲線,幫助識別數據的趨勢而非隨機波動。
10. **LOWESS線形圖**:利用局部加權線性回歸,適用於非線性趨勢的展示,能有效捕捉數據中的復雜模式。
這些畫圖命令在論文寫作中扮演著重要角色,它們幫助作者清晰、直觀地展示研究發現,增強論文的可讀性和說服力。在使用時,需根據具體研究需求和數據特徵靈活選擇和調整。
5. Stata學習:CSMAR股票流動性資料庫!
選擇數據源時,優先考慮國泰安提供的CSMAR股票流動性資料庫。該資料庫包含了廣泛的金融數據,適合深入研究股票市場。
在數據清洗階段,需要關注單表和多表的數據整合。單表操作中,重點關注個股換手率表(日)(LIQ_TOVER_D),這是衡量股票交易活躍程度的重要指標。
同時,個股Amihud指標表(日)(LIQ_AMIHUD_D)也是另一重要數據,它能夠反映股票市場的流動性狀況,對投資者和研究者均具有極高價值。
處理這些數據時,只需更換文件名即可完成代碼的調整,適用於不同表格的處理。
完成變數預覽階段,通過觀察數據,進一步理解單表與多表的整合過程,確保數據的准確性和完整性。
總結完畢,CSMAR股票流動性資料庫為深入分析股票市場提供了豐富資源,通過有效數據處理和整合,能夠挖掘出有價值的信息,支持投資者決策和學術研究。