前几次,我们讨论过用彤彤心和Guoren.com。今天我们以choice为平台,比较股票和基金的长期表现。
进入choice后,找到股票数据浏览器,找到左下角的“所有a股”,从“待选指标”中选择“年度收盘价”,选择2011年至2022年9月30日,然后复权。在“证券信息”中选择“首次上市日期”和“退市日期”,保存模板,导出excel表。
这个表还不能直接使用,需要做一个“数据清洗”的步骤。以此表为例。有很多冗余数据。比如出于某种原因,有些2、9开头的b股也导出,也有一些8开头的新三板股票,必须删除。
在复权后价格中,也存在一些错误的数据,比如初始上市日前的复权后价格和退市日后的复权后价格,这些都不是股票生命周期内的价格,必须剔除。
平台部分没有仔细核对,输入数据有误。不管你的计算有多正确,结果肯定是错的。所以对于我们来说,尽可能地手工检查和清理错误的数据,是数据工作者的必修课。
然后建立一个新的“收益率”表,计算每只股票的年收益率。公式很简单=当年后复权价/上年后复权价-1,但这两个价格为空的情况必须消除。细节决定成败。
然后计算上表中的数据。以2012年为例。数量:=COUNTIFS小于0。数量:=COUNTIFS(产量!C:C,lt;0)等于0数量:=COUNTIFS(产量!C:C,=0)合计:=总和(B2:B4)胜率:=B2/B5平均:=平均(收益率!C:C)中位数:=中位数(收益率!C:C)然后把2012年到2013-2022年(截至2022年9月30日)这一栏的数据复制过来
用类似的方法,我们得到了混合基金的上表。
然后让我们比较一下股票和共同基金在过去10年中的表现。先看胜率。从2012年到2021年,混合型基金的胜率至少比股票高4.34%,最多高63.29%,平均22.94%。唯一一只混合型基金胜率跑赢股票的是截至2022年9月30日的11.61%。
看算术平均值,11年,混合型基金7年跑赢股票,4年跑输股票;中位数也是7年优于大盘,4年劣于大盘。整体来看,混合型基金跑赢了股票。
今天的例子是为了说明清理数据的重要性和边界条件的重要性。查找bug的方法是从原始数据入手查找案例的错误,然后举一反三进行全面的修正。培养这种能力很重要,不加区分的直接使用数据很可能会出现bug。
昨日外围市场开始强势反弹。今日恒生指数暴涨5.90%。据说会先涨后跌。让我们耐心等待。