阅读:0
听报道
当我们准备做一个宏观经济模型的时候,一个首要的工作是对宏观数据进行预处理,比如填补缺失值、名义值折算实际值、季节性调整等,本文以社会消费品零售总额的数据为例,简单讨论一下整理宏观数据的大概流程。
一、基于同比数据调整绝对值
社会消费品零售总额,一般会发布两个数据,第一个是当月值,第二个是当月同比。如果我们使用当月值,自己计算同比,会发现与官方公布的当月同比,存在差异。比如下图中的橙色线,就是基于当月值自行计算的同比,其在2018年出现了一个明显的下探。
关于这种背离,根据统计局的解释,主要是两个原因,第一是经济普查后的修订,比如根据第四次全国经济普查结果对2019年社会消费品零售总额进行了修订,2020年月度增速按照可比口径计算;第二是限额以上单位的统计范围发生变化。
因此第一步,我们先根据官方同比数据,调整当月值。具体方法是,我们将2011年的当月值作为基年,使用同比增速向前、向后调整当月值。调整后的结果如下图中的橙色线:
二、填补缺失值
为了消除春节日期不固定因素带来的影响,增强数据的可比性,自2012年开始,1-2月份数据一起调查,一起发布,这样就在1月份带来一个缺失值。我们所使用的季调程序,无法处理缺失数据,因此我们需要填补缺失值。
我们使用scipy包的interpolate模块,使用三次样条函数对缺失值进行插补。填补后如右图:
三、构造定基价格指数,折算实际值
我们需要构造一个价格指数,来把名义值折算成实际值。我们使用2016年的CPI定基指数作为基期,使用商品零售价格指数(RPI)的当月同比,来构造社会消费品零售总额的定基价格指数。
构造了定基价格指数之后,用名义值与定基价格指数相除,即可得到社会消费品零售总额的实际值如下:
四、季节性调整
最后一步是季节性调整,我们使用美联储的X-13-ARIMA-SEATS模型进行调整,关于中国的春节效应,考虑到春节前后对消费的影响效果不同,我们添加节前7天、节后14天两个影响变量,来拟合春节对消费的影响。下图中的橙色线为季调后数据,可以看到对季节性有较好的移除效果。
以上就是对宏观数据进行预处理的过程,得到季调后的数据之后,我们就可以做各种宏观经济模型了。
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。