财新传媒
位置:博客 > 万钊 > 一个整理宏观数据的大概流程|以消费数据为例

一个整理宏观数据的大概流程|以消费数据为例

当我们准备做一个宏观经济模型的时候,一个首要的工作是对宏观数据进行预处理,比如填补缺失值、名义值折算实际值、季节性调整等,本文以社会消费品零售总额的数据为例,简单讨论一下整理宏观数据的大概流程。
 
一、基于同比数据调整绝对值
 
社会消费品零售总额,一般会发布两个数据,第一个是当月值,第二个是当月同比。如果我们使用当月值,自己计算同比,会发现与官方公布的当月同比,存在差异。比如下图中的橙色线,就是基于当月值自行计算的同比,其在2018年出现了一个明显的下探。
关于这种背离,根据统计局的解释,主要是两个原因,第一是经济普查后的修订,比如根据第四次全国经济普查结果对2019年社会消费品零售总额进行了修订,2020年月度增速按照可比口径计算;第二是限额以上单位的统计范围发生变化。
 
因此第一步,我们先根据官方同比数据,调整当月值。具体方法是,我们将2011年的当月值作为基年,使用同比增速向前、向后调整当月值。调整后的结果如下图中的橙色线:
二、填补缺失值
 
为了消除春节日期不固定因素带来的影响,增强数据的可比性,自2012年开始,1-2月份数据一起调查,一起发布,这样就在1月份带来一个缺失值。我们所使用的季调程序,无法处理缺失数据,因此我们需要填补缺失值。
 
我们使用scipy包的interpolate模块,使用三次样条函数对缺失值进行插补。填补后如右图:
三、构造定基价格指数,折算实际值
 
我们需要构造一个价格指数,来把名义值折算成实际值。我们使用2016年的CPI定基指数作为基期,使用商品零售价格指数(RPI)的当月同比,来构造社会消费品零售总额的定基价格指数。
构造了定基价格指数之后,用名义值与定基价格指数相除,即可得到社会消费品零售总额的实际值如下:
四、季节性调整
 
最后一步是季节性调整,我们使用美联储的X-13-ARIMA-SEATS模型进行调整,关于中国的春节效应,考虑到春节前后对消费的影响效果不同,我们添加节前7天、节后14天两个影响变量,来拟合春节对消费的影响。下图中的橙色线为季调后数据,可以看到对季节性有较好的移除效果。
以上就是对宏观数据进行预处理的过程,得到季调后的数据之后,我们就可以做各种宏观经济模型了。



推荐 0