龚子欣:浅谈“粗细账”的改进与完善
一、基础工作中存在的难处
1、同一调查小区调查户心态不平衡
虽然方案对每个轮转组记账周期中的工作量分配是平均的,都是一年粗账一年细账,但部分配合度较低的记账户会与同一调查小区的其他记账户比较,对粗细不均产生误解:“明明可以记粗账为什么非要记细账”,“为什么是我记细账,他就可以记粗账”,类似这样的声音经常可以从调查户口中听到,影响工作的正常开展。
2、对粗细账户的再培训工作量较大
记账户不比我们统计调查专业人员,轮转组一年后由细转粗时,经过一年养成的记账习惯又要改变,需要对其进行再培训,辅调员的压力较大,集中培训对于城镇调查点难度较大,逐户培训辅导又加大了工作量,频繁的给基层加担子变相将住户的记账负担转移给辅调员。
3、粗细划分缺乏灵活性
按照轮转组的硬性划分,虽然保证了粗细账的随机性,避免了人为干扰,但部分记账质量原本很高很详实的记账户被划分进粗账,而一些不具有消费代表性或记账质量较差的户被划分入细账,难免影响工作开展。虽然总体看同一户都是一年粗一年细,但在一年时间范围内,细账记得好的却记了粗账,细账记得差的硬要被划定记细账,无疑对数据质量有一定的影响。
二、数据分析中存在的弊端
1、消费样本两年可比性进一步减少
目前受到轮转组和粗细账两个因素的影响,导致消费同比数据没有同质可比性,即每过一年,因为轮转组规则一个轮转组要被换掉,而受粗细账一年细一年粗的影响,留下的轮转组又由细转粗,因此,两年对比的消费样本没有一户是相同(见表一),没有长期跟踪可比性,对消费数据的评估带来很大的困难。
表一:轮转组粗细账变化一览表
1轮转组 | 2轮转组 | 3轮转组 | 4轮转组 | 5轮转组 | |
2014年 | 细账 | 粗账 | |||
2015年 | 粗账 | 细账 | |||
2016年 | 粗账 | 细账 | |||
2017年 | 粗账 | 细账 |
2、受奇异值等因素影响可能进一步扩大误差
目前的粗账户的消费数据是采取从家庭情况相似户数据复制消费数据插补生成,寻找的标准仅从家庭规模和收入水平为参考,但可能存在取数的细账户该季度消费结构异常,如目标户该季度有婚丧嫁娶支出、购房支出、大型耐用消费品支出等非经常性的大额支出,恰巧该户收入水平和家庭结构在本区极具代表性,消费被插补到多个粗账户中,则会带来消费数据畸形。以今年二季度武汉市某区的原始数据中的发现的问题为例,细账户中有一户两口之家购买了一台11.98万元的家用轿车,而该户的收入水平和家庭结构在本区又极具代表性,多户粗账户均以该户消费账为模板插补,在插补消费账汇总报表后,发现该季度该区轿车购买量超过5台。在查询分户表中还发现,由于常住人口数量不一致,消费数据会根据常住人口数相应扩大,以轿车为例,目标细账户两口之家该季度消费了一台11.98万元的家用轿车,该户的消费数据插补到一个三口之家的粗账户则变为该三口之家消费了1.5台17.97万元(11.98×1.5)的轿车,将该奇异值进一步扩大,影响了数据准确性。
三、数据审核中存在的问题
1、插补账与本户基本情况不符而出现逻辑错误
粗账户的数据插补是由规模和收入水平相似的细账户直接复制过来,由于插补户和被插补户家庭情况包括耐用消费品拥有量、家庭成员结构、从业情况可能存在差异,插补的数据在审核分户报表时就会产生各种伪错误,例如,目标细账户家庭没有家用轿车,而插补到粗账户后,粗账户拥有汽车但报表审核会提示无汽油消费,或目标细账户有义务教育费用支出,而复制到粗账户,该家庭无在校学生,报表审核同样提示错误,而目前也没有合适的办法可以人工忽略粗账户的审核。
2、程序插补的原则过于机械,可能导致错误
程序的插补原则并未对所有可能发生的情况考虑周全,例如某一粗账户在本季度三个月中,只要存在一笔消费账(该笔消费账可能是由于编码录入错误造成)则视为该户录入了细账,程序将自动跳过该户的插补,导致该户消费数据缺失。
3、插补过程不可逆导致审核改错存档不便
目前的粗账插补是不可逆的,即一旦通过插补生成了细账,则不可删除,一旦遇到插补数据错误,或者目标细账户消费数据有修改变动,插补过的粗账户是不会因为目标户数据有变动而同时变动,程序自动认为该户已插补过消费数据而跳过,因此目前只能采取插补前备份未插补的数据,遇到有数据变动则在未插补的数据文件上修改后再插补,这极大的影响力工作效率,同时繁琐的步骤也容易导致人为错误。
四、一些可行的建议
1、在粗细账对象选取上采取更灵活的选择方式
在如何划分粗细账户的原则上可以采取更灵活的方式,要求每个调查点粗账户比例在小于五成的总体原则上,根据家庭结构、收入消费情况及配合度情况由调查队业务人员灵活选择谁粗谁细,如果辅调员可以说服所有记账户都记“细账”可以采用全部“细账”的调查方式,将“粗账”这种记账方式作为记账户配合度较低时用来减轻其记账负担提高配合度的措施,同时根据粗细记账户工作量来分配记账补助,以此来稳定细账户。
2、数据插补时注重样本代表性与逻辑关系
可以编制程序对奇异值进行甄别,诸如购车、购房这样的大额奇异值,在插补数据时对此编码可以一律不插补,或者提示注意,以确保插补后的数据逻辑合理。对已有消费账但消费笔数较少的粗账户提示是否录入错误。
3、报表审核时跳过粗账户提高效率
由于粗账户记账笔数少,且多为收入和社保支出,每月相对固定,基本不会存在错误,因此审核报表数据时可以跳过对粗账户的帐页报表审核,或用专门的审核公式对粗账户的收入及非消费性支出进行审核,可以有效减少因为不同家庭基本情况不同带来的“伪错误”,极大的提高了审核质量。目前在还没有更合适的审核公式的情况下,我们采用的办法是先审核,最后插补消费数据。
(作者单位:国家统计局武汉调查队)