户均资产247万透视学术糟粕和浮躁
摘要:最近网上出现一个雷人的消息。在长江学者和专家,西南财经大学经济学院院长的领导下,总共花了1千万人民币,动员了无数学生和自愿者对全国25个省,市,自治区, 2500多个县市,进行抽样调查,样本8000多户。报告人发现了两个非常吸引眼球的结果:在城市的样本中,10%的最富人群,占所有财富的90%;同时,城市户均资产高达247万元人民币,全国城市的资产超过美国总资产的21%。按照这个算法,中国已经是世界最富的国家。实在令人欢欣鼓舞。不过网民的反应,除了参与该项目的老师和学生强力狡辩之外,多是骂声一片,大家都认为被247万富翁了。本博文利用该报告的精装版所提供的数据,证明报告人出现了不可原谅的严重错误。根据样本的数据,以及我的精确计算,中国城市户均资产只有76万元,而不是247万元。
背景
中国为了加快速度,成为世界超级强国,一方面大量引进人才,一方面大量花钱,让这些人才能够给国家做贡献。理工科人才是吸引的重点对象,因为文科人才对祖国的社会主义建设还不算重要。加上长年以来,经济学家的名声不大好,社会学家也是一样,而且喜欢对政府提出各种各样的批评意见。因此,只有极少数社科人才被引进和重用。同时,每年国家拨出大量的科研经费,希望科研人员能够为国家出谋献策。在这种背景下,凡是被国家看中的,就可以不惜一切代价,进行大量的投资。
上面讲的科研课题,就是这样的一个国家千万级的重大社会科学课题。政府的官员不懂,其实,国家统计局这样的数据不仅有,而且,统计局得到的数据还是相对比较可靠的。当然,除了国家统计局,让一个独立的学术团队进行这样的研究,也无可厚非。关键的问题有两个:其一,调查的结果对国家的贡献非常有限;其二,得出城市户口户均资产247万的结论,说明这个研究项目出现重大的缺陷。有的人认为是用科学的名誉,进行科学的造假。更多的人认为,研究团队脱离了中国的具体国情,得出来的结果和绝大多数人的感觉完全不符合。
我昨天看到这个报道,发了一个微薄。到了今天,已经有1000多人转发,500人评论。除了少数跟作者有关,跟团队有关的学生之外,其他人都是清一色的提出各种不满和反对意见。该团队的人,不是虚心的听取大家的批评意见,而是找各种各样的借口,为该报告辩护,甚至采取人生攻击的办法。
他们不懂,西南财大,以及这个课题的团队,如果不出这个如此离谱的报告,大家为什么无缘无故的跟你作对?
你可以说,有钱的人太有钱了,所以一平均,平均数就很高。那我也可以告诉你,就算你把90%的城市家庭甩掉,只剩下10%的所谓高收入者。这10%的城市人口就有7100万人,他们的平均财富能够247万也已经不得了了。要让他们把其他90%的人也拉大到247万,10%的这些人户均财富就必须是2000万以上。这可能吗?
如果说北上广的有钱人可能有数百万,甚至上千万,大家还是可以相信的。如果说,一个小县城平均每个家庭有哪怕是1百万的资产,那都是天方夜谭啊。
这么基本的社会基本了解都不懂,还在强烈的用什么中位数只有40万来掩盖平均数247万的无比荒唐的实事。这个团队的学生,也不懂平均数乘与总家庭数,就是整个样本的总资产。再把这个荒唐的总资产,换算成为全国的总资产。这下不得了了,中国的资产超过美国的21%。天啊,大跃进可以,也不是这样搞吧?
那么,他们错误在哪里?
首先,样本太小,8000多户,绝对不可以用来推断全国2.5亿户的城市人口。
其次,抽样不科学。样本分布太过分散,不利于得到任何精确的数据。
其三,搞调查的人太多,而且不专业。连主持这个重大课题的主持人都没有经验,如何让所有的人都知道如何取样?
其四,用钱买来的调查员往往不负责任,非常难以保证数据的可靠性。当调查员被拒查后,随意就近换一户调查本身就是统计精确性和可代表性的最大敌人。
其五,统计数据收集上来以后,没有‘过滤’,没有认真处理可能出现的‘极端值’。要知道,几个极端值,就可以彻底的搞乱所有的计算结果。
其六,该报告精简版,表8显示:样本的人均住房面积,城市为39平米,农村为49平米。这个结果,城市比国家统计局的数字多出10平米,农村多出14平米。样本的平均数,大大地高于国家的平均数。
该报告连自己的数据都没有算对,出现不可饶恕的错误
该报告更不靠谱的是自己的数据都没有算对,而且误差是如此的难以置信。
例如,该报告精简版, 表9和表7给出下面的数据:
表9, 城市每套房子的平均价格
价格 (万rmb/套) 第1套,第2套,第3套
购买成本价 19 39 62
市场价 84 96 122
表7, 城市家庭拥有房子的概率:1套(69.02%), 2套(15.44%),3套和以上(3.63%)。
我如果用表9和表7 所提供的数据,非常容易算出城市平均每户家庭的房地产的价值(用Y表示)如下:
Y = 84 (0.6902)+(84+96)(0.1544)+(84+96+122)(0.0363) = 96.7 万元/户。
对懂数学的人,我不用解释,大家就知道我为什么用这个公式计算户均房地产的价值。不懂的,请你们找个数学老师解释一下就可以了。
这个计算,用了表9的房地产市场价格,而不是成本价格,这本身就大大地高估了房地产的价值了。我上面的计算方法,唯一没有考虑的就是,拥有3套房子的人,可能有3套以上。所以,有点偏低估算。但是,因为拥有3套房的家庭比例只有3.63%,就算我把这一组的平均房子数提高到4,算出来的结果也只有110万。
那么,我们姑且,用每户110万的房地产来推算平均每个家庭的总资产吧。根据该课题组的另一个重要的结果是,房地产占总资产的70%,而且每个城市家庭的负债率为28万人民币。
那么,NY = Y/0.7 – 28 = 110/0.7 – 28 = 129万人民币/户。NY 代表每个城市家庭的总净资产。计算的结果是129万人民币,比报告人自己的计算少了98万元。我还必须强调,每户129万元还是被严重高估的。一是样本严重偏向较高收入人群,这可以从人均住房面积的偏高得到验证。二是,我们用的是房地产流行价格,而不是成本价格。流行价格是非常不靠谱的,真实的价格应该介于成本价和市场价之间。如果是这样算,城市的户均资产就是76万元。
结论
我利用西南财大的报告数据推算,中国城市户均总资产只有76万元,最高限也只有129万元。财大的这个报告为了提高知名度,硬是把这个数字说成是247万元。
这种严重的造假和不科学的态度,在学术上是绝对不可容忍的。花了那么多的钱,还利用媒体传播没有任何科学依据,甚至故意把自己采集的数据,还大肆的加以歪曲。
我刚开始还以为247万可能因为是样本误差而已,这最多也是个研究方法问题。所以我在微薄上用了非常有分寸的口吻。没有想到,这个团队的成员,不仅不科学,而且素质低下,采取非常无聊的方式,为这个报告辩护。有一位队员,还叫我看看该报告的精装本,想通过这个来证明他们是如何的了不起。没有想到,我还就认真地读了这个报告,凭我平素对数据的爱好,我对每个数据都认真地分析了一下。
结果,发现问题比我想象的大得多了。他们提供的3 个表,也就是上面的表7,8, 9, 让我用了他们的数据,推翻他们的结论,这才是真正的不可思议,让人回味无穷。