由真实数据制造的假象

本文2024-10-25日转载自: 原作者:

生活的经历告诉我们做事情一定要“心中有数”,但心中有数首先要眼里有数,所以我们习惯于“实证方法”,通过调查得出统计数据,再做成表格、数字,好了,这下,我们踏实了。
　　可是,由于商业利益的存在,统计数据也会表现出倾向性,或者预先设定了倾向性。所以,让我们感到踏实的数字未必反映真实状况。
　　美国著名统计学家达莱尔·哈夫的名著《统计数字会撒谎》或许能让我们对于统计中的陷阱有入木三分的认识。
　　达莱尔提出,当你面对统计数据时,先要问自己5个问题:谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?
　　通常我们遇到的统计陷阱,首先是统计本身的不真实性,比如统计样本的选择偏差,或是样本空间过小,导致代表性差。
　　统计样本的选择偏差是比较常见的,由于调查者的主观意向或者客观失误的影响,统计样本的选择偏差直接影响到统计的结果。
　　比如,你有一桶豆子,有红色、有白色,那么红色的豆子有多少呢?如果按照统计学的办法,就是抓一把豆子(抽样),然后算一下红白豆子的比例就能够得到近似的结果。但这个前提是,红白豆子在体积形状重量上的无差异化。如果是大豆子和小豆子呢?按照物理学原理,小豆子会在桶的下面,而大豆子在上面,如果你在上面抓一把样本,就是大豆子多;在桶底抓一把样本,就是小豆子多。
　　如果抽取开发商作为样本调查房价是不是高?抽取医药人员作为样本调研医疗费高不高?说得再搞笑一些,抽取交通违章者作为样本去调查交通警的形象。那么,看似科学的统计会得出相当滑稽的结果。
　　样本的空间要足够大,才能保证统计的稳定性和可信度。比如说,抽取10个样本和抽取1000个样本,显然是不一样的。当初美国某大学有一个惊人的统计数字,该校物理系有50%的女生和男教师同居,校方大为震惊,仔细调查,确实如此,该系有两名女生,其中一人与男教师堕入爱河……
　　如果统计者在统计样本的选择上有意无意地做出一些“猫腻”来,就能够得到预期的统计结果。
　　统计的另一个陷阱在于统计之后的分析过程,在分析中,统计者是否遗漏了什么?或者忽视了统计所依赖的条件?
　　达莱尔在书中举了个例子:“某年公布的数据显示,该年4月的零售额高于去年同期,于是证明经济开始进入复苏阶段,但遗漏的内容是前一年的复活节在3月,而该年的复活节在4月,所以复活节带来的消费高峰在4月。”暂时的消费高峰显然不能代表经济的转向。
　　我们经常看到这样的分析报告,某产品价格10000元,目前消费群体是10万,年收入1亿元,如果全国有百分之一的人消费该产品,就会有1300万消费群体,年收入将高达130亿元,带来××亿元的税后利润。
　　类似的分析过程我们并不陌生,但统计者忽略了一个事实,那就是从10万消费群体增加到1300万的前提是价格的大幅降低,而价格大幅降低之后,收入就不会那么多了,利润更会有很大的变化。试想,如果现在的手机还是当年大哥大的价格,能做到如此普及吗?
　　以突发事件代替常态,从小样本推广到大样本,如果忽视了一些重要的因素,分析过程就会产生缺陷。即使是正确的统计数字也未必能得到正确结论。
　　桑普拉斯说,统计分析让一切假象原形毕露。但遗憾的是,统计未必能够揭示真实,有时候还可能制造假象。当我们面对生活中形形色色的统计数据的时候,千万多保持一些理智和清醒。
　　(钟少华摘自《深圳晚报》,黎青图)
（作者：张晓辉）

青年文摘相关文章

蟋蟀和青蛙	父亲与狗
时髦儿子和落伍老爸	不要做那棵含羞草
用数字占卜的人	以爱的名义怀念　却无从报答
父母亲的旅行	走向光明的所在
常用寒暄语等４则	关于母亲
草地上的野火鸡	为了雪山神
等待爱情的号码牌	乖孩子为何没糖吃
不必等到盛春再开花等４则	谁忽悠我们喝瓶装水？
雪夜林边小立	手机

青年文摘推荐文章

草地上的野火鸡	恋爱女孩，切记带钱包
你会用多少种语言说“我爱你”	我们丢失了什么？
合作的黄金定律	信息快递
弟弟的冰糖	你有终生就业力吗
当你只拥有５００毫升水	蛇道
潮汐——蓝色的地球	漂亮经济学
那年的梦想等４则	穷小子的骗局
白宫主人与他们的亲密伙伴	西伯利亚的温暖
高分“突围”，志愿有窍门	电梯奇遇记

青年文摘热门文章

沾着红指印的司康饼	世界上最伟大的策划
比基尼发展史	远方，有我的父亲
年轻的秘诀	“谜”漫两千年的西瓜雪
塑料瓶潜藏多少危险	如果上帝为你开错了窗
海豹猎人之死	谁让哈佛沦落
偷还是不偷，这是个问题	亲爱的,没有比你更美好的事物了
把人间变成天堂等3则	愚蠢的誓言等3则
为“UFO”洗白	笑了，然后思考
换个距离看世界	生活中的趣味数学

乐清上班族_微信公众号

乐音清和_微信公众号

有声杂志_微信公众号

由真实数据制造的假象

乐清上班族_微信公众号

乐音清和_微信公众号

有声杂志_微信公众号

网站推荐