商品详情

49.00

数据的真相(如何在数字时代做出明智决策)(精)

数量

商品详情

内容推荐

  市场推广人员在产品包装上重点突出了什么,为什么突出这些数据?为什么年度报告上,有些数据以饼状图的形式出现,而其他数据以柱状图标出出现?销售预测是基于哪些数据得出的?你的医生说你的病是由某些行为引起的,还是这些行为只是和你的疾病相关?你知道如果待在一家公司不动,赚的钱会更少吗?在奥运赛事中,去掉最高分和最低分再取平均值,对运动员公平吗?为什么美国大多数总统的任期为1460天或者2921天?晚睡的人智商会比较高吗?星巴克旁边的房子升值更快吗?穿耐克鞋就能像乔丹一样灌篮?过了保质期的食品到底能不能吃?我们每天都在刷头条、浏览弹窗,每天都会接触海量的数据信息,但是这些信息背后隐藏着什么真相?如何识别那些一本正经的胡说八道?尽管人人都在谈“大数据”,但真实的情况是理解“小数据”——即头条新闻、股票分析、天气预报等背后的量化数据,以及数据之间的真实关系——,能够帮助你在工作中、在投资中、在育儿、在日常生活的方方面面做出更为明智的决定。 普通人一天大约要接收30G的数据,但大部分人不知道如何正确地解读这些数据。MIT数据学专家约翰·H.约翰逊、迈克·格鲁克在《数据的真相(如何在数字时代做出明智决策)》这本书中讲述了如何破译每天接触到的数据,将复杂的问题变得更简单和直观。 这本书涉及商业、零售、广告、育儿等诸多领域的真实案例,以及时常为人们所误解的数据概念。在本书中,你不仅能够找到如何在信息庞杂的世界中识别数据谎言、挖掘有用信息的终极方法,而且还能找到凭借该答案迅速做出明智决定的深刻智慧。

目录

  前言

  序

  第一章 无处不在的数据:从大数据到小数据

   “小数据”

   小情境

   成熟的数据接收者

  第二章 对“挑战者号”评估结果的异议:抽样如何影响结果

   1986年1月28日

   理解样本选择

   我们为何需要抽样?

   如果是这样,结果会如何?

   “怪诞”的科学

   抽样不一定越大就越好

   系上带

   我们是第1名,也是第58名!

   不接受自拍

   选举总统与人口普查

   取其精华,去其糟粕

   填空

   缺了什么?

   做一个成熟的数据抽样接收者

  第三章 红色州为什么变蓝了:平均数及总数——近观概括性统计

   当心数据缝隙

   平均数、中位数和众数哪个更可信?

   迈阿密人出生时平均是西班牙裔,死时是犹太人?

   为什么副市长会比市长赚得多?

   如何评估学生的成绩?

   平均值的平均值

   警惕数据中的异类

   去掉高分和低分有道理吗?

   总统办公室的离群值?

   掩盖信息的代价为10亿美元

   你是否比一般人更为优秀

   如何成熟对待数据总和、平均值、离群值

  第四章 使用苹果手机的人更?正确理解关联性和因果性

   智能手机=人?

   星巴克旁边的房子更快?

   还有什么因素可以解释这件事?

   我们有没有让你们觉得无聊?

   为什么重要

   穿耐克鞋就能像乔丹一样灌篮?

   婴儿、洗澡水和波尔多红酒

   你在搜索引擎页面排第几?

   烤奶酪的性福生活(我们差点将其用作书名)

   加利福尼亚的阳光和美属萨摩亚岛上的律师

   不要被媒体人骗了

   了解大脑的工作模式

   抛弃先入为主的观念

   依然重要的一点

   如何成熟地应对关联性和因果性

  第五章 眼见真的为实吗?我们信仰统计学

   民意调查

   二手烟是否会致癌?

   重要的事

   深呼吸

   抽样大小事关重大

   你有多大把握?

   泄露秘密

   如何面对截然相反的结论

   效果显著

   这个研究对我的生活重要吗?

   等等,还有呢

   了解自己所看到的是否重要,从而成为成熟的数据

   接收者

  第六章 非洲为什么会变小?歪曲与曲解

   不要臆断

   柱状图和饼状图应该怎么画?

   微妙的圆

   图表让人看起来更值得信任

   对所有数据一视同仁导致曲解数据

   体会有和仅有的区别

   油表显示油箱为空为什么还能开个几里路?

   造假与失误

   错误数据抹掉股市1360亿美元

   不要相信维基百科

   过了保质期的食品能不能吃?

   确凿无误的消息也可能被误读

   1/4磅牛肉汉堡与1/3磅牛肉汉堡哪个大?

   如何明智地接收被歪曲(或可能被歪曲)的数据

  第七章 筛选数据需要“摘樱桃法则”:疯狂筛选

   筛选数据的“摘樱桃法则”

   用统计学的观点如何看祸不单行?

   如何解读体育赛事中的统计数据?

   房价上涨了还是下跌了?

   政客们如何筛选数据?

   相信我们——我们在打广告

   你是“摘樱桃的人”——没错,就是你

   选出较好的,留下其他的

   市场营销人员如何筛选数据?

   如何识别经过筛选的数据?

  第八章 为什么福岛事故是可以预防的:预测未来的技术

   明天太阳会照常升起吗?

   预知和预测的区分

   出国旅游之前,请告知金融机构

   正确地看待预测

   抛硬币与“赌徒谬论”

   我们身边的预言家

   你知道什么?

   民调为什么会出错?

   偶然与概率

   心理因素影响预测

   如何成为一个的预测者

  第九章 拨开数据的迷雾:总结

   不要轻信头条新闻中的数据

   如何看待工作满意度调查?

   出生月份与健康有关系吗?

   如何解读关于问题学生的数据?

   如何使用房价评估网站的数据?

   如何成为一个成熟的数据接收者

  尾声

  词汇表

  注释

  致谢

序言

  2010年春,美国国家橄榄球联盟(NFL)的老总 们在提出诸多要求之外,还想将常规赛季的比赛场数 额外增加两场。作为国家橄榄球球员协会(NFLPA) 的执行主任,我觉得这并不是一件好事。橄榄球赛的 受伤率已经高达百分之百,因此多打比赛意味着更多 伤病。而伤病率的上升会导致运动员职业生涯进一步 缩短,现在运动员的运动生涯本就只有三年多一点。 橄榄球运动员在赛季期间每周都会冒着很大风险投身 于这项美国人民喜爱的运动中,我们协会对他们的、 报酬,以及保护措施极为关注。 职业橄榄球产业创造的价值高达数十亿美元,而 且依然在不断发展壮大之中。但在2010到2011年间, 该行业经历了数十年不遇的停工斗争,因此我需要以 一个具有说服力的方式来证明赛季的长度维持在十六 场比赛不变。 于是我拨通了约翰·约翰逊的电话。 约翰是经济学、统计学、数据学领域的专家,他 能够把极为复杂的数据理论变得简单易懂,让人一目 了然。简言之,他应该能够算得上是我认识的人中非 常的一个。他能够仔细、全面地解释问题,不论你受 教育水平如何,都能够听得懂。而且,他这人还很风 趣。 怀着和美国所有橄榄球迷一样的心愿,国家橄榄 球球员协会想拯救即将到来的全国橄榄球联赛。因此 我们把相关数据交给了约翰。约翰及其同事开发出一 个模型,展示球员受伤的时间和频率。他们指出导致 严重伤害的动作(从而引出对球员造成巨大影响的“ 开球规则”)。他们通过数据预测出平均每个球员职 业生涯缩短的程度,估计出将全国橄榄球联赛赛季延 长至十八场比赛可能导致的经济损失。他们同我们合 作,将每场全国橄榄球联赛对周边社区产生的实际价 值进行量化,帮助我们对可能发生的结束赛季停工所 产生的经济影响有一个更好的理解。 约翰以其出色的口才向球员、媒体,尤其是NFL 的老总们(他们对“损失”这类词特别关心)解释了 这些数据,我们得以做出既符合我们初衷,又能保障 球员的健康和的决定,促成了后续的谈判,签订了一 项历史性的协议,该协议为期十年,很好地保障了 NFL球员的权益。 本书很好地反映了约翰的思想。我十分有信心该 书能够帮助你在日常生活中做出更好的决定。通过阅 读本书,你可以学到如何对每天接收到的数据进行理 解、解读、思考。约翰和本书的合著者迈克·格鲁克 通过列举数百个例子,直指问题本质,举重若轻地将 复杂问题化繁为简(有时候甚至能让你忍俊不禁)。 因此在阅读本书过程中,要是发现自己因为恍然大悟 而频频点头,并开始质疑家里和单位中看到的每一项 “事实”,请不要感到惊讶。 有一个不可否认的事实,即你每天生活中的数据 正在迅速增加,并从四面八方向你涌来。因此了解如 何运用数据,以及在什么情况下数据会被滥用十分重 要。我亲身体验了数据的力量,但你不需要和一群世 界上极富有的人在金球环节一起加班,体会理解数据 、管理数据的重要性。在你电视、购物、工作、在餐 厅吃饭的时候,这本书是你的不二之选。《小数据》 见解深刻、内容引人、文字勾人,在关键时刻填补了 一个关键空白。 本书相当于橄榄球队主教练编写的比赛战略手册 ,能够助你在运用数据的赛场上变得更强大、更、更 有信心。 祝阅读愉快。 国家橄榄球球员协会执行主任 莫里斯·F.史密斯

导语

  每天你都被媒体报道或其他来源的消息所包围,这些消息通常充斥着隐藏信息——或误导信息。约翰·H.约翰逊、迈克·格鲁克著的这本《数据的真相(如何在数字时代做出明智决策)》将帮助你辨别、解读这些信息,使你成熟地汲取数据(“信息”或“事实”比较高端的说法)。 全书通篇将回答以下问题:一则虚假新闻如何让股市一下子蒸发掉1360亿美元?福岛核灾难是否可以避免?80%的儿科医生是如何看待婴儿食品的?如何知道哪个总统候选人的选票领先?当然,还有……吃烤奶酪三明治的人们真的更为“性福”吗?

后记

  到此就结束了。 其实并没有。 因为当你第二天早上醒来的时候,你会被更多的 数据狂轰滥炸。更多的抽样及筛选数据的情况也会发 生,更多的人会混淆关联性与因果性,会有更多的网 站、博客、新闻广播不停给你灌输你该或者不该做什 么,从而让自己寿命更长、头脑更灵、活得更好。 但愿,读完本书,你能够运用所学到的知识,看 到隐藏在你每天都会用到的所有“小数据”背后的错 误信息,并清楚地知道如何应对。

书评(媒体评论)

  这本书将使你变得更为,反应更快。所以请在做 决定或下结论前读一下吧。 ——营销大师赛斯·高汀 在当今世界,信息无处不在。知道如何运用、解 读信息能够成为一项的战略性优势。 ——美国天气公司(Weather Company)天气分 析副总裁、气象学家保罗·沃尔西 约翰和迈克通过趣味十足、热情洋溢的文字,带 领我们一步步成为成熟的数据接收者。 ——麻省理工学院经济学、JPAL实验室创始人埃 斯特·迪弗洛 约翰和迈克运用浅显易懂的语言,教我们如何处 理每天洪水一般向我们涌来的数据,从而将数据所带 来的可能性展示给更多人。这本书的价值不可估量! ——谷歌图片和信息流部门副总裁布拉德利·霍 洛维茨 《数据的真相》巧妙地将一本应用统计学教科书 去粗取精,提炼为“精华本”。突出了其中有意义、 有价值的部分,而这些知识是我们在当今大数据世界 里浏览信息所掌握的。对于这本书,我觉得再怎么推 荐都不为过。 ——乔治梅森大学法律和经济学,曾任美国联邦 商务委员会委员约书亚·D.赖特

精彩页

  警惕数据中的异类 除非你处理的是完全相同的数据组,即所有数据的值都一样,否则你的数据中总有一些值和平均值不同。 比如,我们这章讲到的英国幸福指数,我们指出英国的幸福指数为7.3。但英国不同地区的幸福指数从7.0到7.9不等。 这些数据看起来相互吻合。这便是你在调查数据总体的时候期望看到的事。 但有时候,你会发现有一些特定的观察资料与其他材料无法吻合。也许有些数据远远高于(或低于)其他数据,或者也许某个数据和其他任何数据放在一起,都显得格格不入。 这些反常的事物被称为异类。国家橄榄球联盟球员是异类;14岁就从大学毕业的孩子是异类;那你公司最差,只完成了倒数第二名1/3业绩的销售人员呢?也是个异类。 你在观察平均值的时候,需要留心这些异类。因为你即将发现这些离群值对平均值会产生十分巨大的影响。就好像在清咖啡里面加入奶油。尽管咖啡的含量依然达到95%,但几滴奶油将大大改变咖啡的外观。 难点在于离群值没有一个确定的判断标准。有些经济学家认为理论上离群值就是大大偏离中位数的那个数值,但从实践上讲,这种判断非常主观,而且不同人有不同的解读方式。这就是为何统计学家花费大量时间逐例分析数据,以判断其是否是离群值。 所以,是什么导致离群值的出现?有时候,仅仅是因为出了差错。可能有人在往空白表格上填数字的时候,把数字顺序搞错了,把4.9填成了9.4。也许试管受到了污染,导致细菌数远远高于正常值。错误难免会发生。 有时候,离群值是出现不正常情况的危险信号。1998年马克·麦奎尔为圣路易斯红雀队打出了70个本垒打,这个情况看起来不同寻常。对于没有使用类固醇药物的人来说,的确不正常。10年后,麦奎尔承认在创造纪录的那个赛季服用了药物,从而证实粉丝和数据学家的怀疑是正确的。 最后,你在阅读或听新闻的时候,要记住有些故事之所以能够成为新闻,只因其报道的是离群值。老生常谈和那些(极为)非比寻常的事相比,常常会显得没有那么激动人心。 去掉最高分和最低分有道理吗? 如果你关注奥林匹克运动会的话,你可能熟悉人们试着应对离群值的方法——直接将其抛弃。例如,在跳水、体操,以及其他运动项目上,运动员的得分是去除最高分和最低分,再将其他裁判的分数相加,再取平均值所得出的。 这种策略——名为截尾取平均数——能够防止因为一个裁判的偏见或个人喜好影响最终结果。根据一篇研究2000年奥林匹克运动会跳水成绩的文章,这种截尾取平均数的方法不止影响了一块奖牌的归属。拍 然而,截尾取平均数——拿这个方法来处理可能存在的离群值——真的有用吗?你可以问一下自己,如果有超过一名裁判偏向于某个运动员,会出现什么情况?奥林匹克运动会常用的评分方式仅仅去除最高值和最低值。再考虑一下,截尾取平均数这一方式将最高值和最低值当作离群值看待,而不管其是否真的是离群值。这样的评分方式真的公平吗? 现在就出现了问题,即是否最高分和最低分——不论其是否是离群值——是偏见的标志。的确,国别的偏见可能存在——研究人员发现“绝大多数裁判较不是自己国家的运动员而言,会给自己国家的运动员更高的分数”。但是我们来看一下中国的跳水裁判,他在2000年奥运会期间,给中国跳水运动员的平均成绩比非中国跳水运动员要高1.48分。看上去有偏见是吧?但当研究人员分析数据的时候,发现其实该裁判从他给出的分数来看“显然是最没有偏见的”。这怎么可能?因为这个中国裁判给中国以及非中国跳水运动员打出的分数,平均来看比其他裁判都要高。中国跳水运动员水平的确出色,事实上,他们的平均分比非中国跳水运动员要高出1.44分。因此,研究人员观察这位中国裁判打的分数,发现同其他裁判给本国跳水运动员加的分数相比,事实上这位中国裁判给中国跳水运动员加的分数相对较少。在这种情况下,把这位中国裁判的分数去掉还有道理吗? P58-61

相关产品推荐

服务参数

- 本商品享受上述商家服务 - 关闭

商品参数

×