客FiveThirtyEight的创始人内特•希尔(Nate Silver)对政治感到厌倦了。

希尔因通过大数据分析两次准确预测美国总统大选结果而声名大噪。在最近一次美国大选中,他在选民投票之前就准确预测了50个州的选举结果。

博客FiveThirtyEight的创始人内特•希尔对政治感到厌倦了。
这位作家兼统计学家开发了各种各样的预测项目——2003年他创建了一个棒球赛分析系统,之后他还把统计模型应用到了世界扑克大赛上,并取得了一定的成功。今年4月份,希尔宣布结束他的博客与《纽约时报》(New York Times)之间的合作关系并转投ESPN供职,这将是他提升自身魅力的一个机会。

希尔在一个访谈中谈到了他是如何利用数据来消除偏见,以及如何可以从意想不到的角度统计中国数据的。

以下是经过编辑的访谈摘录:

你的预测中有多少是来自直觉,而不是单纯的数据分析?

统计模型一旦被设计出来,就不能再凭主观去调整它。无论是哪种类型的复杂系统,一个模型的设计方式都是基于判断力的。

“我不喜欢这个结果,所以让我来调整一下这个统计模型。”我是不会这样说的。如何应用这一模型完全靠你自律。不管你用什么方法设计,模型设计原则都离不开科学、判断力以及经验。

你可以把好数据的分析方法应用到坏数据上吗,比方说中国的数据?

美国和英国的人们都高估了经济数据的质量。即便人们都开诚布公,要对像美国这样的经济体做出估测也是很难的。放到中国的话难度就更大了。我认为一个具有共性的经验是:看更广泛的指标比只看某一项指标或某一个行业要有用。

“你是如何衡量中国经济增速的?”这种思路是有问题的。可以采用的一个方法是看看更加公众的指标,比方说,看看中国的光输出量。

我在飞往香港的航班途中经过了北京,发现北京的物理亮度低于美国或欧洲的可比城市。

你的分析模式正在成为主流吗?

《点球成金》(Moneyball, 又译:《魔球》)成书快十年了,我们的分析方法已经在棒球界取得成功。球队现在认识到数据分析所能提供的价值。他们没有解雇球探,但可能解雇了那些根本不称职的决策者。

但数据分析在其他许多领域的应用还很原始。不过我觉得现在人们对它的关注越来越多了,例如,你会听到很多关于大数据的事,你在阅读贸易期刊的时候,也会发现每两个广告中就有一个是有关大数据的。但我不确定人们是否真正了解它的含义。

让人们完全接受它需要一段时间,通常会遇到许多阻力。

变化可能比我们想像的要慢得多。

你的终极目标是什么?

从个人角度讲,我对政治有点厌倦。我认为在这方面该证明的都证明了。

FiveThirtyEight将探索不同的领域和深度。我们会聘请更多记者报道政治消息,这仍是一大焦点。但很显然,我们会与ESPN共同关注体育,也会关注经济学,还可能关注一些生活方式的话题,例如旅游。

这个世界几乎方方面面都可以用更具判断力、更注重实证和数据的方式来报道。找到那些能用令人信服的笔调将之书写出来的人可能有点难度,不过那是既严肃又有趣的事。

我的理论绝不只适用于政治和体育。

Henry Williams

(本文版权归道琼斯公司所有,未经许可不得翻译或转载。)