coyle18_M.R. Cole Photographer_Getty Images_AI data M.R. Cole Photographer/Getty Images

数据确定性的危险因素

剑桥—我在人文和艺术领域工作的朋友已经着手做一些不同寻常的事,那就是仔细研究数据,至少对他们而言的确如此。当然,这种变化与疫情相关。他们每天都要查阅新冠感染病例数,了解R系数下降的速度有多慢或者多快,以及此前一天,我们区域内有多少人完成了疫苗注射。

与此同时,有关所有形式其他数据的各式主张和反主张充斥着社交媒体。全球贫困究竟是在上升还是下降?什么才是美国真实的失业率?这样的审查有时会导致激烈的争论,因为人们想要引用——或者挑战——支撑其立场或世界观的权威数据。

但在其他数据应用领域,人们极少关注数据的可靠性或解释。最近引起我注意的一个引人瞩目的例子涉及“验证码”(CAPTCHA)测试,该测试旨在保护网站免遭机器人攻击,它要求测试对象通过识别包含船只、自行车或红绿灯等常见特征图像来证明自己的人类身份。如果你的选择——哪怕是正确的——与利用你的选择来训练图像识别算法的机器系统所做出的选择不符,你将会被视为非人类。

https://prosyn.org/4hu06nSzh