家评论使用数学查找网络上最愚蠢（最聪明）的评论者

使用数学查找网络上最愚蠢（最聪明）的评论者

2024

视频: Borderlands 2 guia definitiva sobre el terramorfo (十一月 2024)

内容

使用数学查找网络上最愚蠢（也是最聪明）的评论者
进入清单…
桶底

曾几何时，人们希望万维网能够以数字kumbayaness的新精神团结各行各业的人们。尽管技术确实以前所未有的方式将我们团结在一起，但它也使那些对文明不感兴趣的人获得了权力，但是他们有大量的空闲时间匿名地在Internet上冒出愤怒，事实上缺乏能力的ALL-CAPS词p。

网上的评论部分因“ GAY !!!”，“ LIBTARD !!!!”，“ NAZI !!!”和“ RON PAUL 2016 !!!!”的调用而引起共鸣。因为这是Internet辩论当今紧迫问题的方式。（让我们不要忘记将克雷克雷阴谋论编织成完全无关的文章。）

但是您是否曾经想过哪个互联网社区最缺乏沟通技能？当然，您对此事有意见。当我们想到这些人时，我们所有人都可以至少命名一个网站。

不幸的是，任何建立评论等级的尝试都必然会受到偏见的污点（或至少是外观）的污染。但是，确实可能存在一种方法，可以消除事件中的所有偏见和意识形态，并对不同评论社区的相对愚蠢行为进行冷淡的，数字驱动的分析。

Online-utility.org上的“可读性计算器”根据许多不同的可读性测试（例如Gunning Fog Index）分配分数。

这些分数是方程式的结果，方程式将可量化的属性（例如单词，句子和音节的数量）作为因素。 Gunning Index的方程式如下所示：

该分数与一个人需要轻松理解其文字的美国正规教育的年限相吻合。因此，得分12表示它符合十二年级某个人的阅读水平，而得分4则表明该文本处于四年级的阅读水平，依此类推。

为了了解如何将其应用于网络，我们从英语数字互联网的不同角度对八个受欢迎的网站的评论部分进行了采样：（按字母顺序列出）CNN，Fox Nation，Gawker，《纽约时报》，PCMag（是的，包括我们在内），Reddit，The Atlantic和YouTube。我们通过“可读性计算器”对他们进行了搜索，以寻求关于谁拥有最聪明和最愚蠢的评论者的冷酷事实。

调查结果可能会让您感到惊讶。

首先，快速浏览一下我们的方法：

对于调查中包含的每个网站，我们选择了三个受到高度评价的故事作为数据集。如果可用，我们从网站自己的评论最多的部分中进行选择（或从类似的“最受欢迎”故事列表中进行选择-表明这些作品非常活跃）。

接下来，我们将每个故事的前50条注释复制到Word文档中。然后，通过一系列复杂的查找和替换操作，我们将注释文本与所有无关的站点碎片（例如，化身，注释者名称，时间签名等）分离了。

然后，我们剩下了一个文档，里面装满了纯净，纯净的用户生成的文本，例如：

接下来，我们将提炼的文本合并为主文本，然后将其放入“可读性计算器”中。

作为一个简单的例子，我们分析了赫尔曼·梅尔维尔（Herman Melville）的经典《白鲸记》（ Moby Dick）的第一章（可在此处作为公共领域文档获得），发现它获得了以下可读性评分。

冈宁雾指数：12.02

科尔曼·廖尔指数：8.62

Flesch-Kincaid年级：10.16

ARI（自动可读性指数）：9.97

SMOG指数：11.33