如果您将注意力集中在XKeyscore背后的技术上-美国国家安全局(NSA)用来阻止恐怖分子的所谓政府计划-而不是政治,那实际上是令人难以置信的。 一些报告估计XKeyscore程序可以处理多达410亿条记录。
XKeyscore的核心是两个主要技术趋势:大数据和数据分析。 渴望采用这种技术的不仅仅是政府。 信息是目前最热门的商品。 这是根据正在收集和分析相同大数据集的公司正在使用的工具以及帮助这些公司移动这些数据的供应商的评论,看一下诸如XKeyscore之类的程序在技术规范方面的内幕。
惊人的技术
大数据是指收集如此庞大的数据集,以至于需要专门的技术来筛选,分析和报告该信息。 简而言之,数据分析是将信息细分为整齐的部分以便可以对其进行仔细检查的过程。
这种海量数据收集和分析主要在哪里使用? 在私营行业。 解决方案公司Attunity的营销传播总监Melissa Kolodziej表示,在零售行业,公司将采用并“将所有大量数据汇总”来分析客户的习惯,详细信息请参见“如果此人只是购买了洗发水,这样他们就可以在仍在商店的情况下通过移动电话向该客户提供相关优惠券”。 Kolodziej说,在分析这些大数据集时,公司希望并且能够拥有“近实时功能”,并希望尽快删除信息。
令人赞叹的技术细节
XKeyscore可能使用的特定技术没有实际可用的详细信息,除了它涉及全球700台Linux服务器。 但是有可能推测聚合和管理这些大数据集所需的硬件类型。 只有少数供应商制造出可以处理如此惊人的处理能力的机器类型:最容易想到的是Oracle,HP,IBM和EMC。
当然,使收集和分析大量数据成为可能的不仅仅是数据中心品牌。
“硬件(内存容量和速度,多核,多CPU)和软件(列数据库,群集文件系统等)的技术创新使'存储'几乎无限量的数据成为可能,” Byron Banks副总裁说。 SAP数据库与技术总裁。
并行处理,原始计算能力的提高以及相对较低的成本实现了巨大的存储容量,这一切都使得政府,企业甚至中型企业更容易进行此类数据挖掘。 Attunity营销副总裁Lawrence Schwartz表示,当今的数据仓库“通常是为支持TB级数据而构建的”。
如此之多的数据源交织在一起的事实,也有助于分析和收集大数据集,从而吸引了整个行业。 “我认为人们一直想弄清楚数据的用途。在过去的十年中,信息源太多了,现在互连的东西越来越多。我们几年前没有这么多…如此强大的计算能力,现在有了机会,”施瓦茨说。
持续的挑战和明显的争议
尽管技术在支持大数据和分析此类数据方面继续迅速发展,但挑战仍然存在。
Schwartz表示,实体收集的数据经常超出其处理能力。 也有“数据科学家的严重短缺”可用来理解这些收集的数据。
“许多现有解决方案和技术所面临的挑战是,他们无法理解和识别庞大的0和1池中存在哪些有用信息,然后无法及时且经济高效地对其进行分析和利用。在SAP,我们他们专注于创新,这些创新可以消除IT领域的复杂性,并提高速度和灵活性,从而将“数据”转化为有用的“信息”并交付给最终用户或应用程序。” SAP的银行说。
然后是安全问题。 CipherCloud高级副总裁Paige Leidig说:“由于大量的数据公司和消费者继续推动并存储在云中,因此公众应关注云存储我们的个人信息的公司的信息安全实践。” “ PRISM位于并监视跨特定云的信息流动,而XKeyscore会积极跟踪互联网上的任何特定人员,从所访问的网站到交换到社交媒体帖子的电子邮件。在这两种情况下,未经数据所有者同意,有人正在监视和编辑可识别个人身份的数据–即使动机是为了公众利益的国家安全,这也是隐私问题。”
不过,根据Leidig的说法,这些Internet监视程序(如果有的话)“凸显了我们在企业和消费者层面对云的依赖”。 关于保护数据安全或防止黑客或IT人员内部数据被盗,Leidig建议:“更好的方法是通过使用坚不可摧的加密技术来使云(以及企业需要和消费者喜欢的杀手级应用)成为可能。数据变得乱七八糟,未经授权的用户(无论是情报机构还是网络窃贼)都无法利用这些数据,作为一种额外的控制措施,应让企业(而非云提供商)拥有加密/解密密钥。
如果收到信息请求(我们已经听到很多关于NSA的来信),则将通知该企业,并且可以直接与政府合作,而不会被绕过,并且在黑暗中会未经授权就访问客户数据。 这是云提供商持有密钥,移交数据并被法律阻止向企业透露信息请求的模型。”
显然,现在在公众中进行的大讨论仅仅是因为该技术可以收集和分析海量数据,这是否授予政府和企业在公民和客户上使用该技术的许可? 这场辩论肯定会持续相当长的时间。
有关更多信息,请查看Xkeyscore不在关注您,它是NSA的拦截数据Google。