目录:
利用公司积累的所有数据,找到一个有效的云存储存储库不仅要保存和管理所有信息,还要启用搜索和安全功能,这是一个艰巨的任务。 幸运的是,提供IBM Cloud for Infrastructure-a-service(IaaS)和Platform-as-a-Service(PaaS)方案的IBM等云平台供应商正在积极研究在多云架构中管理数据的新方法。
什么是多云架构?
多云架构由存储在单个架构内的多个云环境中的数据和代码组成。 只需想象一个应用程序跨多个云使用代码和资源,例如Amazon Web Services(AWS),IBM Cloud和Microsoft Azure。 通过使用仍在发展的互操作性标准,多云架构将软件服务的互操作性带到了那些服务用作平台的云上。 这使您可以定制您的云资源,以便它们更具体地针对您的工作负载。
中小型企业(SMB)应该考虑一个提供商,该提供商可以帮助管理多个云服务的基础架构,并确保它们在单个控制台中的安全性和组织性。 更好的是可以将第三方云服务(例如Microsoft Office 365)与您在另一云中自己的虚拟服务器上运行的资源结合在一起的服务。 公共云可能适用于一个应用程序,私有云可能适用于另一个应用程序。 中小型企业将受益于多云架构提供的成本效益和敏捷性。
多云和IBM
从多云的角度来看,对于IBM来说是繁忙的一年。 今年5月,IBM推出了IBM Cloud Private for Data,使公司能够从跨数据工程,数据科学和开发以及其应用程序和数据库等学科的数据中提取隐藏的见解。 然后,在9月10日,该公司宣布IBM Cloud Private for Data将与Red Hat OpenShift,开源容器和Kubernetes应用程序平台集成。 Kubernetes是一个开放源代码平台,用于跨服务器集群运行容器。 与Red Hat的这种集成为运行云原生工作负载的公司提供了更多选择,从而使它们可以在本地,公共和私有云以及开源Red Hat OpenShift环境中运行。 IBM还将扩大与大数据软件先驱Hortonworks的合作伙伴关系,以将Hortonworks DataPlane中的服务与IBM Cloud Private for Data集成。
最终,在9月13日,IBM还宣布,它将允许用户使用名为Queryplex的工具在整个企业中查询分析数据,该工具是用于跨云搜索的单个控制台。 当天,IBM在ESPN的汉娜·斯托姆(Hannah Storm)主持下在纽约市5号航站楼举行了一次活动,以聚焦正在接受人工智能(AI)挑战的客户。 活动开始前不久,PCMag赶上了IBM Analytics总经理Rob Thomas,了解了新的云搜索功能的工作原理,IBM与Red Hat的合作以及AI方面的一些成功策略。
Rob Thomas(RT):可以将其作为客户端如何在任何云中任何地方管理数据的控制台。 如果客户端正在使用它,则他们可以在私有云容器架构中查看其内部拥有的所有数据,或者可以看到在AWS,Microsoft Azure,Google Cloud Platform或IBM Cloud上拥有的数据。 它是一个用于了解所有数据的控制台,它可以对数据进行分类和组织。
PCM:什么是Queryplex?SMB如何使用类似的东西跨云搜索?
RT: Queryplex使您能够真正编写结构化查询语言(SQL)查询并在世界任何地方查找数据并进行分析。 借助这种广角SQL功能,您不必移动数据。 我们将在任何位置找到数据并启用它。 我们可以在边缘使用处理能力,然后将分析结果提供回一个地方。 因此,这些是同一枚硬币的两个面。 一个是用于管理所有数据的控制台。 第二部分是关于如何实际地对任何地方的数据进行分析,而不必像第一步那样移动数据,因为移动数据的成本很高。 这很费时间。 因此,我们基本上消除了超级强大的数据移动需求。
PCM:使用此类查询功能的公司的日常示例是什么?
RT:一个很好的公司是一家汽车公司,从事远程信息处理以对汽车或汽车的性能进行预测性维护。 今天,方法将是连接到汽车,然后将数据带回到中心位置。 它为您提供实时功能。 因此,30天之前的时间现在是30秒。 这就是这样做的力量; 它只是完全改变了分析的性质和过程。
PCM:跨多个云进行搜索对安全性有何影响? 您如何选择允许这种类型的搜索?
RT:我们将Queryplex设计为企业产品,它将利用组织围绕轻型目录访问协议(LDAP)安全性和身份管理协议或数据治理策略建立的一切优势。 让我举个例子:如果您的公司政策是,只要您不想进行任何涉及个人身份信息(PII)的联合查询,那么我们就可以屏蔽该数据作为该功能的一部分,这样就不会它的一部分。 我们确实将其设计为集成到公司的安全体系结构中。
PCM:公司需要做什么才能允许访问不同的云?
RT:当您使用IBM Cloud Private for Data时,安装很快。 就连接到不同的云而言,它只是知道IP地址。 那很简单; 你可以做到的。 因此,连接性并不难。 我认为对公司而言更难的是,随着您向AI或数据科学类型的用例迈进,您需要为此建立模型。 您需要训练该模型,我们能够帮助您整理数据来做到这一点。
PCM:公司实施AI或机器学习(ML)的几个关键策略是什么?
RT:一些不同的事情。 我看到一些客户建立了数据科学卓越中心(COE)。 我认为这可能是一个使组织充满活力并推动事情发展的好方法。 我认为这是一种好方法。
我们看到其他客户聘请了首席数据官(CDO),并赋予该人员以这个方向推动公司发展的使命。 我认为也很好。
第三,我看到很多公司都依赖于此来从业务线中来,这意味着业务线可以找到用例,然后用于技术创新。 我认为这些方法都可以。
我认为最大的差距也是我鼓励客户要做的就是制定数据策略。 数据策略的一部分就是了解您现在的位置。 意思是,您真的是在做商业智能(BI)和数据仓库,还是在做自助服务分析? 了解您的位置,然后了解终点。 如果您清楚地了解了这两点,则可以通过数据科学COE,CDO或业务线启动实验,知道您将从中获得一定程度的可重复性,这一点很重要。
PCM:是什么促使IBM与Red Hat合作的?
RT:如果回到2000年,IBM就是Linux的巨大支持者。 我认为如果没有IBM的支持,Linux可能不会像今天这样。 因此,我们一直与Red Hat围绕创新以及我们如何支持生态系统进行持续对话。 我们一直在关注Red Hat使用OpenShift所做的事情。
我们是容器的忠实拥护者,Kubernetes可以帮助客户使应用程序和数据状态现代化。 如果您看一下具有OpenShift的Red Hat,他们建立了一个专注于现代化的出色容器平台。 但是他们没有任何数据可用,如果不同时更新数据就很难更新应用程序。
我们可以利用IBM Cloud Private for Data现代化数据服务的地方就是在OpenShift上本机运行,因此那些正在进行应用程序现代化之旅的客户端可以对数据做同样的事情,而他们可以将该项目变成AI的成果。
Hadoop尚未迁移到微服务架构,这是另一个难题。 与Hortonworks合作,帮助现代化和创建Hadoop的微服务,可以与IBM Cloud Private for Data和OpenShift一起使用。
PCM:公司如何使用这种类型的微服务架构?
RT:我认为这一切都可以归结为AI和数据科学。 无论您对数据做什么,通常都是围绕业务成果进行的。 您正在寻找使用分析方法方面的优势。
因此,如果您在Hadoop中拥有大量数据,并且您无法将其用于预测分析,机器学习或数据科学,那么这对于组织而言就不是很有价值。 这就是我连接点的方式。 Hadoop是微服务; 它更容易组合,更灵活。 使用数据更容易,并且可以将其提供给大型数据科学团队使用。 这使您能够从Hadoop实施中获得更多价值。
PCM:您认为AI和ML未来的发展趋势如何?
RT:我们将慢慢进入主流。 一年前的讨论是,“我能做点什么吗?” 我想说这是增加实验的一年。 我认为明年我们将进入大规模实验,希望到明年年底,我们将处于主流。 人们正在使用AI和模型来自动化许多基本业务流程,以自动化许多决策。 因此,我们显然在旅途中。 您可以看到进度。 我想,如果您愿意,我们已经接近临界点,但我们还没有到达终点。