在线刊号(2320-9801)印刷刊号(2320-9798)
数据云和计算云的数据挖掘
云计算是使用通过网络(通常是Internet)作为服务交付的计算资源(硬件和软件)。这个名字来自于使用云形状的符号作为系统图中包含的复杂基础设施的抽象。云计算将用户的数据、软件和计算委托给远程服务。存储云提供存储服务,计算云提供计算服务。我们描述了扇区存储云的设计,以及它如何提供Sphere计算云所需的存储服务。云可以是提供块或文件存储服务的存储云,也可以是提供计算服务的计算云。此外,本文还介绍了扇区存储云和球计算云的设计与实现。扇区是分布式文件系统,而sphere是并行的存储内数据处理框架,可用于处理存储在扇区中的数据。扇区和球面设计用于分析大型数据集,使用与广域高性能网络(例如10+ Gb/s)连接的计算机集群。我们描述了一个使用扇区和球面开发的分布式数据挖掘应用程序。 Mining association rules is one of the most important aspects in data mining. Association rules are dependency rules which predict occurrence of an item based on occurrences of other items. Sector is the distributed file system, while sphere is the parallel in-storage data processing framework that can be used to process data stored in sector.
Uzma Ali教授,Punam Khandar教授