所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

基于模糊逻辑在分布式数据库查询优化

Abhijeet R Raipurkar1,G.R.Bamnote2
  1. 卷最后一年计算机科学与工程学系PRMIT&R Badnera、印度1
  2. 头和教授,计算机科学与工程学系PRMIT&R Badnera、印度2
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

结构化查询语言(SQL)在数据提取是非常严格的。古典SQL查询具有非凡的能力方面的数据提取和回答形成从信息存储在分散的数据库。人类很少脆查询有效的回答形成和数据检索提出了挑战。这些都是基于人类知觉严重不准确和不精确的基于知识的世界。查询语言与模糊逻辑相结合,可以提高他们的能力基于人类感知的数据检索。查询优化是一个困难的任务在一个分布式客户机/服务器环境数据位置成为一个主要因素。查询处理子系统的整合成一个分布式数据库管理系统与模糊逻辑是用来分析查询响应时间在破碎的全球关系。基于模糊逻辑的在分布式数据库查询优化的一个重要影响分布式查询处理的性能。

关键字

模糊逻辑、查询优化、碎片

我的介绍。

分布式数据库增加了传统的集中式数据库系统[3]一些其他类型的处理费用,因为额外的设计(硬件和软件)来处理分布。这些费用现在通过网络作为数据传输的成本。传输数据,造成中间文件本地网站,或最终结果需要送回原来的网站,发布查询。因此,数据库设计者关心的是查询优化目标最小化通过网络传输数据的成本。
测量标准查询计算的成本集中战略dbms的磁盘访问次数(#块读/写)和分布式数据库,此外通过网络数据传输的成本和潜在收益的性能从几个地点处理的部分并行查询。
在分布式数据库连接查询[4]船整体,根据需要获取,半连接[4]和布鲁姆连接和每一个连接策略有自己的优点和缺点。在分布式数据库查询处理的主要因素有:通信成本,如果有几份关系,决定使用哪个副本,发送的数据量,相对处理速度在每个站点和站点的选择
在分布式数据库连接查询[4]船整体,根据需要获取,半连接[4]和布鲁姆连接和每一个连接策略有自己的优点和缺点。在分布式数据库查询处理的主要因素有:通信成本,如果有几份关系,决定使用哪个副本,发送的数据量,相对处理速度在每个站点和站点的选择
查询优化是一个过程,生产最优(接近最优)查询执行计划代表一个查询的执行策略。查询优化的主要任务是考虑不同序与执行相关的操作和最小化总成本要求。查询优化是一个重要和困难的部分整体查询处理
二世。相关工作
在关系数据库中所有的信息都可以发现在一系列的表。因此由查询操作表。最常见的查询是Select-Project-Join查询。
对于一个给定的查询,搜索空间可以被定义为一组等价算子树,可以用转换规则的。分布式查询优化过程由改变全球从控制网站查询片段在当地网站查询。转换的过程如下所示:
输入一个查询在分布式数据表达关系演算。涉及四个主要层分布式查询映射到一个优化的本地操作序列,每一个作用于本地数据库。这些层执行查询的功能分解,数据本地化、全局查询优化,和当地的查询优化。查询分解和数据本地化对应查询重写。前三层是由一个中心站点和使用全局信息。局部优化是通过当地的网站。
订购的运营商关系代数是高效查询处理的关键所以昂贵的运营商应该在查询处理。各种一元、二元操作可以推到树的叶子按与之关联的时间复杂度。
以下是一元多项式和二元操作符中使用的各种查询优化过程随着时间的复杂性。在时间复杂度„n ?代表基数的关系。
的一般体系结构分布式安全数据库服务,如图2中所示,由一个受信任的客户端以及两个或两个以上的服务器提供数据库服务。客户端将执行查询各种碎片和算法会发现最好的查询处理时间最小化。客户端也可以执行模糊查询的片段是由分区算法。模糊数据库中可以由模糊查询转换成正常的SQL查询。
在拟议的系统中,数据库分区分为三个分区dbfpartition1 dbfpartition2 dbfpartition3。在数据库设计中,dbfpartition1包含两个垂直分散关系tupule Id (tid)的基础上,通过应用简单的加入可以恢复原来的全球关系的算法。Dbfpartition2包括三个垂直支离破碎的关系的基础上tupule id和dbfpartition3由原来的全球关系。
在提出的查询处理和查询优化过程中,查询响应时间比较反对这两个垂直分散关系与全球关系和碎片最小响应时间为只读和更新应用程序选择为开发分布式数据库应用程序。
一个。模糊性在数据库
数据库是相关数据的有序集合元素旨在满足一个组织的信息需求和设计成由多个用户共享。如果常规的或经典的数据库是一个结构化的记录或数据存储在一个计算机的集合,模糊数据库是一个数据库,可以使用模糊逻辑处理不确定或不完整的信息。基本上,模糊数据库是一个数据库模糊属性,可以定义为一个项目的属性,行,或对象在数据库中,它允许存储模糊信息。
下面是一个简短的定义不完全数据的特点:
吗?不确定数据的不确定性的程度有关真理的属性值,这意味着我们可以分配一些,但不是全部,我们的信念的给定值或一组值。
吗?模糊数据,缺乏明确的或锋利的区别。不精确的数据不精确和模糊属性值的相关内容,这意味着必须做出一个选择从一个给定的范围(时间间隔或一组)的价值观,但我们不知道选择哪一个。
吗?不适用的数据,可能会有一些实体的数据无法获得有关它的一个属性由于缺乏该财产。
在实时的情况下,人们使用自然语言表达自己的想法。通常自然语言有很多模糊和歧义。然而,尽管应用吗?年代的思想作为查询的自然语言到数据库中,很多问题都经历过由于RDBMS处理此类查询的效率低下。
考虑查询“给员工的名字有最高和最低工资”。
这个查询SQL不能直接处理,因为它包含大量的模糊性最高和最低工资。造型的最佳补救上述情况是通过模糊集的使用。

四、系统实现

该方案实现使用Microsoft Visual Studio 2010和Microsoft SQL server 2010。工作计划,
1。为数据库创建一个不同的分区(这三个数据库创建不同的模式)。
2。应用负载即对所有数据库的查询和估计成本的每个查询的响应时间。
3所示。查询应用于分区的数量是不同的从1到100。
4所示。不同类型的查询操作,如插入、更新、删除、获取和模糊值搜索应用基于所有的分区
5。模糊范围定义中定义的工资由于所有的分区
6。如果用户获取特定的模糊的记录范围查询分为模糊range1, 2或3的用户输入。
7所示。然后比较成本的基础上进行查询,即查询的响应时间
为模糊查询,我们模拟了薪水属性的分区,partion3是最佳人选,因为它导致响应时间。模糊范围定义的最小和最大的工资将由用户进入主窗口的显示项目和工资分配适当的模糊范围中定义的系统。比较模拟正常的查询和模糊查询所有分区上表明,模糊查询总是会减少响应时间比正常的SQL查询。最小响应时间的原因是,查询计算引擎不必搜索数据库中的所有记录;它必须在模糊搜索记录范围值。因此最在分布式数据库查询优化的模糊查询。

诉的结论

我们提出的方法在分布式数据库中加入模糊适应模糊查询是基于人类知识的近似。提出了模糊查询关系数据库作为一个候选模型和模糊关系数据库作为另一个关系模型。的帮助下员工分布式数据库的例子,我们已经成功地实现了基于模糊逻辑的查询使用点净GUI环境和SQL server数据库。这个建立的可行性提出的概念。
分布式数据库系统提供一个改进的通信和数据处理由于其数据分布在不同的网站。不仅是数据访问速度更快,但单点失败的不太可能发生,它为用户提供了局部控制的数据。然而,有一些复杂,当试图管理和控制分布式数据库系统。分布式数据库允许更快的本地查询和可以减少网络流量。这些好处是维护数据完整性的问题。
提出了查询处理的工作处理数据分布的两个重要问题即减少查询响应时间通过分区和处理模糊性数据库模糊查询翻译成SQL。

表乍一看

表的图标
表1

数据乍一看

图1 图2 图3
图1 图2 图3

引用




















全球技术峰会