所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

设计和实现片上置换网络的多处理器芯片系统

希E1,Dhana Selvi D2
  1. M。科技学生[DE], ECE称,CMRIT,原子能委员会布局,班加罗尔,印度卡纳塔克邦
  2. 教授,ECE称,CMRIT原子能委员会布局,班加罗尔,印度卡纳塔克邦
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

小说在硅验证的设计片上网络支持保证交通排列在多处理器SOC的应用程序。管线式电路交换受雇于该网络使用FIFO方法结合的多级网络拓扑动态path-setup方案。运行时通过动态路径安排path-setup方案任意交通排列以及误差修正块(ECB)。电路交换的方法提供了交换数据和紧凑的开销使叠加多个网络的系统芯片中受益。互补金属氧化物半导体测试芯片与0.13验证该设计的可行性和有效性。实验结果显示提出的片上网络达到1.9 x 8.2 x减少硅的开销相对于其他设计方法。

关键字

交通排列保证吞吐量、network-on-chip置换网络,管线式circuitswitching多级互连网络。

介绍

多处理器芯片系统(MP SoC)设计与片上互连网络是目前新兴的应用并行处理、科学计算、排列交通、交通模式的片上多处理应用程序表现出的每个输入发送交通一个输出,每个输出接收交通从一个输入,是重要的交通类之一。标准的交通发生在通用MP soc,例如,和快速傅里叶变换(FFT)计算,多项式,打乱排列排序原因,而置排列是在矩阵转置或corner-turn操作。最近,特定于应用程序的议员soc目标灵活涡轮/ LDPC译码的方法已被开发,他们表现出任意排列和并发流量由于多模和多标准功能。此外,许多议员SoC的应用程序(例如,涡轮/ LDPC译码)实时计算,因此,保证吞吐量(即。、数据无损,保证带宽,可预见的延迟和顺序交付)等排列交通量是至关重要的
关于拓扑,定期直接拓扑,如网格和环面,直观可行的在一个二维芯片与物理布局。相反,大型路由器基数和高布线不规则的间接拓扑如蝴蝶或贝奈斯对物理实现构成挑战。然而,吞吐量降低铅在任意排列模式以其密集的单个源目的对负载压力的常规拓扑。间接多级拓扑芯片上交通排列密集的应用程序的首选。

回顾文献

动态PA常见开关architecture-setup方案支持运行时路径安排当排列改变。每个路径设置,基于动态探测机制从输入开始找到一个路径导致其相应的输出。介绍了调查工作,调查(或设置掠过)动态发送路由算法为了建立一个路径下向目的地。精疲力竭的盈利回溯(EPB)使用网络中的路由调查工作。完整路径安排排列由16个路径设置,而路径安排部分排列可能由16个路径设置的一个子集。
图像
图像
关于切换技术,分组交换需要过量的芯片上的权力和区域队列缓冲区(fifo)与预计算队列深度交换节点和/或网络接口。关于路由算法,偏转路由不是节能由于偏离数据传输所需的额外的啤酒花,而最小的路由。此外,偏转使数据包延迟不规律;因此,很难保证数据的延迟和顺序交付。与传统的分组交换方式不同,我们的片上网络采用电路交换机制与动态path-setup方案多级网络拓扑。运行时的动态路径设置解决挑战无冲突交换数据的路径安排。预先配置的数据路径使吞吐量的保证。通过删除队列缓冲区的过度开销,一个紧凑的实现是实现和叠加多个网络支持并发排列在运行时可行的。

片上网络拓扑结构

秘密地网络,一个家庭的多级网络,应用于构建可伸缩商业多核心处理器与数千个节点在宏观系统。典型的三级秘密地网络被定义为C (n, p),其中n代表输入的数量在每个p开关和m是第一阶段第二阶段开关的数量。为了支持并行的16在大多数实际MP soc,我们提出用C(4、4、4)作为设计的网络拓扑结构。这个网络有一个重新排列能力属性,可以实现其输入和输出之间所有可能的排列。三个阶段的选择秘密地网络并且中等数量的中产阶段开关实现成本最小化,而它仍然可以重新排列属性的网络。管线式电路交换计划是专为使用该网络。这个方案有三个阶段:设置,转移和释放。一个动态路径设置方案支持运行时路径安排出现在安装阶段。为了支持这一电路交换计划,开关,开关与其握手信号提出了互连。握手的一些格式包括1位请求(请求)和一个2位的答案(Ans)。 Req = 1 is used when a switch requests an idle link leading to the corresponding downwstream switch in the setup phase. The Req = 1 is also kept during data transfer along the set up path. A Req = 0 denotes that the switch releases the occupied link. This code is used in both the setup and the release phases. An Ans = 01(Ack) means that the destination is ready to receive data from the source. When the Ans = 01 propagates back to the source, it denotes that the path is set up, then a data transfer can be started immediately. An Ans = 11(nAck) is reserved for end to end flow control when the receiving circuit is not ready to receive data due to being busy with other tasks, or overflow at the receiving buffer, etc. An Ans = 10 (Back) means that the link is blocked. This Back code is used for a back pressure flow control of the dynamic path setup scheme.

动态路径设置支持路径安排

动态路径设置方案提出设计支持运行时路径安排当排列改变。在每条路径的设置中,从输入开始找到一个路径导致其相应的输出,基于动态探测机制。探索的概念介绍,探针(或设置掠过)动态发送路由算法为了建立一个路径下向目的地。精疲力竭的盈利回溯(EPB)提出了网络中使用路由调查工作。完整路径安排排列由16个路径设置,而路径安排部分排列可能由16个路径设置的一个子集。一个问题是,可以提出EPB基于路径设置用于秘密地C(4、4、4)实现其输入和输出之间所有可能的全排列?橡皮在作品中,这三个阶段秘密地网络C (n, p)重新排列提出网络的能力如果m > n C (4、4、4) m = n = 4重新安排能力。总存在一个可用的路径从无所事事的输入导致一个输出。由环境保护局的详尽的财产啦工作,基于组件的路径设置完全搜索所有可能的路径的路径集合中的无所事事的输入和输出之间的多样性。直接应用的详尽的属性搜索到重新排列可以C(4、4、4)表明,基于组件的路径设置总是可以找到一个可用的路径内的四个可能的路径之间的输入和闲置的输出。 Based on this EPB based path-setup scheme, it is obvious that the path arrangement for full permutation can always be realized in the proposed network with C (4, 4, 4) topology.
图像
图3所示。开关的开关互连和路径多样性的能力。
作为这个网络设计,每个输入发送调查包含4位输出地址找到一个可用的路径导致目标输出。在搜索期间,探头向前移动时它会找到一个免费的链接和向后移动它将面临一个阻塞链接。在非重复性的运动,探测器之间找到一个可用的路径空闲输入和相应的闲置的输出。EBP建立路径设置方案设计的探针路由算法如前所述。下面的例子描述如何设置工作路径找到一个可用的路径通过的路径多样性。假设一个探测器从源(例如,一个输入开关01)正试图建立一个路径目标目的地(例如,一个可用的输出开关22)。首先,探测器将非重复性的尝试路径通过第二阶段的顺序开关10»11»12»13假设链接01-10可用,探测器第一次尝试这个链接要求= 1,然后到达开关10。如果链接10-22可用,探测器到达开关22和满足目标输出。如果Ans = Ack然后传播回输入触发转移阶段。如果链接10-22受阻,探测器将搬回开关01 (Ans =)和链接01-10释放要求= 0。 From switch 01, the probe can then try the rest of idle links leading to the second stage switches in the same manner. By means of moving back when facing blocked links and trying others, the probe can dynamically set up the path in runtime in a conflict avoidance manner.

仿真结果和讨论

图像
仲裁者的RTL模拟的示意图如上所示图4 R(4:0)显示了仲裁者的输入由控制信号输入电路。信贷和G(4:0)表明信贷信号和格兰特信号分别与这些控制信号有一些决定输入信号复位的仲裁者和时钟。
图像
仲裁者是如上所示的仿真波形图5 R(4:0)显示了仲裁者的输入由控制信号输入电路。信贷和G(4:0)表明信贷信号和格兰特信号分别与这些控制信号有一些决定输入信号复位和时钟的仲裁者next-p信号为下一个寄存器。
图像
横梁的内部电路的RTL示意图如上所示于图6由和盖茨的输入和盖茨从手工数据或从任何模块依次输出是决定由一个多路复用器。所示的电路的一个输入横梁。
图像
横梁的RTL模拟的示意图如上所示,在图7所示。完整的横梁是示意图所示的4 x4的输入和输出线和4选择线。
图像
Fig.8横梁的仿真结果
横梁的仿真波形图8中所示。4 x4的输入和输出线和4选择线。

结论

在网络芯片设计支持交通排列MPSoC应用程序。通过使用电路交换方式结合动态路径设置方案下秘密地网络拓扑,提出的设计提供了任意交通与紧凑排列在运行时实现开销。硅验证测试芯片验证该设计和显示可用性作为片上infrastructure-IP支持交通在未来的MPSoC研究排列

引用

  1. 博卡,”千核心芯片技术的角度来看,“在Proc。ACM和IEEE设计奥特曼。相依(DAC), 2007年,页746 - 749。
  2. 林志信。范教授,p .猫和c·金”64 - pe folded-torus intra-chip沟通面料以保证吞吐量在network-on-chip建立应用程序中,“在Proc。IEEE定制的中国。电路设计。(中金公司),2009年,页645 - 648。
  3. c . Neeb m . j . Thul和N。当,“Network-on-chip-centric交叉方法在高吞吐量通道解码器,“在Proc, IEEE Int。电脑。电路系统。(ISCAS), 2005年,页1766 - 1769。
  4. h·穆萨,a巴格达迪和m . Jezequel“二进制de Bruijn片上网络灵活的多处理器LDPC译码器,“在Proc。ACM和IEEE设计奥特曼。相依(DAC), 2008年,页429 - 434。
  5. h·穆萨o·穆勒,a巴格达迪和m . Jezequel“蝴蝶和Benes-based片上多处理器涡轮解码通信网络,“在Proc。设计中,奥特曼。测试欧元。(日期),2007年,页654 - 659。
  6. s . r . Vangal j .霍华德·g·鲁尔,s . Dighe h·威尔逊,j . Tschanz d·菲南a·辛格,t·雅各布,s . Jain诉Erraguntla c·罗伯茨y Hoskote, n .博卡和博卡,“80瓦子- 100 w浮点运算处理器在65 nm CMOS,“IEEE j .固态电路43卷,没有。1、29-41页。2008年1月。
  7. w . j .玩弄和b .陶尔康互连网络:的原则和实践。旧金山,CA:摩根考夫曼,2004。
  8. n .迈克尔·m·Nikolov g . e . Suh a . Tang和c·巴顿”分析感知应用程序片上路由流量下的不确定性”,在IEEE / Proc。ACM Int。电脑。Netw。芯片(国家石油公司),2011年,页9到16。
  9. 林志信。范教授,j .公园、p .猫和c·金”的设计和实现支持保证吞吐量network-on-chip backtrackingwave-pipeline开关,“IEEE反式。中国非常大。(VLSI)系统。,10.1109/TVLSI.2010.2096520.
  10. d . Ludovici f . Gilabert s Medardoni c·戈麦斯·m·e·戈麦斯·洛佩兹g . n . Gaydadjiev d .贝尔托齐,“评估fat-tree拓扑定期network-on-chip设计纳米技术约束下,“在Proc。设计中,奥特曼。测试欧元。相依,又美观。(日期),2009年,页562 - 565。
全球技术峰会