欢迎来到优发表网

400-808-1721 购物车(0)

首页 > 期刊 > 计算机科学与探索 > 申威众核处理器上的三对角并行求解器 【正文】

申威众核处理器上的三对角并行求解器

作者:刘侃; 王欣亮; 许平; 薛巍 清华大学计算机科学与技术系; 北京100086; 国家超级计算无锡中心; 江苏无锡214100

摘要:三对角方程求解器是一种在很多科学与工程领域广泛应用的数值计算核心。目前,CPU、GPU等主流硬件平台上都提出了高度优化的并行算法,但是对于中国自主研发的申威26010众核处理器,还没有一种算法能有效地利用其独特的硬件特性来达到最大化的性能。提出了一种分布式CR算法swDCR,来求解大量的、规模不大的三对角方程。该算法对每个三对角方程使用多个从核并行求解,通过联合多个从核的缓存使得运算过程中所有中间变量都能存储在缓存中,同时利用寄存器通信完成核间数据的高速传输。通过设计线程级数据划分机制,使得向量化的优化效果最大化。swDCR的吞吐率相比主核上的追赶法达到了单精度43.9倍和双精度36.7倍的加速,相比从核上的追赶法达到了单精度和双精度均2.07倍的加速。该算法在申威26010处理器单个核组上可以获得24GB/s的有效带宽。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社。

计算机科学与探索杂志

计算机科学与探索杂志, 月刊,本刊重视学术导向,坚持科学性、学术性、先进性、创新性,刊载内容涉及的栏目:综述探索、简讯、学术研究、专题报导、专题报导。等。于2007年经新闻总署批准的正规刊物。

  • 北大期刊
  • CSCD期刊
  • 统计源期刊
  • 1-3个月审核

服务介绍LITERATURE

正规发表流程 全程指导

多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。

保障正刊 双刊号

推荐期刊保障正刊,评职认可,企业资质合规可查。

用户信息严格保密

诚信服务,签订协议,严格保密用户信息,提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。