SCI投稿辅导 SCI发表咨询
期刊大全 杂志订阅 SCI期刊 SCI发表 期刊投稿 出版社 公文范文 精品范文
摘要:为满足深度学习推理中对不同规模矩阵乘法的计算需求,提出一种基于Zynq SoC平台的整数矩阵乘法加速器。采用基于总线广播的并行结构,充分利用片上数据的重用性并最小化中间累加结果的移动范围,以降低外部DRAM的访问需求。通过动态调整矩阵分块的大小,使加速器在计算形状不规则的矩阵乘时保持较高效率。实验结果表明,在DeepBench测试基准下,该加速器可对双核ARM Cortex-A9 CPU的矩阵乘运算实现8.4倍的加速效果。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
北大期刊 下单
国际刊号:1000-3428
国内刊号:31-1289/TP
国际刊号:1672-1675
国内刊号:53-1185/TU
国际刊号:1009-7813
国内刊号:45-1283/G4
国际刊号:1672-5158
国内刊号:11-5119/TP
国际刊号:1006-169X
国内刊号:36-1005/F
多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。
推荐期刊保障正刊,评职认可,企业资质合规可查。
诚信服务,签订协议,严格保密用户信息,提供正规票据。
如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。