・名古屋工業大学学術機関リポジトリは、名古屋工業大学内で生産された学術情報を電子的に収集・保存・発信するシステムです。 ・論文の著作権は、著者または出版社が保持しています。著作権法で定める権利制限規定を超える利用については、著作権者に許諾を得てください。 ・著者版フラグに「author」と記載された論文は、著者原稿となります。実際の出版社版とは、レイアウト、字句校正レベルの異同がある場合もあります。 ・Nagoya Institute of Technology Repository Sytem is built to collect, archive and offer electronically the academic information produced by Nagoya Institute of Technology. ・The copyright and related rights of the article are held by authors or publishers. The copyright owners' consents must be required to use it over the curtailment of copyrights. ・Textversion "Author " means the article is author's version. Author version may have some difference in layouts and wordings form publisher version.
先進的計算基盤システムシンポジウム論文集 : SACSIS : Symposium on Advanced Computing Systems and Infrastructures
巻
2010
号
5
ページ
149 - 156
発行年
2010-05-27
出版者
情報処理学会
ISSN
13440640
書誌レコードID(NCID)
AA1249642X
著者版フラグ
author
内容記述
我々は,計算再利用技術に基づく自動メモ化プロセッサ,および,これに値予測に基づく投機マルチスレッド実行を組合せた並列事前実行を提案している.従来の並列事前実行機構ではループの各イタレーションを再利用対象の命令区間として抽出していた.本稿では,実行バイナリに変更を加えることなく,複数イタレーションを動的にまとめて再利用対象区間とすることによって,再利用に要するオーバヘッドを削減し,同時に再利用表エントリの効率的な活用を実現する手法を提案する.また,いくつのイタレーションを再利用区間として統合すべきかは対象ループにより異なるため,動的に適切な数を検出するモデルを提案する.SPEC CPU95 FP を用いてシミュレーションにより評価した結果,従来モデルでは最大 40.5%,平均 15.0%であったサイクル数削減率が,最大 57.6%,平均 26.0%まで向上することを確認した.We have proposed an auto-memoization processor based on computation reuse, and merged it with speculative multithreading based on value prediction into a parallel early computation. In the past model, the parallel early computation detects each iterations of loops as reusable blocks. This paper proposes a new parallel early computation model, which integrates plural iterations into a reusable block automatically and dynamically without modifing executable binaries. We also proposes a model for automatically detecting how many iterations should be integrated into one reusable block. Our model reduces the overhead of computation reuse,and further exploits reuse tables. The result of the experiment with SPEC CPU95 FP suite benchmarks shows that proposing method improve the maximum speedup from 40.5% to 57.6%, and the average speedup from 15.0% to 26.0%.