新聞與活動
龍芯中科閃耀第二屆中國計(jì)算機(jī)學(xué)會芯片大會
近日,由CCF體系結(jié)構(gòu)專業(yè)委員會、集成電路設(shè)計(jì)專業(yè)委員會、容錯計(jì)算專業(yè)委員會、計(jì)算機(jī)工程與工藝專業(yè)委員會聯(lián)合舉辦的第二屆中國計(jì)算機(jī)學(xué)會芯片大會在上海成功舉辦。大會以“發(fā)展芯技術(shù),智算芯未來”為主題,共設(shè)立47場學(xué)術(shù)論壇,為CCF會員、計(jì)算機(jī)及芯片領(lǐng)域?qū)I(yè)人士提供思想交鋒、技術(shù)論道、交流會友的舞臺。
龍芯中科深度參與本次大會,不僅進(jìn)行黃金贊助支持,為大賽頒獎活動提供2K1000星云開發(fā)板、龍芯久久派開發(fā)板等獎品,更安排專家作論壇學(xué)術(shù)報告,設(shè)置展臺展示最新技術(shù)和產(chǎn)品等。
在通用CPU性能提升論壇上,龍芯實(shí)驗(yàn)室主任張福新以《高性能CPU微結(jié)構(gòu)研究》為主題發(fā)表演講。張福新表示,龍芯致力于下一代處理器技術(shù)的探索,堅(jiān)持開展前瞻研究,近年來,龍芯CPU核心性能提升超20倍,其中主頻提升僅2.5倍,微結(jié)構(gòu)優(yōu)化成為主要貢獻(xiàn)源。龍芯等企業(yè)的產(chǎn)品性能提升表明,高性能CPU微結(jié)構(gòu)仍有很大研究空間。同時,張福新分享了龍芯團(tuán)隊(duì)近期的一些研究成果,包括在分支預(yù)測方面的HRAS、AVM-BTB和數(shù)據(jù)預(yù)取方面的Tyche等。
HRAS:龍芯深入分析了CTRAS和SCRAS等返回地址預(yù)測機(jī)制的失效原因,提出了由猜測隊(duì)列、提交棧和后備預(yù)測器三級預(yù)測組成的HRAS混合預(yù)測機(jī)制。仿真結(jié)果顯示,相同面積下,HRAS的MPKI顯著低于CTRAS和簡單RAS。
AVM-BTB:龍芯觀察發(fā)現(xiàn),動態(tài)調(diào)整BTB大小的設(shè)計(jì)相對靜態(tài)可能更有益;一個BTB和ICache的動態(tài)容量平衡方案有提升前端效率的潛力;BTB的預(yù)測率度量反映程序的需求,能夠被用來指導(dǎo)BTB容量的動態(tài)調(diào)整。AVM-BTB利用上述觀察設(shè)計(jì)了可動態(tài)借用ICache緩存容量的切換策略,能夠大幅提升處理器性能并降低功耗。
Tyche:龍芯對程序行為和現(xiàn)有預(yù)取器進(jìn)行分析,發(fā)現(xiàn)僅通過訪存流而不依賴指令依賴關(guān)系無法高效檢測間接訪存模式;不知道生產(chǎn)者和消費(fèi)者之間全部操作則無法構(gòu)建完整的非線性關(guān)系;實(shí)現(xiàn)一個輕量級的機(jī)制,在硬件上記錄依賴鏈?zhǔn)强尚械?。Tyche預(yù)取器利用這些發(fā)現(xiàn)通過少量硬件即可實(shí)現(xiàn)對間接訪存的高效預(yù)取,進(jìn)而具有比現(xiàn)有算法更好的性能。
龍芯實(shí)驗(yàn)室主任張福新
芯片是信息產(chǎn)業(yè)的基礎(chǔ)、數(shù)字世界的底座,是國際競爭的最前沿。黨的二十屆三中全會明確提出,要“優(yōu)化重大科技創(chuàng)新組織機(jī)制,加強(qiáng)國家戰(zhàn)略科技力量建設(shè),統(tǒng)籌強(qiáng)化關(guān)鍵核心技術(shù)攻關(guān)”。作為中國CPU研發(fā)核心力量,龍芯以“十年磨一劍”的堅(jiān)定決心和頑強(qiáng)意志,持續(xù)推進(jìn)產(chǎn)品更新迭代,未來,龍芯也將繼續(xù)與合作伙伴共建安全可靠的第三套信息技術(shù)體系和產(chǎn)業(yè)生態(tài),以實(shí)際行動支撐國家信息安全和產(chǎn)業(yè)發(fā)展。
