优化 QEMU RISC-V Vector stride LD/ST 指令,让相关指令的仿真性能提升 25 倍

这两天逛邮件列表,发现有一个 QEMU TCG RVV 指令的性能优化补丁( Re: PATCH 1/1 v2 RISC V/RVV Generate strided vector loads/stores with tcg nodes. Paolo Savini 1 ) 被 revert 了,原因是存在正确性问题。 昨晚来了兴致,于是我把这个补丁给修好了,

2025-08-19 · 4 min · zevorn

浅析 QEMU 的调试利器 tracing 工具

本文首发于微信公众号 GTOC 。 本文参考 QEMU 的 tracing 文档,相对路径为:docs/devel/tracing.rst QEMU 有一个很好用的调试工具 tracing,可以用来跟踪 QEMU 内部函数的执行情况,以及性能调优。 比如追踪客户机程序的访存情况,可以将 QEMU 的 memory region 的读写记录打印出来,只要注册了

2025-07-02 · 5 min · zevorn

Intel® VTune™ Profiler 分析 C++ 程序的常见性能瓶颈( Windows 平台)

用例和先决条件 本篇文章将展示,在 Windows 平台如何通过 Intel® VTune™ Profiler (下文简称 VTune)来识别和分析串行/并行应用程序中的性能瓶颈。使用 VTune 自带的 matrix 示例矩阵乘法应用程序作为分析和优化对象(备注:由于采用 Github 作为文章图床,部分图片加载速度稍慢)。 本文章要求安装多个英特尔软件工

2024-06-01 · 11 min · zevorn