Hopper架构 GEMM教程

news/2025/2/22 5:07:49

一 使用

1.1 makefile

compile:
	nvcc -arch=sm_90a -lcuda -lcublas -std=c++17 matmul_h100_optimal.cu -o test

run:
	./test

加入-lcublas,不然会有函数无法被识别 

二 代码分析

2.1 kernel外参数分析

2.1.1 基本参数

    constexpr int BM = 64*2;
    constexpr int BN = 256;
    constexpr int BK = 64;
    constexpr int NUM_THREADS = 128*3;
    constexpr int QSIZE = 3;
    constexpr int CLUSTER_M = 2;
    constexpr int CLUSTER_N = 1;
    constexpr int NUM_SM = 128;
    static_assert(NUM_SM % (CLUSTER_M*CLUSTER_N) == 0);

2.1.2 SMem结构体

template <int BM, int BN, int BK, int QSIZE&

http://www.niftyadmin.cn/n/5861610.html

相关文章

React fiber架构中 优先级是如何确定的?

React fiber架构中 优先级是如何确定的? 在React Fiber架构中&#xff0c;优先级的确定是一个复杂而精细的过程&#xff0c;它涉及多种因素和策略。以下是对React Fiber中优先级确定方式的详细分析&#xff1a; 一、优先级类型与划分 React Fiber为不同的任务分配了不同的优…

使用(xshell+xftp)将前端项目部署到服务器

一.以vue项目为例 将项目打包生成dist文件 二.下载载安装xshell和xftp 下载地址&#xff1a;家庭/学校免费 - NetSarang Website 三.连接服务器 在xshell新建会话&#xff08;需要用到服务器、用户名、密码、端口号&#xff09;正确输入后连接到服务器 使用命令连接&#x…

angular中使用animation.css实现翻转展示卡片正反两面效果

html <div(click)"flip()"class"animate__animated cursor--pointer"[ngClass]"{ animate__flipInX: isFlipped }" ><div *ngIf"!isFlipped">正面</div><div *ngIf"isFlipped">背面</div> …

店铺矩阵崩塌前夜:跨境多账号运营的3个生死线

多账号运营的3条生死线&#xff0c;跨境卫士助你避开矩阵崩塌危机&#xff01; 在跨境电商行业&#xff0c;多账号运营是许多卖家扩大规模、分散风险的常用策略。然而&#xff0c;随着平台风控的日益严格&#xff0c;多账号运营的风险也在不断加剧。近期&#xff0c;某知名卖家…

Apifox 增强 AI 接口调试功能:自动合并 SSE 响应、展示DeepSeek思考过程

在API调试的世界里&#xff0c;效率和准确性往往决定了开发者的成败。你是否曾为处理SSE&#xff08;Server-Sent Events&#xff09;响应而烦恼&#xff1f;又是否期待在调试时能直观看到AI的“思考过程”&#xff1f;Apifox这次全新升级&#xff0c;将AI接口调试功能推向新高…

人工智能丨OCR 的业务场景,实现原理和测试指标

OCR 的业务场景 OCR&#xff08;光学字符识别&#xff09;技术广泛应用于多个领域&#xff0c;主要业务场景包括&#xff1a; 金融行业&#xff1a; 票据识别&#xff1a;自动识别发票、支票、收据等。身份验证&#xff1a;识别身份证、护照、驾驶证等证件信息。 医疗行业&am…

从硬件工程师视角解析宇树机器人:四足机器人的核心设计与技术挑战

——以Unitree Go1为例&#xff0c;探索四足机器人硬件设计的奥秘 近年来&#xff0c;四足机器人凭借其灵活的运动能力和广泛的场景适应性&#xff0c;成为机器人领域的热门方向。国内企业宇树科技&#xff08;Unitree Robotics&#xff09;凭借Unitree Go1、B1等产品迅速崛起…

C++笔记之标准库中的std::copy 和 std::assign 作用于 std::vector

C++笔记之标准库中的std::copy 和 std::assign 作用于 std::vector code review! 文章目录 C++笔记之标准库中的std::copy 和 std::assign 作用于 std::vector1. `std::copy`1.1.用法1.2.示例2.`std::vector::assign`2.1.用法2.2.示例3.区别总结4.支持assign的容器和不支持ass…