单元测试验证逻辑正确性,基准测试衡量性能达标性;二者目标、手段、失败含义均不同,不可混用。TestXxx专注输入输出断言与边界覆盖,BenchmarkXxx仅测效率、需隔离副作用、禁用手动设b.N。
单元测试验证「逻辑是否正确」,基准测试回答「性能是否达标」——二者目标不同、手段不同、失败含义也完全不同。混用会导致测试失焦:比如在 TestFoo 里测耗时,或在 BenchmarkFoo 里断言返回值,都是越界操作。
TestXxx 函数只关心输入 → 输出是否符合预期,允许 t.Error/t.Fatal,必须覆盖边界值(如空输入、溢出、临界点)BenchmarkXxx 函数只关心执行效率,不检查结果对错;b.N 是框架自动调节的迭代次数,不能手动设固定值
BenchmarkXxx 中清除或隔离,否则基准结果不可复现当你开始怀疑某段代码在真实负载下会拖慢系统,或者想对比两种实现的吞吐差异时,才需要基准测试。单纯“能跑通”不构成写 Benchmark 的理由。
json.Marshal vs 自定义序列化、LRU 缓存不同淘汰策略、字符串拼接用 strings.Builder 还是 +
42,用 Test 就够了;加个 Benchmark 只是凑数go test -bench=. 默认不运行任何 TestXxx,需显式加 -run=^$ 避免干扰,否则初始化逻辑可能污染耗时统计比如一个解析器既要返回正确 AST,又要求单次解析 ≤ 10ms。这时不能把断言和计时塞进同一个函数,而应拆成两个独立测试。
TestParse:专注校验输出结构、错误类型、边界输入(空字节、超长嵌套、非法字符)BenchmarkParse:只喂入典型合法输入,调用前用 b.ResetTimer() 排除编译/初始化开销很多人以为 Benchmark 只是多跑几遍,其实 Go 的基准框架对环境敏感度远超预期。
b.N 不是并发数,而是单 goroutine 循环次数;想测并发性能,得用 b.RunParallel 或手动启 goroutine + sync.WaitGroup
b.ReportAllocs() 时,内存分配信息不会显示;但即使显示了,也要注意:小对象逃逸到堆上未必是 bug,Go 编译器优化可能动态决定go test -race -bench=.,否则竞态问题会被掩盖最常被轻视的一点:基准测试的输入数据必须稳定。用 rand.Intn 生成随机切片长度,或每次 benchmark 读取不同大小的文件,都会让结果失去可比性——性能测试不是压力测试,它要的是确定性度量。