限流不能仅用 time.Sleep,因其阻塞 goroutine 导致雪崩;应让超限请求立即失败或排队。推荐使用 golang.org/x/time/rate 包,它基于令牌桶、无锁高效,支持突发流量控制。

限流 为什么 不能只靠 time.Sleep
直接在 HTTP handler 里用 time.Sleep 拖慢响应,看似“限了速”,实则阻塞 goroutine,浪费调度资源。当 并发请求 突增时,大量 goroutine 挂起,内存和上下文切换开销飙升,服务反而更容易雪崩。
真正可控的限流,得让超出速率的请求 ** 立刻失败或排队 **,而不是无差别拖住所有处理流程。
用 time.Ticker 实现固定窗口计数器(简单但有边界问题)
适合低精度、开发环境 快速验证。核心是维护一个计数器 + 重置时间戳,每次请求检查是否在当前窗口内、是否超限。
func NewFixedWindowLimiter(max int, window time.Duration) http.Handler {var mu sync.RWMutex var count int var lastReset time.Time return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {mu.Lock() now := time.Now() if now.After(lastReset.Add(window)) {count = 0 lastReset = now} if count >= max {mu.Unlock() http.Error(w, "rate limit exceeded", http.StatusTooManyRequests) return } count++ mu.Unlock() // 继续处理请求 next.ServeHTTP(w, r) }) }
- 窗口边界不平滑:比如窗口是 1 分钟,但用户在 59 秒和 1 秒连续发起请求,可能被算作两次窗口内的合法请求
- 没考虑并发安全细节?
count和lastReset必须用sync.RWMutex保护,否则竞态导致漏放行或误拦截 - 不适合高 QPS 场景:每请求都加锁,锁争用会成为瓶颈
用 time.Now().Sub() + 滑动窗口日志(精确但内存敏感)
记录每个请求的时间戳,每次请求时剔除窗口外的旧记录,再判断剩余数量。精度高,但需注意日志膨胀。
type SlidingWindowLimiter struct {mu sync.RWMutex logs []time.Time max int window time.Duration } func (l *SlidingWindowLimiter) Allow() bool { now := time.Now() l.mu.Lock() defer l.mu.Unlock() // 剔除过期时间戳 cutoff := now.Add(-l.window) i := 0 for _, t := range l.logs {if t.After(cutoff) {l.logs[i] = t i++ } } l.logs = l.logs[:i] if len(l.logs) >= l.max {return false} l.logs = append(l.logs, now) return true }
- 内存增长不可控:如果
max是 1000,但实际每秒 500 请求,logs切片可能长期维持在几百个元素,没问题;但如果突发 10 万请求,瞬间分配并保留 10 万个time.Time,GC 压力明显 - 没做预分配?建议初始化时用
make([]time.Time, 0, l.max*2)减少扩容次数 - 纯内存方案,进程重启即清空——生产环境需搭配 Redis 等外部存储才可靠
推荐组合:golang.org/x/time/rate + 中间件封装
标准库 扩展包 rate.Limiter 底层用原子操作 + time.Now() 计算令牌生成,无锁、低开销、支持预热和突发流量控制,是生产首选。
立即学习“go 语言免费学习笔记(深入)”;
import "golang.org/x/time/rate" var limiter = rate.NewLimiter(rate.Limit(100), 10) // 100 QPS,初始 10 令牌 func RateLimitMiddleware(next http.Handler) http.Handler {return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {if !limiter.Allow() {http.Error(w, "too many requests", http.StatusTooManyRequests) return } next.ServeHTTP(w, r) }) }
-
rate.Limit(100)表示每秒补充 100 令牌,不是“最多 100 并发”——它允许短时突发(取决于桶容量),更贴合真实流量特征 - 别漏掉错误处理:若使用
WaitN(ctx, n),必须检查 ctx 是否超时或取消,否则可能永久阻塞 - 每个 路由/ 用户需要独立限流?那就不能共用一个
limiter实例,得按 key(如 IP 或 user ID)做 map 缓存,并配 TTL 清理,否则内存泄漏
真正难的从来不是“怎么写限流代码”,而是决定每个接口该用哪种策略、多少阈值、是否区分用户等级、失败后要不要降级返回缓存——这些得看监控数据,而不是凭空拍参数。






























