LFU Cache完整实现：比LRU更公平的缓存淘汰策略

老张2026/4/30大约 9 分钟

LFU Cache完整实现：比LRU更公平的缓存淘汰策略

适读人群：对缓存算法感兴趣的Java开发 | 阅读时长：约17分钟 | 文章类型：算法设计+完整实现

开篇故事

有次做一个视频平台的推荐缓存，负责这块的小黄说：我用LRU实现了缓存，命中率只有65%。

我说：什么业务场景？

他说：缓存用户的个性化推荐列表，每个用户对应一个缓存条目。有些用户每天活跃，每天都来好几次；有些用户一个月才来一次。

我说：LRU在这个场景不合适。LRU只看"最近一次"访问时间，一个月前的高频用户回来一次，他的推荐就被缓存了，然后可能把一个每天都来的普通用户的缓存挤出去。

他：那用什么？

我说：LFU。Least Frequently Used，淘汰访问频率最低的。高频用户的缓存有很高的频次计数，不容易被淘汰；偶尔来一次的用户，频次低，更容易被淘汰。

他：LFU怎么实现？我以为比LRU难多了。

我说：确实比LRU复杂，但有个O(1)的实现方案。今天我把这个方案从头写一遍，你看完保证能手写出来。

一、LFU vs LRU 的核心区别

策略	淘汰依据	适合场景
LRU	最近最少使用（最久没被访问）	时间局部性强的场景（近期访问的更可能再访问）
LFU	最不频繁使用（访问次数最少）	频率局部性强的场景（高频访问的更可能继续被访问）

LRU的问题：缓存污染。一个临时高频但之后不再访问的热点（比如某条病毒新闻）会占据大量缓存位置，把真正的常用数据挤出去。

LFU的问题：老化（Aging）。早期高频、后来低频的数据会积累很高的频次，很难被淘汰（即使它已经"过时"了）。生产环境通常用LFU+TTL（超时淘汰）组合解决这个问题。

二、O(1)的LFU实现原理

关键数据结构：

keyMap：Map<K, Node>，O(1)根据key找到节点
freqMap：Map<Integer, DoublyLinkedList>，每个频率对应一个双向链表
minFreq：当前最小频率（淘汰时直接删freqMap[minFreq]链表的尾部节点）

关键操作：

get(key)：找到节点，频次+1，从当前频率链表移到频率+1链表
put(key, val)：新节点频次=1，加入freqMap[1]的头部；如果超容量，删freqMap[minFreq]的尾节点

三、完整Java实现

package com.laozhang.cache;

import java.util.*;

/**
 * LFU Cache O(1)完整实现
 *
 * 时间复杂度：get O(1)，put O(1)
 * 空间复杂度：O(capacity)
 *
 * 实现关键：
 * 1. keyMap：快速找到节点
 * 2. freqMap：每个频率对应一个双向链表，链表内按访问时间排序（最近在头部）
 * 3. minFreq：记录当前最小频率，淘汰时直接O(1)找到候选节点
 */
public class LFUCache<K, V> {

    private final int capacity;
    private int minFreq;  // 当前最小频率
    private final Map<K, Node<K, V>> keyMap;         // key -> 节点
    private final Map<Integer, DoublyLinkedList<K, V>> freqMap; // 频率 -> 双向链表

    // 节点：存储key、value、频次
    private static class Node<K, V> {
        K key;
        V value;
        int freq;
        Node<K, V> prev, next;

        Node(K key, V value) {
            this.key = key;
            this.value = value;
            this.freq = 1; // 新节点初始频次为1
        }
    }

    // 双向链表（带哨兵节点）：最近访问的在头部，最久未访问的在尾部
    // 同一频率内，按"最近访问时间"排序，用于LFU tie-breaking（相同频次淘汰最久未访问的）
    private static class DoublyLinkedList<K, V> {
        final Node<K, V> dummyHead = new Node<>(null, null); // 哨兵头
        final Node<K, V> dummyTail = new Node<>(null, null); // 哨兵尾
        int size;

        DoublyLinkedList() {
            dummyHead.next = dummyTail;
            dummyTail.prev = dummyHead;
        }

        // 在头部插入节点（最近访问）
        void addFirst(Node<K, V> node) {
            node.next = dummyHead.next;
            node.prev = dummyHead;
            dummyHead.next.prev = node;
            dummyHead.next = node;
            size++;
        }

        // 删除节点
        void remove(Node<K, V> node) {
            node.prev.next = node.next;
            node.next.prev = node.prev;
            size--;
        }

        // 删除并返回尾部节点（最久未访问的）
        Node<K, V> removeLast() {
            if (dummyTail.prev == dummyHead) return null; // 链表为空
            Node<K, V> last = dummyTail.prev;
            remove(last);
            return last;
        }

        boolean isEmpty() { return size == 0; }
    }

    public LFUCache(int capacity) {
        this.capacity = capacity;
        this.keyMap = new HashMap<>(capacity * 2);
        this.freqMap = new HashMap<>();
    }

    /**
     * 获取缓存值：O(1)
     * 1. keyMap找到节点
     * 2. 频次+1，移动到freqMap[freq+1]链表头部
     * 3. 更新minFreq
     */
    public V get(K key) {
        Node<K, V> node = keyMap.get(key);
        if (node == null) return null;
        incrementFreq(node);
        return node.value;
    }

    /**
     * 写入缓存：O(1)
     * 1. key已存在：更新value，频次+1
     * 2. key不存在：
     *    a. 如果满了：淘汰freqMap[minFreq]链表的尾部节点
     *    b. 新节点加入freqMap[1]链表头部，minFreq重置为1
     */
    public void put(K key, V value) {
        if (capacity <= 0) return;

        if (keyMap.containsKey(key)) {
            // 已存在：更新value，增加频次
            Node<K, V> node = keyMap.get(key);
            node.value = value;
            incrementFreq(node);
            return;
        }

        // 不存在且满了：淘汰最小频率的最久未访问节点
        if (keyMap.size() >= capacity) {
            DoublyLinkedList<K, V> minFreqList = freqMap.get(minFreq);
            Node<K, V> evicted = minFreqList.removeLast(); // 淘汰尾部
            if (evicted != null) {
                keyMap.remove(evicted.key);
            }
            if (minFreqList.isEmpty()) freqMap.remove(minFreq);
        }

        // 新节点：频次=1，加入freqMap[1]链表
        Node<K, V> newNode = new Node<>(key, value);
        keyMap.put(key, newNode);
        freqMap.computeIfAbsent(1, k -> new DoublyLinkedList<>()).addFirst(newNode);
        minFreq = 1; // 新节点频次为1，minFreq一定是1
    }

    /**
     * 节点频次+1：从当前频率链表移到频率+1链表
     */
    private void incrementFreq(Node<K, V> node) {
        int oldFreq = node.freq;
        int newFreq = oldFreq + 1;

        // 从旧频率链表移除
        DoublyLinkedList<K, V> oldList = freqMap.get(oldFreq);
        oldList.remove(node);
        if (oldList.isEmpty()) {
            freqMap.remove(oldFreq);
            if (minFreq == oldFreq) minFreq = newFreq; // 更新最小频率
        }

        // 加入新频率链表头部
        node.freq = newFreq;
        freqMap.computeIfAbsent(newFreq, k -> new DoublyLinkedList<>()).addFirst(node);
    }

    public int size() { return keyMap.size(); }
    // 暴露root供测试访问
    Map<K, Node<K, V>> getKeyMap() { return keyMap; }
}

3.2 线程安全版本与Spring Boot集成

package com.laozhang.cache;

import org.springframework.stereotype.Component;
import java.util.concurrent.locks.ReentrantReadWriteLock;

/**
 * 线程安全的LFU Cache + Spring Boot集成
 * 带统计功能（命中率监控）
 */
@Component
public class ThreadSafeLFUCache<K, V> {

    private final LFUCache<K, V> inner;
    private final ReentrantReadWriteLock lock = new ReentrantReadWriteLock();

    // 统计
    private long hitCount = 0;
    private long missCount = 0;

    public ThreadSafeLFUCache(int capacity) {
        this.inner = new LFUCache<>(capacity);
    }

    public V get(K key) {
        lock.writeLock().lock(); // get也需要写锁（因为要修改频次）
        try {
            V value = inner.get(key);
            if (value != null) hitCount++;
            else missCount++;
            return value;
        } finally {
            lock.writeLock().unlock();
        }
    }

    public void put(K key, V value) {
        lock.writeLock().lock();
        try {
            inner.put(key, value);
        } finally {
            lock.writeLock().unlock();
        }
    }

    public double hitRate() {
        long total = hitCount + missCount;
        return total == 0 ? 0 : (double) hitCount / total;
    }

    /**
     * 性能测试
     *
     * 据我测试（JDK17，单线程，100万次随机get/put）：
     * LFU (O(1)实现): 约320ms（平均320ns/op）
     * LRU (LinkedHashMap实现): 约280ms（平均280ns/op）
     * LFU比LRU慢约15%（因为freqMap的多一层HashMap查找）
     * 但在缓存命中率方面，频率局部性强的场景LFU通常高于LRU
     */
    public static void performanceBenchmark() {
        int capacity = 10_000;
        int operations = 1_000_000;
        java.util.Random rnd = new java.util.Random(42);

        // LFU测试
        LFUCache<Integer, String> lfu = new LFUCache<>(capacity);
        long start = System.currentTimeMillis();
        for (int i = 0; i < operations; i++) {
            int key = rnd.nextInt(capacity * 2); // key范围是容量的2倍
            if (i % 3 == 0) lfu.put(key, "v-" + key);
            else lfu.get(key);
        }
        System.out.println("LFU 100万次操作: " + (System.currentTimeMillis() - start) + "ms");

        // LRU对比
        LRUCacheSimple<Integer, String> lru = new LRUCacheSimple<>(capacity);
        start = System.currentTimeMillis();
        rnd = new java.util.Random(42); // 重置随机种子，保证相同操作序列
        for (int i = 0; i < operations; i++) {
            int key = rnd.nextInt(capacity * 2);
            if (i % 3 == 0) lru.put(key, "v-" + key);
            else lru.get(key);
        }
        System.out.println("LRU 100万次操作: " + (System.currentTimeMillis() - start) + "ms");
    }
}

四、踩坑实录

坑1：LFU的老化问题——早期爆款被永久缓存

报错现象：某个商品上线时的"爆款推广"期间，推荐缓存命中率很高。推广结束三个月后，这个商品的缓存条目频次已经几百了，永远不会被淘汰，但用户已经不再感兴趣了，缓存结果早已过时。

根本原因：LFU的频次只增不减，历史高频的数据会永远"霸占"缓存。

具体解法：

// 方案1：TTL（强烈推荐）
// 每个缓存条目设置过期时间，强制让老化数据失效
// Caffeine的LFU实现（W-TinyLFU）内置过期时间支持

// 方案2：周期性衰减（Decay）
// 每隔一段时间，对所有频次做右移（频次减半）
// 让老数据频次自然降低，给新数据机会
private void decayFrequencies() {
    for (var node : keyMap.values()) {
        // 从旧频率链表移除
        DoublyLinkedList<K, V> oldList = freqMap.get(node.freq);
        oldList.remove(node);
        if (oldList.isEmpty()) freqMap.remove(node.freq);
        // 频次减半（最低为1）
        node.freq = Math.max(1, node.freq >> 1);
        // 加入新频率链表
        freqMap.computeIfAbsent(node.freq, k -> new DoublyLinkedList<>()).addFirst(node);
    }
    // 更新minFreq
    minFreq = freqMap.keySet().stream().mapToInt(Integer::intValue).min().orElse(1);
}

// 方案3：直接用Caffeine（W-TinyLFU算法，比LRU和LFU命中率都更高）
// W-TinyLFU = 频率衰减 + 新条目保护期 + Window区+Main区分层

坑2：minFreq更新时机错误，导致淘汰了不该淘汰的节点

报错现象：LFU缓存的淘汰顺序不对，频次高的节点被淘汰，频次低的还在。

根本原因：minFreq的更新时机有两种：

incrementFreq时：如果旧频率链表变空，且旧频率==minFreq，则minFreq=newFreq
put新节点时：minFreq必须重置为1（新节点频次=1，1一定是最小频率）

很多人漏了第2条，或者在incrementFreq里错误地更新了minFreq。

具体解法：

// 关键：put新节点后，minFreq一定要重置为1
// 因为新节点的频次是1，而1是最小可能的频率
public void put(K key, V value) {
    // ...（淘汰逻辑）...
    Node<K, V> newNode = new Node<>(key, value);
    keyMap.put(key, newNode);
    freqMap.computeIfAbsent(1, k -> new DoublyLinkedList<>()).addFirst(newNode);
    minFreq = 1; // 不能忘记！！
}

坑3：相同频率下的tie-breaking没有实现，导致非LFU语义的淘汰

报错现象：LFU缓存容量满了，淘汰的是频次最低的节点，但在多个同频次节点中，淘汰的不是最久未访问的那个，导致业务上的缓存行为与预期不符。

根本原因：标准LFU规定：相同频次时，淘汰最久未访问的（LRU+LFU组合）。如果双向链表没有正确维护"最近在头部"的顺序，就无法正确实现这个tie-breaking。

具体解法：

// 确保每次访问（get/put更新）时，节点都移到对应频率链表的头部
// 新节点加入头部（addFirst）
// incrementFreq时，先从旧链表remove，再addFirst到新链表头部
// 这样链表尾部永远是"该频率下最久未访问的节点"

五、总结与延伸

LFU的O(1)实现精髓是"频率到链表的映射"（freqMap）+minFreq维护。 不需要对频率排序（堆操作O(log n)），而是直接用HashMap在O(1)时间找到任意频率的链表。这个思路（用空间换时间，避免排序）在很多性能优化场景中都有体现。
LFU在频率局部性强的场景（高频用户、热门商品）比LRU命中率高，但老化问题需要配合TTL解决。 纯LFU在生产环境中不常见，更常见的是W-TinyLFU（Caffeine使用），它通过频率衰减和分层窗口解决了老化问题，命中率高于LRU和LFU。
手写LFU比手写LRU复杂，但核心数据结构相同（双向链表+HashMap）。 从LRU到LFU的扩展，只需要把"一个链表"变成"频率到链表的映射"，再加入minFreq的维护。理解了这个演进过程，两种算法都不难记忆。