Redis中HyperLogLog的使用小结

2025-05-10 08:25 数据库作者： BirdMan98

Redis 的 HyperLogLog 是一种概率性数据结构，用于统计唯一元素http://www.devze.com的数量（基数），比如你想知道一个网站有多少独立访问用户（UV）。它的主要优点是：内存占用极小，无论你添加多少数据，它通常只占用 12KB 的内存。

下面是 HyperLogLog 的详细讲解：

一、HyperLogLog 是什么？

HyperLogLog 是一种基数估计算法，它可以用来估算一个集合中不同元素的数量（Cardinality）。和 Set 不同，Set 会存储所有元素，而 HyperLogLog 并不会保存具体的数据，只保存一种统计状态。

✅ 优点：可以统计大规模唯一元素数量，内存使用极低
❌ 缺点：不是精确统计，有误差范围 ±0.81%

️ 二、使用方法

1. 添加数据

PFADD key element [element ...]
PFADD myloglog user1 user2 user3

2. 查询基数

PFCOUNT key [key ...]
PFCOUNT myloglog

3. 合并多个 HyperLogLog

PFMERGE destkey sourcekey1 [sourcekey2 ...]
PFMERGE totalLog userLog1 userLog2

三、实际示例

# 添加一些用户ID
PFADD uv:20250414 user1 user2 user3 user4 user5

# 查询今天的 UV
PFCOUNT uv:20250414
# 返回 5

javascript# 添加重复的用户 ID（不会重复计数）
PFADD uv:20250414 user1 user2

# 再查一次
PFCOUNT uv:20250414
# 仍然是 5

四、原理简要（非必须了解）

HyperLogLog 基于概率算法，核心思想是：

哈希每个元素，观察哈希值的前缀中连续0的最大长度，利用这个统计信息估算基数。

哈希函数让输入随机分布
长连续 0 出现的概率很低，说明数据多
Redis 将结果分散到 2^14（16,384）个桶中，提高精度

五、适用场景

网站 UV 统计（每天、每http://www.devze.com小时用户访问数）
活跃用户数统计
数据去重统计但不需要精确结果的场合

⚠️ 六、注意事项

无法获取添加了哪些元素（它不存数据）
是估算值（不是精确值），精度误差为 ±0.81%
永远只占用约 12KB 的内存（精确控制内存使用）

七、与 Set 对比

项目	Set	HyperLogLog
精度	精确	估算（±0.81%）
内存	随数据增大	恒定约 12KB
支持去重计数	✅	✅（基于概率）
支持元素查看	✅	❌（不存数据）
使用场景	数据可控小集合	超大规模数据统计

如果你有具体的使用场景或代码需求，也可以告诉我，我可以帮你写具体的 Redis 命令或 python/Lua 示例。需要吗？

到此这篇关于Redis中HyperLogLog的使用小结的文章就介绍到这了,更多相关Redis HyperLogLog使用内容请搜索编程客栈(www.cp编程客栈pcns.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)！

继续阅读：Redis HyperLogLog

Redis中HyperLogLog的使用小结

目录

一、HyperLogLog 是什么？

️ 二、使用方法

1. 添加数据

2. 查询基数

3. 合并多个 HyperLogLog

三、实际示例

四、原理简要（非必须了解）

五、适用场景

⚠️ 六、注意事项

七、与 Set 对比

更多精彩内容

精彩评论

最新数据库

PostgreSQL判断字段是否为null或是否为空字符串的几种方法

SQL Server修改数据库名称的常用方法

SQL Server建立自动备份的维护计划的全过程

MySQL安装失败后实现纯净卸载删除过程

mysql8.0.25升级到mysql8.0.30全过程

数据库排行榜

Hadoop Key Management Server (KMS)配置及测试

spark报错ERROR ObjectStore: Version information found in metastore differs 2.1.0 from expected schema version 1.2.0. Schema verififcation is disabled hive.metastore.schema.verification so setting version.

Navicat连接Oracle数据库的详细步骤与注意事项

解决Navicat远程连接MySQL出现 10060 unknow error的方法

redis-cluster集群调优之cluster-require-full-coverage参数