本文共 275 字,大约阅读时间需要 1 分钟。
1、 为什么出现(why):
a) 在集合中查找数据
b) 一般做法使用哈希表,时间效率高但是占用空间,对于互联网大数据,占用空间可想而知
c) 布隆过滤器可以使用1/4到1/8哈希表占用空间完成相同的功能
2、 其缺点:存在误算率
3、 具体应用:
a) 查看拼写的英语是否存在已有的字典里面
b) Fbi查看嫌疑人名单是否在通缉名单里面
c) 爬虫的时候判断该网址是否已经爬过
4、 怎样构成(how):一个很长的二进制向量和几个随机映射函数
转载于:https://juejin.im/post/5c052051e51d45636350f25b