博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Bloom filter
阅读量:4483 次
发布时间:2019-06-08

本文共 712 字,大约阅读时间需要 2 分钟。

1 Bloom filter

 When we write crawler,  if we have to crawler millions websites,  we need to check whether a website is crawled or not,

 So we need both space and time efficient algorithoms to achieve this goal, is our choice.

 Bloom filter is a probabilistic data structure: it tells us that the element either definitely is not in the set or may be in the set.

 So  Bloom filter may be false positive, but never false negative.

 About false positive and false negative, you can refer to  and ".

 

2 Use case

  a) search engine, when crawls website, check whether a website is crawled or not.

  b) browses use this to check whether a url is malicious or not.

转载于:https://www.cnblogs.com/wufawei/archive/2012/05/11/2495259.html

你可能感兴趣的文章
UVA GCD - Extreme (II)
查看>>
完成个人中心—导航标签
查看>>
【C++】C++中变量的声明与定义的区别
查看>>
前端性能优化
查看>>
static
查看>>
属性动画
查看>>
Swift 字符串
查看>>
Python 生成器 Generator 和迭代器 Iterator
查看>>
实现icon和文字垂直居中的两种方法-(vertical-align and line-height)
查看>>
[CareerCup] 3.6 Sort Stack 栈排序
查看>>
Beta版总结会议
查看>>
Cocos2d-x中使用的数据容器类
查看>>
创建ORACLE 查询用户
查看>>
jzoj3297. 【SDOI2013】逃考
查看>>
通过例子学python(2.1)
查看>>
高效率场景-内存映射
查看>>
Python基础——0前言
查看>>
机器学习三剑客之Numpy
查看>>
django路由转发
查看>>
HBase环境搭建随笔
查看>>