曝光过滤
短时间内重复曝光可能会降低用户体验,因此在召回阶段会做曝光过滤
暴力比较召回物品是否在用户已曝光物品列表里开销过大,通常使用布隆过滤器
布隆过滤器判断物品不在集合中,则物品一定不在,判断在集合中可能误判
布隆过滤器
维护一个长度为m的二进制向量
布隆过滤器内有k个哈希函数,每个哈希函数能映射到0到m
每向过滤器加入一个物品,就将物品ID经过k个哈希函数,得到k个对应位置,将对应位置的二进制置为1
进行判断时,将物品ID经过k个哈希函数,得到的对应位置如果均为1,则判断在集合中,如果存在0,则一定不在集合中