【搜索技术 倒排索引】倒排索引例子介绍

为什么搜索引擎的查询速度这么快? 说明白了很简单,核心技术就是 “倒排索引”。

“倒排索引”这个名词很唬人,其实原理很简单。

假设有3篇文章,file1,file2,file3,文件内容如下:

file1 (单词1,单词2,单词3,单词4….)

file2 (单词a,单词b,单词c,单词d….)

file3 (单词1,单词a,单词3,单词d….)

建立的倒排索引就是这个样子:

单词1 (file1,file3)

单词2 (file1)

单词3 (file1,file3)

单词a (file2, file3)

这就是倒排索引,很简单吧。

其中,倒排索引技术在当前大多数的信息检索系统中得到了广泛的应用,它对于关键词的搜索非常有效,在Lucene中也是使用的这种技术。

由item查询key的过程,是倒排索引。

举例:
这里写图片描述

这里写图片描述

这里写图片描述

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页