预先构建关键词-包含关键词文档的索引

Showcase, discuss, and inspire with creative America Data Set.
Post Reply
Reddi2
Posts: 256
Joined: Sat Dec 28, 2024 7:21 am

预先构建关键词-包含关键词文档的索引

Post by Reddi2 »

因此,数据在存储时,除了本身实体属性外,还需要引入一些额外的标签对数据质量进行多方面评价。 对于房源信息,数据库通常会录入房源的标题、名称、类型、位置、价格、户型、面积、楼层、朝向、发布时间等字段,同时这些将这些数据做结构化处理,方便搜索引擎和其他业务查询。

除此之外,也可以引入房源质量评分、评分、户型评分、评级等多维评价标签或指数,作为召回策略的条件。 召回方式 与大多搜索引擎系统一样,房产搜索引擎通常采取多路召回策略,下面介绍几种常用的召回策略: 文本索引召回:文本索引通常使用倒排索引方式。

根据用户输入的关键词,对房产数据库中的已有的索引进行检索,查找包含关键词的房源文档信息。

例如,用户在平台搜索三室两厅,搜索引擎根据数据库中查找包含三室和两厅的文档索引,从中返回符合搜索条件的房源信息并呈现给用户。

精准召回:根据用户输入的召回条件,从房产数据库中筛选 车主数据库 出符合条件的房源信息,保证召回的准确性和完整性。

例如,用户在房产平台搜索深圳市罗湖区,平米以下的二手房。根据用户输入的qery,不进行纠错、扩展等操作,优先在数据库中筛查找符合qery的房源信息。

同义词改写:将用户输入的qery转换为相似的同义词,从而扩大召回范围,提高召回的覆盖率。例如,当用户在房产平台搜索带阳台的房子,搜索引擎可以将阳台改写为露台,阳光房等同义词,从而扩大搜索范围,提高召回率。

I:基于用户历史行为数据,将用户行为、偏好等信息作为召回条件之一,提高召回的个性化程度。比如经常搜索小户型房源的用户,我们可以在召回时将小户型或室加入到召回条件中,提高搜索结果的满意度。

II:基于不同房源之间的相似度,将某个房源特征加入到召回条件中,推荐相似的房源信息。例如,用户收藏了一套花园别墅。

基于该房源的特征,比如位置、房型、面积、价格等,在搜索结果中适当推荐其它具有相似特征的别墅给用户。 除此之外,召回策略还包含向量召回、基于深度学习召回等方式,有兴趣的读者可以通过作者其他文章了解。

召回是从海量的物品库里快速找出用户可能感兴趣的物品的过程,它决定了推荐系统的上限。如果召回的物品与用户需求无关,那么后面的排序就算再好也无法解决用户需求。
Post Reply