搜索中的Query扩展技术

北京市那家医院治白癜风好 https://m-mip.39.net/nk/mipso_4508646.html

内容来源:丁香园大数据

编辑整理:Hoh

导读:影响搜索结果的因素有很多,包括对短文本的正确理解(实体词识别、纠错、意图分析等)、长文本良好结构化(关键词抽取、主题词抽取、文本分类等)以及排序模型(召回策略、LTR、语义匹配等)。各种优化算法落在以上三个步骤中,对不同指标产生影响。

对于搜索优化,我们的建议是从召回策略开始着手。理由是这个步骤与实际业务方最近,当理清业务逻辑后,可以快速实施,看见变化。另外,召回阶段是整个搜索流程中的基石,所有后续的排序都基于召回的候选列表,先规划好召回策略,才可能尽量避免后续调整基石,导致与后续"精排"相互影响的境地。

那么改进召回我们一般会做些什么呢?首先一定是通过产品分析、用户调研来了解什么内容适合在这个搜索场景里展示,随后抡起大刀修改检索的字段或公式。有了baseline之后,我们在观察检索回的内容有什么问题。可能是没有匹配内容,可能是最匹配的内容排序靠后,或者可能是除了字面匹配,其他内容相关性差等等。此时,就可以上一些影响召回的模块,比如Query词权重分配、动态时效性判定、Query扩展等。后面会陆续有文章分享其他技术,本文我们先


转载请注明:http://www.92nongye.com/zyjs/204621952.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了