免費論壇 繁體 | 簡體
Sclub交友聊天~加入聊天室當版主
分享
Board logo

標題: [建站經驗] 搜索意图识别的3大方法及其优缺点分析 [打印本頁]

作者: superman1024    時間: 2013-10-7 14:53     標題: 搜索意图识别的3大方法及其优缺点分析

1、词表穷举法:


最简单直接的方法,通过词表癿直接匹配来获取查询意图,也可加入适用于较为简单且查询较为集中的类别,比如电视台节目查询,节假日查询,餐馆查询等。



优缺点:


简单易实现,能很好癿解决高频词,但召回比较低,人工比例较高,且无法解决长尾查询词。



2、规则解析法:


适用于一些查询虽然不集中但非常符合规则的类别,通过规则解析查询来做意图识别和关键信息提取癿,比如汇率查询,计算器,度量衡等。



优缺点:


信息提取准确,配合简单类别识别模型可以得到较不错的识别精度,只适用规则性较强的类别。



3、统计模型分类法:


 查询词分类:基于查询词本身的分类,也就是建立基于字面意思的统计分类模型。


 查询词扩展分类:基于查询词的扩展信息的分类,也就是基于真是社会知识的分离,通常是搜索结果扩展。


优缺点:


实现较为复杂,数据获取困难,数据更新困难,但效果较好,稳定性好,通用性好,在持续更新语料的条件下,可以通过流程自动更新




歡迎光臨 SCLUB免費論壇申請-使用者論壇 (http://s-club.tw/discuz/) Powered by Discuz! 7.2