发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
拼音搜索时遇到的问题
2012年12月26日, 09:33 (这个帖子最后修改于: 2012年12月26日 12:45 by HiLinz.)
拼音搜索时遇到的问题
请教几个问题:
我正在做一个搜索视频的项目,要求通过遥控器在电视上输入一个影片名中关键词的拼音首字母就可以搜索到一些影片,如输入ff 可搜索到 “那样芬芳”、“非凡英雄”、“强者风范”等影片。我采用的方法是把影片名通过分词后再取其各关键词的首字母,如影片“强者风范” 分词后获取首字母得到拼音字段为“qz,ff”,查询时,根据 pinyin:ff 可查找到 “强者风范” 。

我遇到的问题是:
1、如何查找类型为电影、并且拼音中包含ff的。如用:util/Quest.php words "pinyin:ff AND type:电影",怎么查不到结果?
2、如何根据 ff 把搜索到的影片中的关键词(芬芳、非凡、风范)高亮?
3、搜索结果中如何把关键词按影片名中关键词出现的位置排序,如输入"ff"时, “那样芬芳”是分词后的第二个关键词(芬芳)时被找到,“非凡英雄”是分词后第一个关键词(非凡)被找到。怎样把“非凡英雄” 放在 “那样芬芳”前。
4、使用 XSSearch::getExpandedQuery 效率如何?

谢谢。
查找这个用户的全部帖子
引用并回复
2012年12月29日, 17:40
RE: 拼音搜索时遇到的问题
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引?
2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。
3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以
4. 用的是同样的算法检索 log_db 效率还是不错的
查找这个用户的全部帖子
引用并回复
2012年12月29日, 17:40
RE: 拼音搜索时遇到的问题
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引?
2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。
3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以
4. 用的是同样的算法检索 log_db 效率还是不错的
查找这个用户的全部帖子
引用并回复
2013年07月11日, 16:47
RE: 拼音搜索时遇到的问题
mark 学习
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客