发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
2012年02月23日, 17:52
请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
Hi Hightman,

您好! 非常感谢您做的scws分词和xunsearch系统, 最近我们在做网站的搜寻服务, 考察了coreseek, sphinx-for-chinese 和 xunsearch 这三个系统, 觉得还是 xunsearch 比较适合, 因为词典制作和查询的方式都较另外二者灵活.

在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到此选项.

请问可否在xunsearch中设置?

先谢过!

Thanks,
Milton
查找这个用户的全部帖子
引用并回复
2012年02月26日, 03:53
RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
不会的啊,默认就是-M3呀
查找这个用户的全部帖子
引用并回复
2012年02月26日, 03:53
RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
不会的啊,默认就是-M3呀
查找这个用户的全部帖子
引用并回复
2013年01月28日, 14:57 (这个帖子最后修改于: 2013年01月28日 15:02 by tisswb.)
RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
[quote='hightman' pid='562' dateline='1330199583']
不会的啊,默认就是-M3呀
[/quote]

如何设置成其他的值呀 最近的一个项目需要全部的单字
在项目的ini里,tokenizer = default 如果是3的话 不知到如何改成11
是否是使用xlen(1) 来设置?这个xlen对中文和英文如何计算长度?
请老大指教~
查找这个用户的全部帖子
引用并回复
2013年01月30日, 14:10
RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
查找这个用户的全部帖子
引用并回复
2013年02月02日, 13:23
RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)
[quote='hightman' pid='3251' dateline='1359526251']
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
[/quote]

感谢,我就是这么干的~
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客