发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
规则集BUG
2014年08月22日, 17:36 (这个帖子最后修改于: 2014年08月22日 17:43 by shakeng.)
规则集BUG
添加一个规则集如下:

[b]:type = prefix
:line = yes
:tf = 3.5
:idf = 2.0
:attr = nz
:include = chnum1,chnum2
:znum = 1,2,3

百分
百分之[/b]

分词的时候出现以下问题:
词:百分六 识别正确
词:百分六十 识别失败,只能识别出”百分“和”六十“,无法识别为:”百分六十“
词:百分六五 识别失败,结果同上
词:百分六十五 识别失败,结果同上

词:百分之六 识别失败,只能识别出:”百分“,”百分之“,”六“,无法识别出”百分之六“
词:百分之六十 识别失败,结果同上
词:百分之六十五 识别失败,结果同上

好像讯搜无法支持2个字以上的规则?还是需要怎么修改?
查找这个用户的全部帖子
引用并回复
2014年10月23日, 16:38
RE: 规则集BUG
不是无法,而是后面的词出现在词库中导致的。规则识别适用于无法成词的散字,匹配词库则会优先。
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客