发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
关于长尾词的分词问题
2015年11月04日, 10:34 (这个帖子最后修改于: 2015年11月04日 10:35 by 毛多多.)
关于长尾词的分词问题
在做自定义词库的时候,遇到一个问题。
我在词库里面添加了如下单词:

怎么
怎么样
什么时候
什么
厦门大学考研
厦门
第二炮兵指挥学院考研
第二炮兵指挥学院
考研英语单词
考研英语


但是分词的时候
只能分出如下单词:
怎么
怎么样
什么时候
什么
厦门大学考研
厦门
第二炮兵指挥学院考研
考研英语单词

分不出
第二炮兵指挥学院
考研英语

分词的时候不是完全按照我的词典来的吗?
请问是要在哪里做设置,或者这是遵循什么规则的吗?
查找这个用户的全部帖子
引用并回复
2015年11月09日, 16:08
RE: 关于长尾词的分词问题
在分词过程中请设置复合切分模式:
`void scws_set_multi(scws_t s, int mode)`
> - SCWS_MULTI_SHORT 短词
> - SCWS_MULTI_DUALITY 二元(将相邻的2个单字组合成一个词)
> - SCWS_MULTI_ZMAIN 重要单字
> - SCWS_MULTI_ZALL 全部单字
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客