搜索结果
Post 作者 版块 条回复 查看 回复 [升序]
  主题: 新版本SCWS-1.2.2的scws-gen-dict工具没有反向解压功能?
回复: RE: 新版本SCWS-1.2.2的scws-gen-dict工具没有反向解压功能?

目前没有,计划将来添加一个 -r 参数用来解压
hightman SCWS 中文分词系统 1 2,066 2013年12月16日, 13:33
  主题: 搜索语句超长
回复: RE: 搜索语句超长

换一种方式解决啊,逐级添加父分类 比如一条数据的分类ID是 9,分类9的父ID是3,分类ID3的父分类是 1 那么你给文档创建索引的时候,通过 $doc->addTerm() 给全部祖先分类ID:3,1 也建立索引不就好了。然后检索 3/1也能检索到分类为9的数据。就是这么简单 否则如果有一千个子类,你这QUERY语句要多长?
hightman 高级技巧&FAQ 2 2,719 2013年12月16日, 13:23
  主题: 检测运行环境时的问题
回复: RE: 检测运行环境时的问题

没根本性的影响。 你可以安装xcache,apc,eaccelerator其中的一个扩展来解决这个问题。
hightman 一般安装&使用 1 3,762 2013年12月16日, 13:19
  主题: 问个比较白的问题:多个相同结构的数据表,如何最合理的建立索引?
回复: RE: 问个比较白的问题:多个相同结构的数据表,如何最合理的建立索引?

unique id = table_name + id_in_table 将主键修改为 Table1_1 和 Table2_1 就好了呀 检索结果中提取 id 中 最后一个 _ 之前的部分就是 table 名了。
hightman 一般安装&使用 2 4,188 2013年12月13日, 14:02
  主题: xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)
回复: xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

经过数月的调优和改进,吸收处理了大量用户反馈意见,很高兴在今天发布 xunsearch-1.4.8 正式稳定版,强烈建议所有用户升级到这个最新稳定版! [b]主要更新如下:[/b] 1. 改进优化代码兼容性 2. 增加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 sto...
hightman 开发日志&动态 2 6,017 2013年12月11日, 15:40
  主题: 从windows迁移到linux发生的问题
回复: RE: 从windows迁移到linux发生的问题

先检查一下你的 $str 是否正确无误。scws 本身是对机器位数没有依赖
hightman SCWS 中文分词系统 4 3,139 2013年12月11日, 15:17
  主题: 关于数词、量词
回复: RE: 关于数词、量词

这个应该没办法,所有的调整都是基于词典,也就是词典的优先级最最高了。 可以用程序扫出类似的词来删除它们,因为互联网语料库这些自动都列到词里了。
hightman SCWS 中文分词系统 1 1,729 2013年12月06日, 10:02
  主题: 添加新的分词无效
回复: RE: 添加新的分词无效

dict_extra.txt 的编码正确 吗,是否对WEB运行用户可读?
hightman SCWS 中文分词系统 1 1,855 2013年12月06日, 10:00
  主题: 请问有没有类似mysql里的" where 1=1 "的语句?
回复: RE: 请问有没有类似mysql里的" where 1=1 "的语句?

field:xxx
hightman 一般安装&使用 1 5,090 2013年11月29日, 15:17
  主题: 请问虾片中的枚举类型,在xunsearch 怎么表示?
回复: RE: 请问虾片中的枚举类型,在xunsearch 怎么表示?

最简单的道理,在全文检索中由词"token"反向查询文档“doc", 所以能不能找到的本质在于是否建立了 token-->doc 的关联索引;而用启输入的 query 也一样是拆分成 token去检索。 很多人问为什么”梨子“可以检索到,但”梨“检索不到,就是这个道理,因为没有做”梨“的索引呗。当你想办法让分词器能产生这个词/字时就可以检索到。
hightman 一般安装&使用 4 7,293 2013年11月26日, 13:09
  主题: 请问虾片中的枚举类型,在xunsearch 怎么表示?
回复: RE: 请问虾片中的枚举类型,在xunsearch 怎么表示?

看你怎么分词啊,所谓的多值也可以转换成一个值再切割。
hightman 一般安装&使用 4 7,293 2013年11月26日, 13:07
  主题: 请问虾片中的枚举类型,在xunsearch 怎么表示?
回复: RE: 请问虾片中的枚举类型,在xunsearch 怎么表示?

是什么类型都 无所谓,每个字段都是一个值或一组值啊
hightman 一般安装&使用 4 7,293 2013年11月22日, 15:11
  主题: SCWS自定义修改问题
回复: RE: SCWS自定义修改问题

直接 scws 应该不行,没这个写法,规则集也是建立在非词库词的基础上。
hightman SCWS 中文分词系统 1 1,778 2013年11月22日, 10:35
  主题: 请问排序字段是否要设置:字段索引?
回复: RE: 请问排序字段是否要设置:字段索引?

索引是用来检索的,只是用于排序不需要设置。
hightman 一般安装&使用 1 4,906 2013年11月22日, 10:34
  主题: www.adminlink.net.cn上的xunsearch案例
回复: RE: www.adminlink.net.cn上的xunsearch案例

[quote='bestfriend' pid='5159' dateline='1384773468'] 大约有 162,974 项符合查询结果, 库内数据总量为 15,419,976 项。 (搜索耗时:0.3538秒 [/quote] 什么网址
hightman 项目案例 5 9,138 2013年11月19日, 14:18
  主题: 使用
回复: RE: 使用

可能不行,scws 需要激活扩展
hightman 一般安装&使用 1 5,393 2013年11月15日, 15:10
  主题: 关于SCWS的编译问题
回复: RE: 关于SCWS的编译问题

源码目录中没有 php.h 吗
hightman SCWS 中文分词系统 3 2,765 2013年11月11日, 12:26
  主题: 一点疑惑
回复: RE: 一点疑惑

全文检索当然不是 LIKE 'xx%' 哦
hightman 一般安装&使用 2 6,110 2013年11月11日, 09:59
  主题: 我用csv进行添加是的ID问题
回复: RE: 我用csv进行添加是的ID问题

[quote='子不语' pid='5105' dateline='1383978605'] [quote='hightman' pid='5090' dateline='1383799152'] 添加不会自动去重的哦。 [/quote] 还一个问题 我搜索123可以出来结果 搜索12 却不可以出结果 怎么回事? [/quote] 出不来才是对的啊,这是全文检索不是 LIKE '12%'
hightman 一般安装&使用 5 8,989 2013年11月11日, 09:58
  主题: 凌晨一点了我还在调试,管理你就帮帮我啊!
回复: RE: 凌晨一点了我还在调试,管理你就帮帮我啊!

要有具体一点的信息,怎么个不行法。检索 的时候加上 --show-query 可以查看拆词结果 。
hightman 一般安装&使用 3 7,826 2013年11月11日, 09:58