发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)
2013年07月30日, 11:30
xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)
经过长达 4 个月的仔细改进,整合了大量用户反馈意见,很高兴在今天发布 xunsearch-1.4.7 正式稳定版。这是一个细节改进版,还整合升级了最新的 xapian-1.2.15/scws-1.2.2,[color=#FF0000][b]强烈建议所有用户升级到这个最新稳定版!![/b][/color]

小提示,由于升级了 xapian-core,因此升级过程可能会稍显漫长,请不必担忧,耐心等候即可。

[b]主要更新如下:[/b]

1. 优化安装脚本,请使用 --help 查看
2. 采用 Yii2 的代码标准格式化 php-sdk 代码
3. 改进搜索结果排序支持更复杂排序,参见 XSSearch::setSort
4. util.Indexer 加入 PgSQL 数据源支持
5. 新增支持搜索按匹配百分比/权重剔除,参见 XSSearch::setCutOff
6. 改善搜索同义词处理方案,支持复合同义词及权重微调
7. 各种小 BUG 修正和及整体稳定性改进
8. 升级整合最新的 xapian-1.2.15、scws-1.2.2

官方网站:[url]http://www.xunsearch.com[/url]
下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url]
代码仓库:[url]https://github.com/hightman/xunsearch[/url]
修改日志:[url]https://github.com/hightman/xunsearch/commits/1.4.7[/url]
CHM手册:[url]http://www.xunsearch.com/download/xs_php_manual.chm[/url]

Xunsearch 是免费开源的专业全文检索解决方案,旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高​​搜索速度和用户体验。

[b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。

[b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。

[b]全功能:[/b]除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。

[attachment=42]

某次扛压实验结果:
---------- SERVER INFO BEGIN ----------
{
id:worker3, uptime:3623, num_burst:1, max_burst:132,
num_accept:194989(53.8/s), num_task:1083121(299.0/s),
sock:7, name:"demo", home:"data/demo", rcv_size:8,
flag:0x0000, version:"1.4.7"
}

---------- SERVER INFO BEGIN ----------
{
id:"worker1", uptime:157312, num_burst:0, max_burst:56,
num_accept:436479, aps:2.8, num_task:1213522, tps:7.7,
sock:7, name:"demo", home:"data/demo", rcv_size:8,
flag:0x0000, version:"1.4.7"
}
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客