发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
PSCWS4使用问题
2010年10月21日, 17:16 (这个帖子最后修改于: 2010年10月21日 17:17 by ReyesLeadman.)
PSCWS4使用问题
HI,hightman

$cws = new PSCWS4('utf8');
$cws->set_dict('etc/dict.utf8.xdb');
$cws->set_rule('etc/rules.utf8.ini');
$ret = array();
$ret = $cws->get_tops(10,'r,v,p');
echo "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n";
$i = 1;
foreach ($ret as $tmp)
{
printf("%02d.\t%-16s\t%s\t%d\t%.2f\n", $i++, $tmp['word'], $tmp['attr'], $tmp['times'], $tmp['weight']);
}
$cws->close();

utf8编码好像使用不了,我把所有文件(ini,php,包括test.php)都改成utf8编码存储,header输出的也是utf8编码,执行默认的test.php,产生乱码,不知道问题出现在哪?dict.utf8.xdb是新下载的没有动,非常感谢。

另外一个问题,我使用PSCWS4,是想在发布的文章内容中提取关键字,数量大约8个左右就可以了,get_tops()能满足吗?能按匹配到的词的长度排序吗?再次感谢​!
查找这个用户的全部帖子
引用并回复
2010年10月21日, 17:21
RE: PSCWS4使用问题
报告老大,我也发现同样的问题,不是编码格式的问题,返回值打印出来是乱码
查找这个用户的全部帖子
引用并回复
2010年10月21日, 17:30
RE: PSCWS4使用问题
编码问题找到原因,我使用的是PHP5版本,默认执行了这个构造函数
function __construct() { $this->PSCWS4(); }
导致使用的仍是GBK编码,$cws->set_charset('utf8');一下就可以了。
期待帮忙答复一下第二个问题,谢谢老大。
查找这个用户的全部帖子
引用并回复
2010年10月21日, 17:38
RE: PSCWS4使用问题
怪怪,你真快,我刚回来
还怀着兴奋的心情要告诉你哩!
呵呵
--------------
俺也帮顶下你的问题
你说按匹配到的词的长度,嘛意思?
查找这个用户的全部帖子
引用并回复
2016年09月28日, 10:58
RE: PSCWS4使用问题
[quote='ReyesLeadman' pid='2652' dateline='1287653427']
编码问题找到原因,我使用的是PHP5版本,默认执行了这个构造函数
function __construct() { $this->PSCWS4(); }
导致使用的仍是GBK编码,$cws->set_charset('utf8');一下就可以了。
期待帮忙答复一下第二个问题,谢谢老大。
[/quote]

非常感谢你回答解决了我问题
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客