发表回复 
 
主题评价:
  • 0 次(票) - 平均星级: 0
  • 1
  • 2
  • 3
  • 4
  • 5
图片搜索的一些疑问
2014年02月16日, 02:42 (这个帖子最后修改于: 2014年02月16日 17:14 by Mr..)
灯泡 图片搜索的一些疑问
普通搜索:单一检索题标字段
图片搜索:检索hash_64字段值完全相等的数据,然后根据hash_196字段按匹配度排序 我对xlen分词器不是很了解 这个排序mysql可以实现 但是mysql分割后的位置不是固定的

project.name = hash
project.default_charset = UTF-8
server.index = /dev/shm/xs-indexd.sock
server.search = /dev/shm/xs-searchd.sock

[id];图片ID主键 唯一
type = id
index = none
tokenizer = none
cutlen = 0
weight = 0
phrase = no
non_bool = no

[title];图片属于哪个图集的题标 非唯一 但每个图集题标都是唯一
type = title;我可以设置为string?
index = both;如果type = title 请问我可以设置为self吗?
tokenizer = default;默认scws分词器
cutlen = 0
weight = 5
phrase = no;关闭精确检索
non_bool = no;要实现默认的匹配度排序 我需要yes这个?

[lid];图集属于哪个类目ID 非唯一 但每个类目ID都是唯一 用于区间检索
type = numeric
index = none
tokenizer = none
cutlen = 0
weight = 0
phrase = no
non_bool = no

[hash_64];纯数字的图片hash值 长度是固定的64位整数 非唯一 但相同的值比较多
type = string;应该不能用numeric类型吧?
index = self
tokenizer = none;要实现匹配一个64位数值是完全相等的 不分词 应该是none还是full呢?
cutlen = 0
weight = 0
phrase = yes;使用精确检索 要实现完全相等的检索我需要用到双引号吗?
non_bool = no
(如果不做索引 直接区间检索 效率比index = self快吗?)

[hash_196];纯数字的图片hash值 长度是固定的196位整数 非唯一 但相同的值比较少
type = numeric;用addWeight方法可以使用numeric?
index = self;可以使用none?
tokenizer = xlen([14]);这个做匹配度排序适合不?xlen的原理是?
cutlen = 0
weight = 0
phrase = no
non_bool = yes
查找这个用户的全部帖子
引用并回复
发表回复 


论坛跳转:


正在浏览该主题的用户: 1 个游客