`
jolestar
  • 浏览: 195303 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene范围查询(RangeQuery)的几个问题

阅读更多

对要进行范围查询(RangeQuery)的字段 创建索引的时候要按照 储存 不分词 的方式创建索引。

 

new Field(name, value, Field.Store.YES, Field.Index.UN_TOKENIZED);

 

1.数字的范围查询

对数字进行范围查询,必须先把数字格式化为一样长度的字符串。位数不够的在前面补零。

如:

NumberFormat format = NumberFormat.getIntegerInstance();
//设置数字的位数 由实际情况的最大数字决定
format.setMinimumIntegerDigits(6);
//是否按每三位隔开,如:1234567 将被格式化为 1,234,567。在这里选择 否
format.setGroupingUsed(false); 

format.format(number);


 

这样 1 将被格式化为 000001

 

查询的时候也必须补零。

 

查询语法: fieldName:[000001 TO 000100]

 

演示:http://so.1ting.com/singer.do?q=singerIdRange%3A[000001+TO+000100]&sort=singerId

 

2:日期范围查询

 

日期范围查询必须需要用lucene的时间转换工具类(DateTools )的

static String dateToString (Date date, DateTools.Resolution resolution) 方法 ,先把时间转换为字符串进行索引。

查询语法: date:[6/1/2005 TO 6/4/2005]

还可以overwrites QueryParser类的getRangeQuery(String, String, String, boolean)方法实现自定义的范围搜索。

 

 

 

分享到:
评论
4 楼 jolestar 2009-06-04  
sunjun 写道

你好,问你一下,为什么我按你说的进行范围查询,查询出来结果不对
我有个图片搜索,搜索结果按大小(width, height)分类
索引的时候我存储了width, height, 比如 200 ,400
1,
BooleanQuery booleanQuery = new BooleanQuery();
booleanQuery.add(new RangeQuery(new Term("width", "0"), new Term("width", "500"), true), Occur.SHOULD);
这样查询出来有width>500的结果
booleanQuery.add(new RangeQuery(new Term("width", "000"), new Term("width", "500"), true), Occur.SHOULD);
这样查询出来也有width>500的结果

2,
后来我将width,height索引时全部按4位数存储,如200则存储为0200
再查询
booleanQuery.add(new RangeQuery(new Term("width", "000"), new Term("width", "500"), true), Occur.SHOULD);
结果比上面稍微好了点,但是还是有很多不对的结果出现

3,后来我又换了个思路,在索引时就把他的分类存储起来,按width和height共分为4类, 大(1),较大(2),较小(3),小(4)
我直接存储了一个field为sizeType,
使用TermQuery query=new TermQuery(new Term("sizeType","1"));
这样也不行,sizeType为2,3,4都有出现,

请教一下,这个问题怎么解决,是不是我索引时的keyword在其它Field的里面也存在了啊,看了下输出的结果,感觉有点可能,
但是我上面的3个做法都只是从当前我关心的Field里面去搜索,与其它的Field应该无关啊

lucene有没有进行精确匹配的搜索方法,就像在数据库中查询字段=值



按道理不会出现这种问题的啊。指定字段查询就是精确查询。
3 楼 fffddgx 2009-06-02  
谢谢,有收获
2 楼 sunjun 2009-05-29  
你好,问你一下,为什么我按你说的进行范围查询,查询出来结果不对
我有个图片搜索,搜索结果按大小(width, height)分类
索引的时候我存储了width, height, 比如 200 ,400
1,
BooleanQuery booleanQuery = new BooleanQuery();
booleanQuery.add(new RangeQuery(new Term("width", "0"), new Term("width", "500"), true), Occur.SHOULD);
这样查询出来有width>500的结果
booleanQuery.add(new RangeQuery(new Term("width", "000"), new Term("width", "500"), true), Occur.SHOULD);
这样查询出来也有width>500的结果

2,
后来我将width,height索引时全部按4位数存储,如200则存储为0200
再查询
booleanQuery.add(new RangeQuery(new Term("width", "000"), new Term("width", "500"), true), Occur.SHOULD);
结果比上面稍微好了点,但是还是有很多不对的结果出现

3,后来我又换了个思路,在索引时就把他的分类存储起来,按width和height共分为4类, 大(1),较大(2),较小(3),小(4)
我直接存储了一个field为sizeType,
使用TermQuery query=new TermQuery(new Term("sizeType","1"));
这样也不行,sizeType为2,3,4都有出现,

请教一下,这个问题怎么解决,是不是我索引时的keyword在其它Field的里面也存在了啊,看了下输出的结果,感觉有点可能,
但是我上面的3个做法都只是从当前我关心的Field里面去搜索,与其它的Field应该无关啊

lucene有没有进行精确匹配的搜索方法,就像在数据库中查询字段=值
1 楼 yaozhan189 2008-12-18  
数字的范围查询
这个方法对我有用,谢谢分享

相关推荐

Global site tag (gtag.js) - Google Analytics