snrg.net
当前位置:首页 >> luCEnE与solr >>

luCEnE与solr

Lucene是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言).Lucene的目的是为软件开发人员提供

solr是对lucene的封装,底层还是调用的lucene的方法,它只是让lucene使用起来更简单了,并没有什么本质上的区别.前段时间刚用solr做了个项目,发现solr提供的集群解决方案让我省不少麻烦,facet部分也是挺实用的. 个人认为,当solr能满足需求的时候,尽量使用solr,可以极大的缩短研发周期.如果是比较复杂的大型项目,有solr无法实现的业务场景,那么就只能选择lucene了……

apache lucene是apache下一个著名的开源搜索引擎内核,基于Java技术,处理索引,拼写检查,点击高亮和其他分析,分词等技术.nutch和solr原来都是lucene下的子项目.但后来nutch独立成为独立项目.nutch是2004年由俄勒冈州立大学开

ICTCLAS 中科院做的 效果巨棒如 runbaike所说的客户数的问题 只要加userDic 没有解决不了了完全可以按照你的需要把某些词分出来 不过在lucene中用ICTCLAS有点小难度 其次就推荐IK了 最新的3.2版本对lucene3.x的集成效果蛮不错 而且也支持用户词典了

solr+hadoop(elasticsearch和solr类似,有hadoop模块,你也可以试试)在不能满足需求的时候可以改底层的lucene

主流的全文索引工具有:Lucene , Sphinx , Solr , ElasticSearch.其中Solr和Elastic Search都是基于Lucene的.Sphinx不是 apache的项目,如果你想把Sphinx放到某个商业性的项目中,你就得买个商业许可证.

首先Solr是基于Lucene做的,Lucene是一套信息检索工具包,但并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能,因此在使用Lucene时

Lucene是索引,Nutch是完整的搜索引擎实现,是基于Lucene来实现的.可以这么理解,Lucene是一个基础的东西,主要用于建立数据的索引,通过开发人员自己调用Lucene api使用.Nutch是一个做好的成品,配置好后就是一个简单的百度,可以采集、搜索数据等等,Lucene是百度服务器上搜索操作时具体执行的代码.

solr+hadoop(elasticsearch和solr类似,有hadoop模块,你也可以试试)在不能满足需求的时候可以改底层的lucene

从两个方面对ElasticSearch和Solr进行对比,从关系型数据库中的导入速度和模糊查询的速度.单机对比1. Solr 发布了4.0-alpha,试了一下,发现需要自己修改schema,好处是它自带一个data importer.在自己的计算机上测试了一下,导入的性

网站首页 | 网站地图
All rights reserved Powered by www.snrg.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com