1. 了解Solr

  Solr是一个独立的企业级搜索应用服务器,对外提供API接口。用户可以通过HTTP请求向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过HTTP GET操作提出查找请求, 并得到XML格式的返回结果。Solr现在支持多种返回结果。

2. 安装配置Solr

  2.1Solr安装

  (1)访问镜像网站,下载Solr压缩包。

  (2)在下载完成后解压文件,在“cmd”控制台进入”solr/bin”目录下,输入”solr start” 命令启动Solr。

  如果出现以下提示,则表示成功启动。

  Waiting up to 30 to see Solr running on port 8983
  Started Solr server on port 8983. Happy searching!

  (3)访问 http://localhost:8983/solr 就可以看到已经启动了。

常用命令如下。

  • 停止:”solr stop -p 8983″ 或 “solr stop – all”。
  • 查看运行状态:solr status

  2.2 Solr配置

  (1)进入Solr 的安装目录下的server/solr/,创建一个名字为new_core的文件夹。

  (2)将 conf 目录(在安装目录/server/solr/configsets/sample_techproducts_configs 下) 复制到new_core目录下。

  (3)访问 “http://localhost:8983/solr/#/”

    单击导航栏的“Core Admin”,在弹出窗口中单击“Add Core”命令,弹出如图13-8所示的对话框,输入名字和目录名,再单击“Add Core”按钮,完成创建。

  

图 13-8

3. 整合 Spring Boot 和 Solr

  (1)添加依赖,见以下代码:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-solr</artifactId>
</dependency>

  (2)写入Solr配置

spring:
  data:
    solr:
      host: http://localhost:8983/solr/new_core

实例:

  1.创建 User 类

  User类必须继承可序列化接口,见以下代码:

package com.intehel.demo.domain;

import lombok.Data;
import org.apache.solr.client.solrj.beans.Field;
import java.io.Serializable;

@Data
public class User implements Serializable {
    @Field("id")
    private String id;
    @Field("name")
    private String name;
}

  2. 测试增加、删除、修改和查询功能

  (1)测试増加功能

@RequestMapping("/addUser")
public String addUser() throws IOException, SolrServerException {
    User user = new User();
    user.setId("155371");
    user.setName("鸡蛋火腿饼");
    solrClient.addBean(user);
    UpdateResponse commit = solrClient.commit();
    return commit.toString();
}

  (2)测试増加功能,根据id查询刚刚添加的内容,见以下代码:

@RequestMapping("/getByIdFromSolr/{id}")
public String getByIdFromSolr(@PathVariable String id) throws IOException, SolrServerException {
    //根据id查询内容
    SolrDocument solrDocument = solrClient.getById(id);
    //获取filedname
    Collection<String> filedname = solrDocument.getFieldNames();
    Map<String, Object> filedValueMap = solrDocument.getFieldValueMap();
    List<SolrDocument> childDocuments = solrDocument.getChildDocuments();
    String result = solrDocument.toString();
    return result;
}

  (3)测试修改功能,根据id修改内容,见以下代码:

@RequestMapping("/updateUser")
public String updateUser() throws IOException, SolrServerException {
    User user = new User();
    user.setId("155371");
    user.setName("烤冷面");
    solrClient.addBean(user);
    UpdateResponse commit = solrClient.commit();
    return commit.toString();
}

  所谓Solr的更新操作,就是对相同id的文档重新添加一次。修改之后,Version变得不一样了。

  (4)测试删除功能,根据id删除内容,见以下代码:

@RequestMapping("/deleteUser")
public String deleteUser() throws IOException, SolrServerException {
    UpdateResponse updateResponse = solrClient.deleteById("155371");
    long elapsedTime = updateResponse.getElapsedTime();
    int qTime = updateResponse.getQTime();
    //请求地址
    String requestUrl = updateResponse.getRequestUrl();
    //请求的结果
    NamedList<Object> response = updateResponse.getResponseHeader();
    //请求的状态
    solrClient.commit();
    int status = updateResponse.getStatus();
    //成功,则返回0,如果没有文档被删除也会返回0,代表根本没有
    return String.valueOf(status);
}

  (5)实现文档高亮显示,见以下代码:

@RequestMapping("/queryAll")
public String queryAll() throws IOException, SolrServerException {
    SolrQuery solrQuery = new SolrQuery();
    //设置默认搜索域
    solrQuery.setQuery("*.*");
    solrQuery.set("q","知然");
    solrQuery.add("q", "知然");
    //设置返回结果的排序规则
    solrQuery.setSort("id",SolrQuery.ORDER.asc);
    //设置查询的条数
    solrQuery.setRows(50);
    //设置查询的开始
    solrQuery.setStart(0);
    //设置分页参数
    solrQuery.setStart(0);
    solrQuery.setRows(20);
    //设置高亮
    solrQuery.setHighlight(true);
    //设置高亮的字段
    solrQuery.addHighlightField("name");
    //设置高亮的样式
    solrQuery.setHighlightSimplePre("<font color='red'>");
    solrQuery.setHighlightSimplePost("</font>");
    System.out.println(solrQuery);
    QueryResponse queryResponse = solrClient.query(solrQuery);
    Map<String, Map<String, List<String>>> highlightMap = queryResponse.getHighlighting();
    SolrDocumentList documents = queryResponse.getResults();
    long numFound = documents.getNumFound();
    System.out.println("查询到的文档数量"+numFound);
    for (SolrDocument document : documents) {
        System.out.println(document);
        System.out.println(document.get("name"));
    }
    System.out.println(highlightMap);
    return "true";
}

对比Elasticsearch和Solr:

  (1)Solr的优点。

  • Solr有一个更大、更成熟的用户、开发和页献者社区。
  • 支持添加多种格式的索引,如:HTML、PDF、微软Office系列软件格式,以及JSON、 XML、CSV等纯文本格式。
  • 比较成熟、稳定。
  • 搜索速度更快(不建索引时)。
  • Solr利用Zookeeper进行分布式管理,而Elasticsearch自身带有分布式协调管理功能。 如果项目本身使用了 Zookeeper,那Solr可能是最好选择。有时缺点在特点场景下可能会变成优点。
  • 如果项目后期升级,要朝着Hadoop这块发展,当数据量较大时,用Hadoop处理数据, Solr可以很方便地与Hadoop结合。

  (2)Elasticsearch 的优点。

  • Elasticsearch本身是分布式、分发实时的,不需要其他组件。
  • Elasticsearch完全支持Apache Lucene的接近实时的搜索。
  • 它处理多用户不需要特殊配置,而Solr则需要更多的高级设置。
  • Elasticsearch采用Gateway的槪念,备份更加简单。各节点组成对等的网络结构,某节点出现故障会自动分配其他节点代替其进行工作。

  (3)Solr的缺点。

  • 建立索引时,搜索效率下降,实时索引搜索效率不高。
  • 实时搜索应用效率明显低于Elasticsearch.

  (4)Elasticsearch 的缺点。

  • 没有Solr的生态系统发达。
  • 仅支持JSON文件格式。
  • 本身更注重核心功能,高级功能多由第三方插件提供。

总结:Solr是传统搜索应用的有力解决方案,但Elasticsearch更适用于新兴的实时搜索应用。