近实时的分布式搜索引擎。可以进行全文检索、结构化搜索、分析。良好的扩展性,可以运行在单台笔记本,也可以扩展到上百台服务器,轻松支持PB级数据。
ES基于Lucene引擎,但是支持复杂的数据类型
使用倒排索引来支持全文检索
使用各种压缩算法来压缩存储,并进行多级索引,从而将搜索需要用到的数据结构加载进内存,主要操作内存化,减少磁盘IO,极大提升查询速率。
分布式存储,
number_of_replicas=2
(每个primary shard有两个副本)ES定位在大数据量场景下的查询搜索,相对传统关系型数据库而言,查询有显然的优势。但数据变更速率相对较慢,不过这不是核心的关注点。