高效码农

Elasticsearch7.2中文教程翻译(四):数据的修改、更新、删除、批处理

修改您的数据

Elasticsearch几乎实时提供数据操作和搜索功能。默认情况下,从索引/更新/删除数据到搜索结果中显示的时间,您可能会有一秒钟的延迟(刷新间隔)。这是与SQL等其他平台的重要区别,其中数据在事务完成后立即可用

索引/更换文档编辑
我们之前已经看到了如何索引单个文档。让我们再次回忆一下这个命令:

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

同样,上面将指定的文档索引到客户索引中,ID为1.如果我们再使用不同(或相同)的文档执行上述命令,Elasticsearch将替换(即重新索引)新文档。 ID为1的现有ID:

PUT /customer/_doc/1?pretty
{
  "name": "Jane Doe"
}

以上内容将ID为1的文档名称从“John Doe”更改为“Jane Doe”。另一方面,如果我们使用不同的ID,则将索引新文档,并且索引中已有的现有文档保持不变。

PUT /customer/_doc/2?pretty
{
  "name": "Jane Doe"
}

以上索引ID为2的新文档。

索引时,ID部分是可选的。如果未指定,Elasticsearch将生成随机ID,然后使用它来索引文档。Elasticsearch生成的实际ID(或前面示例中显式指定的内容)将作为索引API调用的一部分返回。

此示例显示如何在没有显式ID的情况下索引文档:

POST /customer/_doc?pretty
{
  "name": "Jane Doe"
}

请注意,在上面的情况中,我们使用POST动词而不是PUT,因为我们没有指定ID。

更新文档

除了能够索引和替换文档,我们还可以更新文档。请注意,Elasticsearch实际上并没有在引擎下进行就地更新。每当我们进行更新时,Elasticsearch都会删除旧文档,然后一次性对应用了更新的新文档编制索引。

此示例显示如何通过将名称字段更改为“Jane Doe”来更新以前的文档(ID为1):

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe" }
}

此示例显示如何通过将名称字段更改为“Jane Doe”来更新我们以前的文档(ID为1),同时为其添加年龄字段:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe", "age": 20 }
}

也可以使用简单脚本执行更新。此示例使用脚本将年龄增加5:

POST /customer/_update/1?pretty
{
  "script" : "ctx._source.age += 5"
}

在上面的示例中,ctx._source指的是即将更新的当前源文档。

Elasticsearch提供了在给定查询条件(如SQL UPDATE-WHERE语句)的情况下更新多个文档的功能。请参阅docs-update-by-queryAPI

删除文档

删除文档非常简单。此示例显示如何删除ID为2的以前的客户:

DELETE /customer/_doc/2?pretty

请参阅_delete_by_query API来删除与特定查询匹配的所有文档。值得注意的是,删除整个索引比使用delete By Query API删除所有文档要有效得多。

批处理

除了能够索引,更新和删除单个文档之外,Elasticsearch还提供了使用_bulkAPI批量执行上述任何操作的功能。此功能非常重要,因为它提供了一种非常有效的机制,可以尽可能快地进行多个操作,并尽可能少地进行网络往返。

作为一个简单的示例,以下调用在一个批量操作中索引两个文档(ID 1 - John Doe和ID 2 - Jane Doe):

POST /customer/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }

此示例更新第一个文档(ID为1),然后在一个批量操作中删除第二个文档(ID为2):

POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}

请注意,对于删除操作,之后没有相应的源文档,因为删除只需要删除文档的ID。

Bulk API不会因其中一个操作失败而失败。如果单个操作因任何原因失败,它将继续处理其后的其余操作。批量API返回时,它将为每个操作提供一个状态(按照发送的顺序),以便您可以检查特定操作是否失败。

当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »