不为失败找理由,要为成功找方法。

python 获取ES一个小时内的数据统计点击数有一万多,但具体信息只显示10条,怎么解决?

Elasticsearch | 作者 fengzi01 | 发布于2016年09月13日 | 阅读数:12365

系统提示:这个人太懒了,什么问题描述都没有写!

已邀请:
如果你用的是search api的话
我猜你的size参数用的默认值10
size – Number of hits to return (default: 10)

haohao

赞同来自: wudoz Edward G

用python es API的helpers scan滚动查询,它内部已经把滚动查询实现了,之间调用API就行了,返回的是字典类型,使用举例如下:
def query_data(es, index, body, scroll='1m', request_timeout=60):
"""
查询符合条件的日志数据
:param es: es客户端对象
:param index: 索引名,支持通配符匹配
:param body: 查询串
:param scroll: 滚动查询窗口
:param request_timeout: 每次scan查询超时时间
:return: 返回查询到的原始json数据
"""
# 滚动查询出所有符合条件的数据,滚动查询适合高效查询大批量数据,默认查询只显示前10条数据
result = helpers.scan(
client=es,
query=body,
scroll=scroll,
index=index,
request_timeout=request_timeout
)
return result
 
 

Wenbo Yang - https://www.linkedin.com/in/yangwenbo214

赞同来自: laoyang360

你不特殊设置 size 参数,默认返回10 个hits 这个是没问题的。你可以查下api中size的设置即可。

laoyang360 - Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:https://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

同上,两个参数:size代表返回条数。
from代表起始位置。

mersap

赞同来自:

size 
 

要回复问题请先登录注册