许多存储系统(例如MySQL)提供慢查询日志帮助开发和运维人员定位系统存在的慢操作。所谓慢查询日志就是系统在命令执行前后计算每条命令的执行时间,当超过预设阀值,就将这条命令的相关信息(例如:发生时间,耗时,命令的详细信息)记录下来,Redis也提供了类似的功能。
1.发送命令
2.排队
3.执行命令 -此处记录慢查询
4.返回结果
需要注意,慢查询只统计步骤3的时间,所以没有慢查询并不代表客户端没有超时问题。
慢查询的两个配置参数
对于慢查询功能,需要明确两件事:
·预设阀值怎么设置?
slowlog-log-slower-than 20000 #设置超时时间为20毫秒
·记录多少条日志?
slowlog-max-len 1000 #设置存储1000条日志记录。
·慢查询记录存放在哪?
#以key/value的形式存放于redis db中。
Redis提供了slowlog-log-slower-than和slowlog-max-len配置来解决这两个问题。从字面意思就可以看出,slowlog-log-slower-than就是那个预设阀值,它的单位是微秒(1秒=1000毫秒=1000000微秒),默认值是10000,假如执行了一条“很慢”的命令(例如keys*),如果它的执行时间超过了10000微秒,那么它将被记录在慢查询日志中。
运维提示:
如果slowlog-log-slower-than=0会记录所有的命令,slowlog-log-slower-than<0对于任何命令都不会进行记录。
在Redis中有两种修改配置的方法,一种是修改配置文件,另一种是使用config set命令动态修改。例如下面使用config set命令将slowlog-log-slower-than设置为20000微秒,slowlog-max-len设置为1000:
config set slowlog-log-slower-than 20000
config set slowlog-max-len 1000
config rewrite
虽然慢查询日志是存放在Redis内存列表中的,但是Redis并没有暴露这个列表的键,而是通过一组命令来实现对慢查询日志的访问和管理。下面介绍这几个命令。
获取慢查询日志:
slowlog get [n] #参数n可以指定条数
#例, slowlog get 1 ,获取一条慢查询日志。
慢查询日志含义:
127.0.0.1:6379> slowlog get
1) 1) (integer) 666 #-----------ID
2) (integer) 1456786500 #-----------发生的时间戳
3) (integer) 11615 #-----------查询的耗时(微妙),如表示本条命令查询耗时11615微秒
4) 1) "BGREWRITEAOF" #-----------执行命令和参数
可以看到每个慢查询日志有4个属性组成,分别是慢查询日志的标识id、发生时间戳、命令耗时、执行命令和参数,慢查询列表如图3-3所示。
获取慢查询日志列表当前的长度
slowlog len
慢查询日志重置
slowlog reset
最佳实践
Redis是单线程模型,因此32核心服务器安装32个实例,即一个核心一个实例。慢查询功能可以有效地帮助我们找到Redis可能存在的瓶颈,但在实际使用过程中要注意以下几点:
·slowlog-max-len配置建议:线上建议调大慢查询列表,记录慢查询时Redis会对长命令做截断操作,并不会占用大量内存。增大慢查询列表可以减缓慢查询被剔除的可能,例如线上可设置为1000以上。
·slowlog-log-slower-than配置建议:默认值超过10毫秒判定为慢查询,需要根据Redis并发量调整该值。由于Redis采用单线程响应命令,对于高流量的场景,如果命令执行时间在1毫秒以上,那么Redis最多可支撑OPS不到1000。因此对于高OPS场景的Redis建议设置为1毫秒。
·慢查询只记录命令执行时间,并不包括命令排队和网络传输时间。因此客户端执行命令的时间会大于命令实际执行时间。因为命令执行排队机制,慢查询会导致其他命令级联阻塞,因此当客户端出现请求超时,需要检查该时间点是否有对应的慢查询,从而分析出是否为慢查询导致的命令级联阻塞。
·由于慢查询日志是一个先进先出的队列,也就是说如果慢查询比较多的情况下,可能会丢失部分慢查询命令,为了防止这种情况发生,可以定期执行slow get命令将慢查询日志持久化到其他存储中(例如MySQL),然后可以制作可视化界面进行查询。
解释说明:
tps:Transactions Per Second,一般在事务系统之中,在mysql可以用tps.
qps:Queries Per Second,一般就是访问次数。
ops:Operates Per Second,一般是操作次数,与qps区别不大。