ETCD 常见问题集锦
本文永久链接: https://www.xtplayer.cn/etcd/etcd-problem-sets/
客户端必须向 etcd leader 发送请求吗?
Raft is leader-based, leader 处理所有需要一致性的客户机请求。但客户端不需要知道哪个节点是 leader,所有发送给跟随者的一致性请求都会自动转发给 leader。不需要协商一致的请求(例如,序列化读取)可以由任何集群成员处理。
系统要求
由于 etcd 将数据写入磁盘,因此强烈建议使用 SSD 或者超高速磁盘来运行 etcd 服务。为防止性能下降或无意中存储空间耗尽,etcd 强制设置 2GB 默认存储大小配额,可以通过--quota-backend-bytes
配置配额,最高可配置为 8GB。空间配额用来保障集群可靠运行,如果没有限制配额,当键空间变大之后,直到耗尽磁盘空间。当任意节点超出空间配额,那么当前 etcd 服务将进入维护状态,只接受读/删
操作。只有释放了足够空间、去碎片化了后端数据库并且清理了空间配额之后,集群才能继续正常操作。
etcd 集群大小
从理论上讲,没有硬性限制。但是,一个 etcd 集群建议不超过七个节点。
Error from server: etcdserver: mvcc: database space exceeded
etcd 默认不会自动进行数据压缩,etcd 保存了 keys 的历史信息,数据频繁的改动会导致数据版本越来越多,相对应的数据库就会越来越大。etcd 数据库大小默认 2GB,当在 etcd 容器或者 Rancher ui 出现以下日志时,说明数据库空间占满,需要进行数据压缩腾出空间。
释放空间
登录 etcd 容器
在 etcd 主机上,执行以下命令登录 etcd 容器
docker exec -ti etcd sh
获取历史版本号:
在 etcd 容器执行以下命令
ver=$(etcdctl endpoint status --write-out="json" | egrep -o '"revision":[0-9]*' | egrep -o '[0-9].*')
压缩旧版本
etcdctl compact $ver
清理碎片
etcdctl defrag
以上 2-4 步,操作需在每个 etcd 容器中执行。
忽略 etcd 告警
通过执行etcdctl alarm list
可以查看 etcd 的告警情况,如果存在告警,即使释放了 etcd 空间,etcd 也处于只读状态。
在确定以上的操作均执行完毕后,在任意一个 etcd 容器中执行以下命令忽略告警:
etcdctl alarm disarm |