关于kubernetes及其运行负载的HA一些思考

来自三线的随记

简记

  1. etcd要跟OS盘物理上隔离开。避免有用户在OS盘上进行传输下载文件等操作,导致disk latency增高致使apiserver判定etcd不健康
  2. etcd要跟容器盘物理上隔离开。同理避免空间占用大的镜像在pull的时候导致disk latency增高致使apiserver判定etcd不健康
  3. apiserver 要同时连接着一个以上的etcd
  4. 应用运行编排上toleration对于noschedule 和noexecute的时间可以保持默认,如果修改的话不建议小于两分钟,避免节点上大量容器在某些因素下批量重建销毁导致kubelet判定节点pleg,k8s自动打上污点后立刻触发容器驱逐