停更该有一个月了,今日开始续更。不过最近更新比较慢,在处理其他事情,慢慢恢复速度。那么开启正题吧!
今天给大家介绍一个运维当中非常非常核心的概念叫“高可用”。我们运维日常工作中,绝大程度上都是围绕着高可用来进行工作的。
可想而知,这三个字对我们运维工作者来说是多么的重要。但是在工作之前,我并没有对它有一个比较 深刻的认识,在工作之后,我才对它有一个比较深刻的认识。今天就来带大家来更好的理解运维高可用是怎么回事。
目录结构如下:
-
了解什么是高可用? -
对应高可用的处理方案是?
什么是高可用?
运维高可用(High Availability,简称 HA),用最直白的话讲就是:系统不宕机、服务不停服,就算硬件/软件挂了一部分,用户也完全感觉不到。
运维高可用会被拆分为三高。分别是高可用、高并发、高性能,没有高血压...

运维里常说的三高架构,也就是这三个:
-
高可用(HA)服务不宕机、无单点、故障自动切换,保证一直能用。 -
高并发能抗住大量用户同时访问、QPS 高、不卡不死,保证扛得住。 -
高性能响应快、耗资源少、吞吐量高,保证跑得稳、跑得快。
简单记:
-
高可用 = 不死 -
高并发 = 扛造 -
高性能 = 飞快

工作中通常用几个 9 来衡量高可用性:
-
99%:一年 downtime ≈ 3.65 天 -
99.9%:一年 downtime ≈ 8.76 小时 -
99.99%:一年 downtime ≈ 53 分钟 -
99.999%:一年 downtime ≈ 5 分钟
公司越大、业务越核心,要求的 9 越多。我们公司要求往99.99%靠拢,再往上难度就非常非常大。
对应高可用处理方案是?
明白了下面的三高的处理方案,我觉得你就不可能学不会运维,成为行业里面的大佬,都只是时间问题罢了。
高可用(HA),不宕机、不中断
目标:任何一个节点挂了,服务还能正常跑
解决方案:
-
消除单点故障:所有组件至少 2 实例 -
集群化:平台集群(如:K8s集群、OpenStack集群)、应用集群、数据库集群、中间件集群 -
负载均衡:Nginx/LVS/SLB 分发流量/F5硬件负载均衡 -
主从 + 自动切换:MySQL 主从、MGR、Redis Sentinel -
健康检查 + 自动摘除:故障节点自动踢出去 -
多可用区 / 多机房:AZ 容灾、异地多活。
高并发,扛得住大量请求
目标:扛住高 QPS、大流量、不崩不堵
解决方案:
-
扩容:水平扩容机器,加节点 -
缓存:Redis 缓存热点数据、页面缓存 -
读写分离:读请求走从库,写走主库 -
异步削峰:消息队列 Kafka/RocketMQ 异步处理 -
限流、降级、熔断:保护核心业务 -
静态资源分离:CDN + 对象存储
高性能,响应快、耗资源低
目标:接口快、CPU/内存低、吞吐量高
解决方案:
-
代码优化:慢 SQL、循环冗余、大对象 -
索引优化:MySQL 索引、慢查询优化 -
连接池:数据库、Redis 复用连接 -
JVM/GC 调优(Java) -
Nginx / 网络优化:长连接、压缩、缓冲区 -
硬件 / 内核优化:SSD、文件系统、TCP 参数
简单总结
-
高可用:集群、主从、负载均衡、自动切换 -
高并发:缓存、异步、扩容、读写分离 -
高性能:优化 SQL、索引、JVM、连接池、缓存
END
- THE END -
最后修改:2026年4月15日
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.qiuyl.com/xueyw/542



Abutogel: <a href=" https://abutowin.icu/# ">S...