服务器负载均衡原理详解

什么是 服务器负载 均衡

当你在手机上点外卖时，可能没意识到，背后有成千上万的用户同时在操作。如果所有请求都涌向一台服务器，那它很快就会瘫痪。为了解决这个问题，系统会部署多台服务器，并通过“负载均衡”把请求合理地分发出去。

负载均衡的核心作用

负载均衡就像餐厅里的领班，顾客一进门，他不会让所有人都挤在一张桌子，而是根据每张桌的空位和服务员的忙闲情况，合理安排座位。服务器也一样，负载均衡器负责把用户的请求分配给最合适的后端服务器，避免某一台过载而其他闲置。

常见的负载均衡策略

不同的场景需要不同的分配方式。以下是几种常见的算法：

轮询（Round Robin）

最简单的策略，按顺序把请求一个接一个地分给服务器。比如三台服务器A、B、C，第一个请求给A，第二个给B，第三个给C，第四个再回到A，如此循环。

加权轮询

现实中服务器性能往往不同。有的配置高，能处理更多请求。加权轮询允许我们给服务器设置权重。比如A权重为3，B为1，C为1，那么A会收到大约60%的请求，B和C各20%。

最少连接数

这个策略更智能。它不看顺序，而是实时查看哪台服务器当前正在处理的连接最少，就把新请求发给它。适合长连接或请求处理时间差异大的场景，比如视频直播。

IP哈希

根据用户的IP地址计算一个哈希值，决定分配到哪台服务器。同一个用户每次都会被分到同一台机器，适合需要会话保持的应用，比如购物车。

负载均衡的实现方式

负载均衡可以在不同层级实现。最常见的有硬件设备、软件网关，以及云服务商提供的服务。

比如Nginx就是一个广泛使用的软件负载均衡器。配置简单，性能也不错。下面是一个Nginx配置示例：

upstream backend {
    server 192.168.1.10:8080 weight=3;
    server 192.168.1.11:8080 weight=1;
    server 192.168.1.12:8080 weight=1;
}

server {
    listen 80;
    location / {
        proxy_pass http://backend;
    }
}

这段配置定义了一个名为backend的服务器组，使用加权轮询策略。Nginx监听80端口，收到请求后转发给后端服务器。

高可用与健康检查

负载均衡器不只是分发请求，还得确保后端服务器是健康的。它会定期发送探测请求，比如访问一个固定的/health接口。如果某台服务器连续几次没响应，就会被临时移出服务列表，等恢复后再加回来。

这种机制避免了把用户请求发给已经宕机的机器，提升了整体系统的稳定性。

负载均衡在网络中的位置

通常，用户先访问的是负载均衡器的公网IP，它位于整个服务集群的最前端，也叫“入口网关”。请求经过它之后，才会进入真正的业务服务器。

在大型系统中，还可能存在多层负载均衡。比如第一层按地域分发，第二层按服务类型分发，形成树状结构，应对复杂的流量调度需求。

服务器负载均衡原理详解 使用技巧与常见问题解析

什么是服务器负载均衡