Qué es el balanceo de carga y cómo funciona

BeoHosting Team·24. decembar 2025.·9 min de lectura de lectura

Qué es el balanceo de carga

El balanceo de carga es una técnica para distribuir el tráfico de red. Resulta especialmente relevante para los usuarios de servidores dedicados. Consiste en distribuir el tráfico entre varios servidores para garantizar alta disponibilidad, fiabilidad y un rendimiento óptimo de las aplicaciones. Imagina un balanceador de carga como un agente de tráfico situado delante de un grupo de servidores que dirige cada petición entrante al servidor que en ese momento está menos cargado. Sin un balanceador de carga, un solo servidor debe gestionar todo el tráfico y, cuando alcanza su capacidad, el sitio se vuelve lento o queda completamente inaccesible. Con un balanceador de carga, la carga se distribuye de forma equilibrada y, si un servidor falla, los demás asumen su trabajo sin interrupciones para los usuarios.

El balanceo de carga es la base de la infraestructura web moderna. Todas las grandes plataformas web —Google, Facebook, Amazon, Netflix— utilizan sofisticados sistemas de balanceo de carga. Pero el balanceo de carga no está reservado solo a los gigantes: cualquier sitio con tráfico creciente o con un requisito de alta disponibilidad puede beneficiarse de esta tecnología. Con el auge del cloud hosting, el balanceo de carga se ha vuelto accesible para las pequeñas y medianas empresas a precios razonables.

Tipos de balanceadores de carga

Balanceo de carga de capa 4

Un balanceador de carga de capa 4 (L4) opera en la capa de transporte del modelo OSI y toma decisiones de enrutamiento basándose en direcciones IP y puertos, sin acceso al contenido del tráfico. Cuando llega una petición, el balanceador L4 redirige toda la conexión TCP o UDP a un servidor backend seleccionado. Las ventajas de los balanceadores L4 son una velocidad excepcional, ya que no analizan el contenido de los paquetes, menores requisitos de recursos y la capacidad de balancear cualquier tipo de tráfico, no solo HTTP. Se utiliza en escenarios en los que basta con la simple distribución del tráfico sin necesidad de un enrutamiento inteligente basado en la URL o las cabeceras.

Balanceo de carga de capa 7

Un balanceador de carga de capa 7 (L7) opera en la capa de aplicación y entiende el protocolo HTTP. Esto le permite enrutar de forma inteligente según la URL, las cabeceras HTTP, las cookies, el tipo de contenido y otros atributos de la petición. Por ejemplo, el balanceador L7 puede enrutar las peticiones de imágenes a servidores optimizados para contenido estático, las peticiones de API a servidores de aplicaciones y las conexiones websocket a servidores configurados para conexiones de larga duración. Los balanceadores L7 también pueden realizar terminación SSL (descifrar HTTPS en el balanceador), compresión de contenido y almacenamiento en caché. La mayoría de las aplicaciones web modernas utilizan balanceo de carga L7.

Balanceo de carga global de servidores

El GSLB (Global Server Load Balancing) distribuye el tráfico entre servidores situados en distintas ubicaciones geográficas. Utiliza el DNS para enrutar a los usuarios al centro de datos más cercano según su ubicación geográfica, la latencia o el estado de los servidores. Por ejemplo, los usuarios de España se enrutan al centro de datos europeo, mientras que los usuarios de EE. UU. van al estadounidense. El GSLB es clave para las aplicaciones globales que requieren baja latencia en todo el mundo y proporciona recuperación ante desastres: si un centro de datos completo queda inaccesible, el tráfico se redirige automáticamente a otro.

Algoritmos de distribución del tráfico

Round Robin

Round Robin es el algoritmo más sencillo: distribuye las peticiones de forma secuencial, en orden, entre los servidores disponibles. La primera petición va al servidor 1, la segunda al servidor 2, la tercera al servidor 3, luego de vuelta al servidor 1, y así sucesivamente. La ventaja es la absoluta sencillez de implementación y la previsibilidad de la distribución. El inconveniente es que no tiene en cuenta la carga actual del servidor: un servidor que procesa una operación pesada recibe el mismo número de peticiones nuevas que uno que está inactivo. La variante Weighted Round Robin asigna distintos pesos a los servidores en proporción a sus capacidades, de modo que los servidores más potentes reciben más peticiones.

Least Connections

El algoritmo Least Connections enruta cada nueva petición al servidor que en ese momento tiene menos conexiones activas. Es más inteligente que Round Robin porque tiene en cuenta la carga real. Si un servidor procesa peticiones de larga duración mientras otro finaliza rápidamente peticiones cortas, Least Connections enrutará más peticiones al servidor más rápido. Weighted Least Connections combina este enfoque con coeficientes de peso para servidores de distinta capacidad. Este algoritmo es ideal para aplicaciones con peticiones de duración variable.

IP Hash

El algoritmo IP Hash calcula un valor hash a partir de la dirección IP del cliente y lo utiliza para determinar el servidor. Esto garantiza que las peticiones del mismo cliente vayan siempre al mismo servidor, algo importante para aplicaciones que almacenan la sesión en el servidor (persistencia de sesión). Sin IP Hash o un mecanismo similar, un usuario puede ser trasladado a otro servidor que no tiene su sesión, lo que provoca la pérdida del carrito de la compra o que se le pida volver a iniciar sesión. La alternativa moderna es utilizar un almacenamiento centralizado de sesiones con Redis, eliminando la necesidad de persistencia de sesión a nivel del balanceador de carga.

Least Response Time

Este algoritmo combina el menor número de conexiones con el menor tiempo de respuesta. La petición se enruta al servidor con menos conexiones activas y el menor tiempo medio de respuesta. Es el enfoque más inteligente, porque tiene en cuenta tanto la carga como el rendimiento de cada servidor. Si un servidor tiene discos más rápidos o más RAM, tendrá de forma natural tiempos de respuesta más cortos y recibirá proporcionalmente más peticiones. Requiere la monitorización de las respuestas de cada servidor, lo que añade una pequeña sobrecarga, pero ofrece resultados óptimos.

Balanceadores de carga de hardware frente a software

Balanceadores de carga de hardware

Los balanceadores de carga de hardware son dispositivos especializados diseñados exclusivamente para la distribución del tráfico. Fabricantes como F5 Networks (BIG-IP), Citrix (NetScaler) y A10 Networks ofrecen dispositivos capaces de gestionar millones de conexiones por segundo con una latencia extremadamente baja. Las ventajas son un rendimiento predecible, hardware dedicado y funciones avanzadas como descarga SSL, protección frente a DDoS y un firewall de aplicaciones. El inconveniente es su elevado coste: los balanceadores de carga de hardware cuestan desde unos pocos miles hasta cientos de miles de euros, además de los costes de mantenimiento y licencias.

Balanceadores de carga de software

Los balanceadores de carga de software se instalan en servidores estándar y ofrecen flexibilidad, menores costes y facilidad de escalado. Las soluciones de código abierto más populares son Nginx, que es a la vez servidor web y balanceador de carga con un rendimiento excelente; HAProxy, especializado en balanceo de carga con una fiabilidad excepcional y baja latencia; y Traefik, un balanceador de carga moderno diseñado para entornos en contenedores como Docker y Kubernetes. Los proveedores de cloud ofrecen balanceadores de carga gestionados como servicio, eliminando la necesidad de administrar la infraestructura.

Balanceadores de carga en la nube

AWS Elastic Load Balancer, Google Cloud Load Balancing y Azure Load Balancer son servicios gestionados que ofrecen balanceo de carga sin tener que administrar hardware ni software. Escalan automáticamente con tu tráfico, se integran con otros servicios en la nube y pagas por lo que utilizas. Para la mayoría de las aplicaciones modernas, los balanceadores de carga en la nube son una elección óptima, porque eliminan la complejidad operativa, ofrecen alta disponibilidad con redundancia integrada y requieren una configuración mínima para empezar.

Cuándo necesitas un balanceador de carga

Escenarios de uso

Necesitas un balanceador de carga cuando un solo servidor no puede gestionar tu tráfico y el sitio se vuelve lento durante los picos, cuando necesitas alta disponibilidad y no puedes permitirte tiempos de inactividad, cuando tienes una aplicación crítica como una tienda de comercio electrónico en la que cada minuto de inactividad significa pérdida de ingresos, cuando quieres poder actualizar servidores sin interrumpir el servicio mediante despliegues progresivos (rolling deployment), o cuando tu tráfico varía notablemente y necesitas escalado dinámico.

Cuándo no se necesita un balanceador de carga

Para un sitio pequeño con tráfico moderado, un balanceador de carga aporta una complejidad y unos costes innecesarios. Si tu sitio recibe menos de 10 000 visitantes al día, un único servidor bien optimizado con caché es completamente suficiente. Antes de añadir un balanceador de carga, optimiza el servidor existente: implementa caché de páginas, optimiza la base de datos, utiliza una CDN para los archivos estáticos y comprime las imágenes. Estas optimizaciones a menudo eliminan la necesidad de un balanceador de carga y resultan mucho más baratas.

Comprobaciones de estado y failover

Comprobaciones de estado activas: el balanceador de carga envía periódicamente peticiones a los servidores backend para comprobar si están activos y funcionales, normalmente una petición HTTP GET a un endpoint concreto.
Comprobaciones de estado pasivas: el balanceador de carga supervisa las respuestas de los servidores durante el tráfico normal y detecta errores sin peticiones especiales.
Failover automático: cuando un servidor no supera la comprobación de estado, se retira automáticamente de la rotación y el tráfico se redirige a los servidores restantes.
Recuperación gradual: cuando un servidor vuelve a estar sano, se reincorpora gradualmente a la rotación con menos peticiones para evitar una carga repentina.
Comprobaciones de estado personalizadas: más allá de la comprobación HTTP básica, configura comprobaciones específicas para tu aplicación: estado de la base de datos, disponibilidad de APIs externas y espacio libre en disco.

Conclusión

El balanceo de carga es una técnica fundamental para construir aplicaciones web fiables y escalables. Desde el sencillo algoritmo Round Robin hasta los sofisticados balanceadores L7 con enrutamiento inteligente, existe una solución para cada presupuesto y necesidad. Los balanceadores de carga de software como Nginx y HAProxy han democratizado esta tecnología, haciéndola accesible para todo el mundo. En BeoHosting ofrecemos cloud hosting con capacidad de balanceo de carga para sitios que requieren alta disponibilidad, y nuestro equipo puede ayudarte a configurar la infraestructura óptima para tus necesidades concretas.

Qué es el balanceo de carga y cómo funciona