Как исправить Pending статус в Kubernetes

Что такое состояние Pending?

Состояние Pending означает, что под был создан, но еще не назначен на узел кластера.

Причины возникновения

Недостаточно ресурсов на узлах
Проблемы с PersistentVolumeClaim
Конфликтующие node selectors
Проблемы с taints и tolerations
Отсутствие подходящих узлов

Как отладить ошибку

Проверь ресурсы узлов - kubectl describe nodes
Проверь PVC - убедись в доступности PersistentVolume
Проверь node selectors - убедись в правильности селекторов
Проверь taints и tolerations - убедись в совместимости

Как исправить ошибку

1. Добавь больше ресурсов

# Проверь доступные ресурсы
kubectl describe nodes

# Уменьши запросы ресурсов в pod
apiVersion: v1
kind: Pod
metadata:
  name: my-app
spec:
  containers:
  - name: app
    image: my-app:latest
    resources:
      requests:
        memory: "64Mi"  # уменьши если нужно
        cpu: "100m"     # уменьши если нужно

2. Исправь PVC проблемы

# Проверь статус PVC
kubectl get pvc
kubectl describe pvc my-pvc

# Создай PV если нужно
apiVersion: v1
kind: PersistentVolume
metadata:
  name: my-pv
spec:
  capacity:
    storage: 1Gi
  accessModes:
    - ReadWriteOnce
  hostPath:
    path: /data

3. Исправь node selectors

# Проверь labels узлов
kubectl get nodes --show-labels

# Исправь node selector в pod
apiVersion: v1
kind: Pod
metadata:
  name: my-app
spec:
  nodeSelector:
    disk: ssd  # убедись, что такой label есть на узле
  containers:
  - name: app
    image: my-app:latest

4. Добавь больше узлов

# Для managed кластеров (GKE, EKS, AKS)
# Увеличь количество узлов через консоль провайдера

# Для self-hosted кластеров
# Добавь новый узел в кластер

Как мониторить подобные ошибки

Мониторь использование ресурсов узлов
Настрой алерты на Pending поды
Отслеживай события планирования
Используй Kubernetes Events

FAQ

В: Как проверить, почему под не планируется?

О: Используй kubectl describe pod pod-name и посмотри на секцию Events.

В: Что делать, если все узлы заняты?

О: Добавь больше узлов в кластер или оптимизируй использование ресурсов.

В: Как исправить проблемы с taints?

О: Добавь соответствующие tolerations в pod или удали taints с узлов.

Лучшие практики

Устанавливай разумные запросы ресурсов
Используй Horizontal Pod Autoscaler
Мониторь использование ресурсов
Настрой правильные node selectors
Используй pod disruption budgets