Как исправить Evicted статус в Kubernetes

Что такое Evicted?

Evicted статус означает, что под был удален из узла из-за проблем с ресурсами или taints.

Причины возникновения

Превышение лимитов ресурсов
Несоответствие taints
Проблемы с garbage collection
Отсутствие достаточных ресурсов на узле

Как отладить ошибку

Проверь логи пода - kubectl logs pod-name
Опиши под - kubectl describe pod pod-name
Проверь ресурсы - убедись в достаточности CPU и памяти
Проверь health checks - убедись в правильности liveness/readiness проб

Как исправить ошибку

1. Исправь ошибки в приложении

1# Проверь логи для выявления ошибок
2kubectl logs pod-name
3
4# Если под перезапускается, используй предыдущие логи
5kubectl logs pod-name --previous
6
7# Для получения детальной информации
8kubectl describe pod pod-name

2. Настрой правильные ресурсы

apiVersion: v1
kind: Pod
metadata:
  name: my-app
spec:
  containers:
  - name: app
    image: my-app:latest
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

3. Исправь health checks

apiVersion: v1
kind: Pod
metadata:
  name: my-app
spec:
  containers:
  - name: app
    image: my-app:latest
    livenessProbe:
      httpGet:
        path: /health
        port: 8080
      initialDelaySeconds: 30
      periodSeconds: 10
    readinessProbe:
      httpGet:
        path: /ready
        port: 8080
      initialDelaySeconds: 5
      periodSeconds: 5

4. Проверь переменные окружения

apiVersion: v1
kind: Pod
metadata:
  name: my-app
spec:
  containers:
  - name: app
    image: my-app:latest
    env:
    - name: DATABASE_URL
      value: "postgresql://user:pass@db:5432/mydb"
    - name: NODE_ENV
      value: "production"

Как мониторить подобные ошибки

Используй Prometheus и Grafana для мониторинга
Настрой алерты на CrashLoopBackOff
Логируй все ошибки приложений
Используй Kubernetes Events для отслеживания

FAQ

В: Как отличить CrashLoopBackOff от ImagePullBackOff?

О: CrashLoopBackOff возникает после успешного запуска контейнера, а ImagePullBackOff - при проблемах с загрузкой образа.

В: Что делать, если под не может подключиться к базе данных?

О: Проверь Service и Endpoints, убедись в правильности DNS имен и портов.

В: Как отладить проблемы с ConfigMap/Secret?

О: Используй kubectl describe pod для проверки монтирования и kubectl get configmap/secret.

Лучшие практики

Всегда добавляй health checks
Устанавливай разумные лимиты ресурсов
Логируй ошибки приложения
Используй readiness и liveness пробы
Тестируй приложение локально перед деплоем