Как оптимизировать Django запросы к базе данных

Оптимизация запросов Django ORM

Неэффективные запросы к базе данных - главная причина медленной работы Django приложений. Правильная оптимизация может ускорить работу в 10-100 раз.

Проблема N+1 запросов

N+1 проблема возникает когда для каждого объекта в QuerySet выполняется дополнительный запрос для получения связанных данных.

# Неправильно - N+1 запросов
books = Book.objects.all()
for book in books:
    print(f"{book.title} - {book.author.name}")  # Каждый раз новый запрос!

# Правильно - используем select_related
books = Book.objects.select_related('author').all()
for book in books:
    print(f"{book.title} - {book.author.name}")  # Автор уже загружен

Практические примеры оптимизации

1. Оптимизация ForeignKey связей (select_related)

# Модели для примера
class Author(models.Model):
    name = models.CharField(max_length=100)
    email = models.EmailField()
    bio = models.TextField()

class Book(models.Model):
    title = models.CharField(max_length=200)
    author = models.ForeignKey(Author, on_delete=models.CASCADE)
    published_date = models.DateField()
    price = models.DecimalField(max_digits=10, decimal_places=2)

class Review(models.Model):
    book = models.ForeignKey(Book, on_delete=models.CASCADE)
    reviewer_name = models.CharField(max_length=100)
    rating = models.IntegerField()
    comment = models.TextField()

# Неоптимизированный код
books = Book.objects.all()
for book in books:
    print(f"Книга: {book.title}")
    print(f"Автор: {book.author.name}")  # N+1 запрос!
    print(f"Email автора: {book.author.email}")  # Еще один запрос!
    print("---")

# Оптимизированный код с select_related
books = Book.objects.select_related('author').all()
for book in books:
    print(f"Книга: {book.title}")
    print(f"Автор: {book.author.name}")  # Данные уже загружены
    print(f"Email автора: {book.author.email}")  # Данные уже загружены
    print("---")

# Глубокие связи (несколько уровней)
reviews = Review.objects.select_related('book__author').all()
for review in reviews:
    print(f"Отзыв на книгу: {review.book.title}")
    print(f"Автор: {review.book.author.name}")  # Все данные загружены одним запросом
    print(f"Рейтинг: {review.rating}")
    print("---")

2. Оптимизация ManyToMany связей (prefetch_related)

# Модели с ManyToMany
class Category(models.Model):
    name = models.CharField(max_length=100)
    description = models.TextField()

class Book(models.Model):
    title = models.CharField(max_length=200)
    author = models.ForeignKey(Author, on_delete=models.CASCADE)
    categories = models.ManyToManyField(Category)
    published_date = models.DateField()

# Неоптимизированный код
books = Book.objects.all()
for book in books:
    print(f"Книга: {book.title}")
    for category in book.categories.all():  # N+1 запрос!
        print(f"  Категория: {category.name}")
    print("---")

# Оптимизированный код с prefetch_related
books = Book.objects.prefetch_related('categories').all()
for book in books:
    print(f"Книга: {book.title}")
    for category in book.categories.all():  # Данные уже загружены
        print(f"  Категория: {category.name}")
    print("---")

# Комбинирование select_related и prefetch_related
books = Book.objects.select_related('author').prefetch_related('categories').all()
for book in books:
    print(f"Книга: {book.title}")
    print(f"Автор: {book.author.name}")  # ForeignKey - select_related
    for category in book.categories.all():  # ManyToMany - prefetch_related
        print(f"  Категория: {category.name}")
    print("---")

3. Оптимизация с помощью only() и defer()

# Загружаем только нужные поля
# Полезно для больших текстовых полей или когда нужны только определенные данные

# Загружаем только title и author__name
books = Book.objects.select_related('author').only('title', 'author__name').all()
for book in books:
    print(f"{book.title} - {book.author.name}")
    # book.description будет недоступно (вызовет ошибку)
    # book.author.email будет недоступно

# Откладываем загрузку больших полей
books = Book.objects.defer('description', 'content').all()
for book in books:
    print(f"Название: {book.title}")
    # book.description загрузится только при обращении к нему

# Комбинирование only и defer
books = Book.objects.only('title', 'author__name').defer('author__bio').all()
for book in books:
    print(f"{book.title} - {book.author.name}")
    # author.bio будет загружено только при обращении

4. Оптимизация агрегации и аннотаций

from django.db.models import Count, Sum, Avg, Max, Min

# Неоптимизированный код
authors = Author.objects.all()
for author in authors:
    book_count = author.book_set.count()  # N+1 запрос!
    total_price = sum(book.price for book in author.book_set.all())  # Еще N+1 запрос!
    print(f"{author.name}: {book_count} книг, общая стоимость: {total_price}")

# Оптимизированный код с annotate
authors = Author.objects.annotate(
    book_count=Count('book'),
    total_price=Sum('book__price'),
    avg_price=Avg('book__price'),
    max_price=Max('book__price'),
    min_price=Min('book__price')
).all()

for author in authors:
    print(f"{author.name}: {author.book_count} книг")
    print(f"  Общая стоимость: {author.total_price or 0}")
    print(f"  Средняя цена: {author.avg_price or 0}")
    print(f"  Максимальная цена: {author.max_price or 0}")
    print(f"  Минимальная цена: {author.min_price or 0}")
    print("---")

# Группировка по категориям
category_stats = Category.objects.annotate(
    book_count=Count('book'),
    avg_price=Avg('book__price')
).filter(book_count__gt=0).order_by('-book_count')

for category in category_stats:
    print(f"Категория: {category.name}")
    print(f"  Книг: {category.book_count}")
    print(f"  Средняя цена: {category.avg_price or 0}")
    print("---")

5. Оптимизация с помощью bulk операций

# Неоптимизированное создание объектов
for i in range(1000):
    Book.objects.create(
        title=f'Книга {i}',
        author=author,
        published_date='2024-01-01',
        price=10.00
    )  # 1000 отдельных INSERT запросов!

# Оптимизированное создание с bulk_create
books_to_create = []
for i in range(1000):
    books_to_create.append(Book(
        title=f'Книга {i}',
        author=author,
        published_date='2024-01-01',
        price=10.00
    ))

Book.objects.bulk_create(books_to_create)  # Один запрос для всех книг!

# Bulk обновление
books = Book.objects.filter(price__lt=20.00)
for book in books:
    book.price = book.price * 1.1  # Увеличиваем цену на 10%

Book.objects.bulk_update(books, ['price'])  # Один UPDATE запрос!

# Bulk удаление
old_books = Book.objects.filter(published_date__year__lt=2020)
old_books.delete()  # Один DELETE запрос!

6. Оптимизация с помощью raw SQL

# Когда ORM не справляется со сложными запросами
from django.db import connection

# Сложный запрос с JOIN и подзапросами
with connection.cursor() as cursor:
    cursor.execute("""
        SELECT
            a.name as author_name,
            COUNT(b.id) as book_count,
            AVG(b.price) as avg_price,
            SUM(b.price) as total_revenue
        FROM myapp_author a
        LEFT JOIN myapp_book b ON a.id = b.author_id
        WHERE b.published_date >= '2020-01-01'
        GROUP BY a.id, a.name
        HAVING COUNT(b.id) > 5
        ORDER BY total_revenue DESC
    """)

    results = cursor.fetchall()
    for row in results:
        print(f"Автор: {row[0]}")
        print(f"  Книг: {row[1]}")
        print(f"  Средняя цена: {row[2]}")
        print(f"  Общий доход: {row[3]}")
        print("---")

# Или используй raw() для моделей
books = Book.objects.raw("""
    SELECT b.*, a.name as author_name
    FROM myapp_book b
    JOIN myapp_author a ON b.author_id = a.id
    WHERE b.price > %s
    ORDER BY b.published_date DESC
""", [20.00])

for book in books:
    print(f"{book.title} - {book.author_name}")

Профилирование и мониторинг запросов

Настройка логирования SQL запросов

# settings.py
LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'handlers': {
        'console': {
            'class': 'logging.StreamHandler',
        },
    },
    'loggers': {
        'django.db.backends': {
            'handlers': ['console'],
            'level': 'DEBUG',
        },
    },
}

# Или используй django-debug-toolbar для разработки
INSTALLED_APPS = [
    'debug_toolbar',
]

MIDDLEWARE = [
    'debug_toolbar.middleware.DebugToolbarMiddleware',
]

INTERNAL_IPS = [
    '127.0.0.1',
]

Мониторинг производительности в коде

import time
from django.db import connection

# Функция для измерения времени выполнения запросов
def measure_queries(func):
    def wrapper(*args, **kwargs):
        initial_queries = len(connection.queries)
        start_time = time.time()

        result = func(*args, **kwargs)

        end_time = time.time()
        final_queries = len(connection.queries)

        print(f"Функция {func.__name__}:")
        print(f"  Время выполнения: {end_time - start_time:.4f} секунд")
        print(f"  Количество запросов: {final_queries - initial_queries}")
        print(f"  Общее время SQL: {sum(float(q['time']) for q in connection.queries[initial_queries:final_queries]):.4f} секунд")

        return result
    return wrapper

# Использование декоратора
@measure_queries
def get_books_with_authors():
    return Book.objects.select_related('author').all()

@measure_queries
def get_books_without_optimization():
    return Book.objects.all()

# Сравниваем производительность
print("С оптимизацией:")
books1 = get_books_with_authors()

print("\nБез оптимизации:")
books2 = get_books_without_optimization()

Создание и использование индексов

Добавление индексов в модели

class Book(models.Model):
    title = models.CharField(max_length=200, db_index=True)  # Индекс для поиска
    author = models.ForeignKey(Author, on_delete=models.CASCADE, db_index=True)
    published_date = models.DateField(db_index=True)  # Индекс для фильтрации по дате
    price = models.DecimalField(max_length=10, decimal_places=2, db_index=True)
    isbn = models.CharField(max_length=13, unique=True)  # Уникальный индекс

    class Meta:
        # Составной индекс для часто используемых комбинаций
        indexes = [
            models.Index(fields=['author', 'published_date']),
            models.Index(fields=['price', 'published_date']),
            # Индекс для полнотекстового поиска (PostgreSQL)
            models.Index(fields=['title'], name='book_title_gin_idx'),
        ]

# Создание индекса через миграцию
class Migration(migrations.Migration):
    dependencies = [
        ('myapp', '0001_initial'),
    ]

    operations = [
        migrations.AddIndex(
            model_name='book',
            index=models.Index(
                fields=['author', 'published_date'],
                name='book_author_date_idx'
            ),
        ),
    ]

Анализ использования индексов

# PostgreSQL - анализ запроса
from django.db import connection

with connection.cursor() as cursor:
    cursor.execute("""
        EXPLAIN (ANALYZE, BUFFERS)
        SELECT * FROM myapp_book
        WHERE author_id = 1 AND published_date > '2020-01-01'
    """)

    plan = cursor.fetchall()
    for row in plan:
        print(row[0])

# MySQL - анализ запроса
with connection.cursor() as cursor:
    cursor.execute("""
        EXPLAIN FORMAT=JSON
        SELECT * FROM myapp_book
        WHERE author_id = 1 AND published_date > '2020-01-01'
    """)

    plan = cursor.fetchall()
    print(plan)

Кэширование запросов

Настройка кэширования

# settings.py
CACHES = {
    'default': {
        'BACKEND': 'django.core.cache.backends.redis.RedisCache',
        'LOCATION': 'redis://127.0.0.1:6379/1',
    }
}

# Кэширование в коде
from django.core.cache import cache
from django.views.decorators.cache import cache_page

# Кэширование view
@cache_page(60 * 15)  # Кэш на 15 минут
def book_list(request):
    books = Book.objects.select_related('author').all()
    return render(request, 'books/list.html', {'books': books})

# Кэширование QuerySet
def get_popular_books():
    cache_key = 'popular_books'
    books = cache.get(cache_key)

    if books is None:
        books = Book.objects.select_related('author').annotate(
            review_count=Count('review')
        ).order_by('-review_count')[:10]

        # Кэшируем на 1 час
        cache.set(cache_key, books, 60 * 60)

    return books

# Кэширование с версионированием
def get_author_books(author_id):
    cache_key = f'author_books_{author_id}'
    books = cache.get(cache_key)

    if books is None:
        books = Book.objects.filter(author_id=author_id).select_related('author')
        cache.set(cache_key, books, 60 * 30)  # 30 минут

    return books

# Инвалидация кэша при изменении данных
def invalidate_author_cache(author_id):
    cache_key = f'author_books_{author_id}'
    cache.delete(cache_key)

Лучшие практики оптимизации

Всегда используй select_related для ForeignKey - это самый простой способ избежать N+1
Используй prefetch_related для ManyToMany - загружай связанные объекты одним запросом
Применяй only() и defer() для больших полей - загружай только нужные данные
Используй bulk операции для массовых изменений - это в разы быстрее
Создавай индексы для часто фильтруемых полей - особенно для дат и внешних ключей
Кэшируй часто запрашиваемые данные - используй Redis или Memcached
Профилируй запросы в development - используй django-debug-toolbar
Мониторь производительность в production - следи за временем выполнения запросов

Частые ошибки и их решения

Ошибка: "FieldError: Cannot resolve keyword"

# Проблема: неправильное использование select_related
# Неправильно
books = Book.objects.select_related('categories').all()  # Ошибка!

# Правильно
books = Book.objects.prefetch_related('categories').all()  # ManyToMany требует prefetch_related

Ошибка: "QuerySet is not iterable"

# Проблема: использование only() с полями, которые не загружены
books = Book.objects.only('title').all()

# Неправильно
for book in books:
    print(book.author.name)  # Ошибка! author не загружен

# Правильно
books = Book.objects.select_related('author').only('title', 'author__name').all()
for book in books:
    print(book.author.name)  # Работает

FAQ

Q: Когда использовать select_related?
A: Для ForeignKey и OneToOneField когда нужны связанные объекты. Это загружает данные одним JOIN запросом.

Q: Когда использовать prefetch_related?
A: Для ManyToManyField и reverse ForeignKey. Это загружает связанные объекты отдельным запросом.

Q: Как определить N+1 проблему?
A: Включи логирование SQL запросов и посмотри на количество запросов при итерации по QuerySet.

Q: Когда использовать raw SQL?
A: Для сложных запросов, которые сложно выразить через ORM, или когда нужна максимальная производительность.

Q: Как оптимизировать поиск по тексту?
A: Используй полнотекстовый поиск PostgreSQL, создавай GIN индексы для текстовых полей.

Q: Можно ли кэшировать QuerySet?
A: Да, но лучше кэшировать результаты, а не сам QuerySet. Используй cache.get() и cache.set().