Runbook на случай, когда консьюмер микросервиса крашится с ошибкой вида:
PRECONDITION_FAILED - inequivalent arg 'x-max-priority' for queue '<name>' in vhost '/': received the value '4' of type 'long' but current is none
Первый прецедент — 17.04.2026, очереди auth, location, otrs, social (562K сообщений суммарно, без консьюмеров в течение нескольких дней). OLV-3520, OLV-3521.
Если в код AmqpService::createQueue() добавили $queue→setArgument('x-max-priority', N), а существующая очередь в RabbitMQ объявлена без этого аргумента — declareQueue() падает с PRECONDITION_FAILED 406. Consumer не стартует, supervisor рестартует его в цикле, сообщения копятся.
Нельзя просто удалить очередь — все накопленные сообщения пропадут.
Правильный путь — shovel archive workflow (см. ниже). Минимизирует потери: сообщения идут в archive-очередь через binding, оттуда возвращаются в новую правильную очередь.
На примере очереди foo с routing keys key1, key2 в exchange event_bus.
Важно: bindings создаём до любых других действий. С этого момента любая новая публикация в event_bus по этим routing keys будет копироваться и в старую foo (без priority), и в новую foo_archive. Ни одно сообщение не пропадёт.
ssh root@srv-prod-postgre.olvr rabbitmqadmin -u admin -p admin declare queue name=foo_archive durable=true for rk in key1 key2; do rabbitmqadmin -u admin -p admin declare binding \ source=event_bus destination=foo_archive routing_key=$rk done
src-delete-after=queue-length фиксирует длину очереди на момент старта shovel и переносит ровно столько сообщений. Новые публикации уже идут параллельно в archive (через binding), поэтому «гонок» нет.
rabbitmqctl set_parameter shovel foo-drain '{
"src-uri":"amqp://admin:admin@localhost:5672/%2F",
"src-queue":"foo",
"src-delete-after":"queue-length",
"dest-uri":"amqp://admin:admin@localhost:5672/%2F",
"dest-queue":"foo_archive"
}'
Отслеживаем прогресс через HTTP API (rabbitmqctl под нагрузкой таймаутится):
curl -s -u admin:admin \ 'http://localhost:15672/api/queues/%2F/foo?columns=messages' curl -s -u admin:admin \ 'http://localhost:15672/api/queues/%2F/foo_archive?columns=messages'
Ждём пока foo дойдёт до 0.
rabbitmqctl clear_parameter shovel foo-drain rabbitmqadmin -u admin -p admin delete queue name=foo # Создаём новую с нужными аргументами ДО рестарта консьюмера # (чтобы не было гонки между declare консьюмера и нашим) rabbitmqadmin -u admin -p admin declare queue name=foo durable=true \ 'arguments={"x-max-priority":4}' for rk in key1 key2; do rabbitmqadmin -u admin -p admin declare binding \ source=event_bus destination=foo routing_key=$rk # И сразу снимаем binding с архива, чтобы новые публикации шли только в foo rabbitmqadmin -u admin -p admin delete binding \ source=event_bus destination_type=queue destination=foo_archive \ properties_key=$rk done
ssh root@srv-prod-app.olvr \ "docker exec tpark-it.back-foo.latest supervisorctl restart 'event-bus-consume:*'"
Проверяем что консьюмер подключился:
curl -s -u admin:admin \ 'http://localhost:15672/api/queues/%2F/foo?columns=name,consumers,arguments' # Ожидаем: consumers=1, arguments={"x-max-priority":4}
rabbitmqctl set_parameter shovel foo-restore '{
"src-uri":"amqp://admin:admin@localhost:5672/%2F",
"src-queue":"foo_archive",
"src-delete-after":"queue-length",
"dest-uri":"amqp://admin:admin@localhost:5672/%2F",
"dest-queue":"foo"
}'
Консьюмер (если он шустрый) будет разгребать foo параллельно с заливкой из архива — foo может оставаться около нуля, а foo_archive уменьшаться. Это норма.
rabbitmqctl clear_parameter shovel foo-restore rabbitmqadmin -u admin -p admin delete queue name=foo_archive
Не использовать dest-exchange — он теряет routing_key исходного сообщения при republish. Сообщения уйдут в event_bus (direct) с пустым routing key и тихо отбросятся как unrouted, потому что:
event_bus не настроен alternate-exchange.
17.04.2026 так потеряно 83 сообщения social.publication — безвозвратно.
Всегда использовать dest-queue (default exchange «» + routing_key = имя очереди). Консьюмер при обработке не смотрит на routing_key из envelope, ему всё равно.
В инциденте 17.04 в контейнерах back-auth и back-otrs кто-то вручную закомментировал $queue→setArgument(x-max-priority, …) в /app/vendor/t-park/api-bundle/src/EventBus/AmqpService.php — workaround без пересоздания очереди. Патч держится до первой пересборки образа и уйдёт с composer install.
Если вынуждены делать hot-patch:
~/work/olvery/olvery.ru/CLAUDE.md в разделе живого состояния, чтобы не потерять.
Под нагрузкой shovel (особенно для больших очередей — 500K+ сообщений) rabbitmqctl list_queues уходит в 60-секундный таймаут. Для мониторинга использовать HTTP API (http://localhost:15672/api/queues/…) — отвечает мгновенно.
docker exec tpark-it.back-foo.latest supervisorctl status — процесс event-bus-consume должен быть RUNNING с uptime > пары минут (если uptime всё время 0:00:00 — consumer крашится, смотреть логи).curl -s -u admin:admin http://localhost:15672/api/queues/%2F/foo — consumers >= 1, arguments содержат ожидаемые.docker exec tpark-it.back-foo.latest php /app/bin/console event-bus:consume –time-limit=3 -v — запустить руками в foreground, увидеть Event Bus Massage Consumed и отсутствие exceptions.auth)otrs)olvery/back-api-bundle:src/EventBus/AmqpService.php — где живёт setArgument('x-max-priority', …)~~DISCUSSION~~