от
Я использую
db.m5.xlarge
postgres 10,6 дБ на AWS RDS. 2 недели назад мы начали получать спорадические
(psycopg2.DatabaseError) SSL SYSCALL error: Connection timed out
и
(psycopg2.OperationalError) SSL SYSCALL error: EOF detected
. Все эти ошибки происходят из контейнеров Docker, работающих на экземпляре
t2.xlarge
. В
t2.xlarge
запущено 20 контейнеров Docker, каждый из которых использует простой API-интерфейс Python Tornado. Когда мы получаем эти ошибки, не все контейнеры на хосте получают ошибку, это случайные. После ошибок и отката сеанса (мы используем sqlalchemy) ошибки исчезают. Мы попытались обновить нашу БД, запустив меньше контейнеров на
t2.xlarge
, обновив до
m5.xlarge
, но ничего не работает. Наша нагрузка на БД выглядит неплохо (хотя загрузка ЦП довольно высока): Это график загрузки БД по показателям производительности за последние 24 часа Мы также замечаем, что сообщения SQS, отправляемые контейнерами, работающими на этих экземплярах
t2.xlarge
, также отправляются в SQS очень медленно, иногда с задержкой 30 с. Мы пробовали кучу вещей, но у нас заканчиваются идеи. Может ли это быть как-то связано с тем, что AWS ограничивает использование сети
t2.xlarge
или
m5.xlarge
? YC3RTIeuDE00HvAvBnV6DKFA5 имеет ~ 200-250 тыс. Входов / выходов в сеть и ~ 500-600 пакетов входов / выходов последовательно. Загрузка процессора в этих случаях составляет ~ 0,3.              

Ваш ответ

Отображаемое имя (по желанию):
Конфиденциальность: Ваш электронный адрес будет использоваться только для отправки уведомлений.
Анти-спам проверка:
Чтобы избежать проверки в будущем, пожалуйста войдите или зарегистрируйтесь.
...