kbessmertniy
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Дядьки, а есть тут кто у кого vSAN работает? Подскажите как победить производительность. Есть 3 сервера, на каждом SSD и по 2 HDD. Storage profile настроен на FTT 1 и RAID 1. По IOPS все хорошо, а вт при больших объемах проседает производительность, причем как-то постепенно. Сервера соединены одним десятигигабитным портом, iperf между виртуальными машинами на разных нодах в один поток раскачивается до 5-6 гигабит, можно больше раскачать, но смысла нет поскольку vSAN'овская нагрузка не поднимается выше 2.5 гигабит. Начинаю нагружать диск Код: [root@test1 ~]# dd status=progress if=/dev/zero of=/tmp/data bs=1M count=4000 4061134848 bytes (4.1 GB) copied, 12.093307 s, 336 MB/s 4000+0 records in 4000+0 records out 4194304000 bytes (4.2 GB) copied, 12.6753 s, 331 MB/s [root@test1 ~]# dd status=progress if=/dev/zero of=/tmp/data bs=1M count=100000 104584970240 bytes (105 GB) copied, 484.593388 s, 216 MB/s 100000+0 records in 100000+0 records out 104857600000 bytes (105 GB) copied, 485.563 s, 216 MB/s | На малых объемах все шустро и хорошо, но когда он работает долго скорость постепенно падает и доходит где-то до 150 мегов в секунду, при этом в мониторинге производительности кластера vSAN постепенно начинает расти congestions и как следствие растет write latency, причем конкретно так, видел как оно доходило до 800 мс. Это для VM, для backend'а все примерно так же, но значения существенно меньше. Если выбрать ноду с тестовой ВМ то по дискам роста задержки не наблюдается, но в physical adapters вижу рост Inbound pNIC Packet Loss Rate. На физических интерфейсах потерь нет. Исходя из этого куска KB Цитата: Go to vSAN cluster > Host > Performance > vSAN – VMkernel adapters and check the VMkernel Network Adapter Packet Loss Rate for each VMkernel Adapter. If a non-zero packet loss is seen at this layer, but no network loss is seen at any of the physical adapters on any of the hosts (step a), then it usually means that there is a packet loss over the end-to-end network. This could be due to some incorrect configuration at the network switch, or some congestion over the network. | проблема где-то на транспорте, но по ping -f они не выявляются Код: 74122 packets transmitted, 74121 received, 0% packet loss, time 8709ms rtt min/avg/max/mdev = 0.077/0.107/0.986/0.015 ms, ipg/ewma 0.117/0.112 ms | Какой-то всеобъемлющей документации по vsan performance troubleshooting либо не существует, либо я не нашел. В чем может быть засади и куда копать? Я правильно понимаю что рост congestions является следствием pinc packet loss rate? Может кто у себя глянуть растет ли оно под нагрузкой? Добавлено: Немного обманул с диагностикой, в host network в vSAN packet loss rate по нулям, а в physical adapters pNIC packet loss rate растет под нагрузкой. Flow control на сервере отключен (pause RX и pause TX в false). Что может быть причиной? |