9 апр. 2009 г.

Polling в FreeBSD

Теория:


- Режим прерывания (IRQ):

По умолчанию сетевой интерфейс работает в режиме прерывания (IRQ). Выглядит это примерно так:

1. Интерфейс отправляет или получает пакет.
2. Интерфейс генерирует прерывание (IRQ) в ответ на это событие.
3. ЦП останавливает свою текущую деятельность, чтобы обработать прерывание.
4. После обработки прерывания сгенерированого интерфейсом ЦП продолжает свою работу.

Такой вариант обработки пакетов сетевым интерфейсом подходит для низкой активности сети (до 10 тысяч пакетов в секунду). При увеличении количества пакетов для обработки интерфейсом начнется их отбрасывание, в связи с тем что сам интерфейс не будет успевать генерировать прерывания или ЦП не будет успевать обрабатывать их...

Вывод: Система неуправляема. Плюс низкая пропускная способность.


- Режим опроса (Polling):

Итак что же такое поллинг (polling)... Поллинг в FreeBSD это режим опроса системой сетевого интерфейса с определенной частотой на наличие на нем сетевых пакетов. Работает это приблизительно таким образом:

Система отключает на сетевом интерфейсе прерывания (IRQ), а вместо этого сама опрашивает сетевой интерфейс на наличие в его буфере сетевых пакетов. И если такие присутствуют - она их обрабатывает. Выглядит это примерно так:

1. Сетевой интерфейс работает в режиме прерываний.
2. При приеме/отправке пакета, сетевой интерфейс регистрирует себя в poll списке и отключает прерывания.
3. Через определенные таймауты система опрашивает интерфейс на предмет новых пакетов.

Вывод: За счет режима опроса снимается нагрузка на процессор, увеличивается пропускная способность, потому как на каждый пакет не нужно генерировать прерывание, но увеличивается возможность потери пакетов за счет того что система может не в нужный момент времени опросить устройство.

Есть один момент, на который нужно обратить внимание. Не все сетевые адаптеры поддерживают режим поллинга список можно просмотреть на странице мануала к поллингу


Настройка:


1. Пересобираем ядро с опциями:


options DEVICE_POLLING (включение режима опроса)
options HZ=1000 (таймер проверки 1000 равен пропускной способности 100 Мбитной сети подробнее. Тоесть если скорость больше 100 мегабит нужно выставить большее значение)


2. Включаем поддержку поллинга на интерфейсе


В старых версиях поллинг включается через файл /etc/sysctl.conf
нужно добавить строку

kern.polling.enable=1

В новых версиях включается через Ifconfig

freebsd# ifconfig em0 polling

Для автозагрузки поллинга в файле /etc/rc.conf прописываем:

ifconfig_em0="polling"

также не забываем добавить в этой строке сетевые параметры типа IP адрес, маска подсети и тд.


3. Тюнингуем параметры polling`a


Все настройки производятся в файле /etc/sysctl.conf

kern.polling.user_frac - определяет использование процессорного времени между ядром и пользовательскими процессами. Чем меньше значение, тем меньше времени будет уделено пользовательским процессам и больше ядру. Стоит заметить, что если у одного из уровней задач (пользовательский) не имеет достаточно работы, то остатки процессорного времени переходят другому (ядру), так что процессорное время не теряется. По умолчанию, значение этой переменной - 50. Меньшее значение стоит выставлять на маршрутизаторах. Допустимый предел значений от 1 до 99.
kern.polling.handlers - определяет количество устройств, которые могут быть зарегистрированы как polling.
kern.polling.burst - максимальное количество пакетов, которое может быть обработано с одного устройства за каждый проход. Это значение подстраивается ядром, основываясь на текучем уровне загрузки, мощности процессора, потока трафика и т.д.
kern.polling.burst_max - определяет верхнюю границу kern.polling.burst.
kern.polling.reg_frac - в процессе опроса не проверяется состояние регистров на ошибки, текущее состояние связи и.т.д., это значение указывает, как часто (каждые reg_frac / HZ секунд) проводить подобные проверки. Значение по умолчанию - 20.
kern.polling.idle_poll - определяет, использовать ли опрос устройств в свободное время. Нет причин отключать его, разве что для проведения тестов или при возникновении ошибок. По умолчанию включено.
intr_queue_maxlen - очередь для входящих пакетов (аналогична backlog под Linux). Изменяется при помощи sysctl: net.inet.ip.intr_queue_maxlen. Значение по умолчанию = 50, что очень мало.
intr_queue_drops - статистика по работе intr_queue_maxlen, отображает количество отброшенных пакетов из очереди. Посмотреть её можно через sysctl: net.inet.ip.intr_queue_drops.
net.inet.tcp.rfc1323 - контролирует работу временной марки и масштабируемого окна. (0 - выключено, 1 - включено)
kern.ipc.maxsockbuf - максимальный размер TCP буфера.
net.inet.tcp.recvspace - размер TCP буфера для приема. Влияет на размер "скользящего окна".
net.inet.tcp.sendspace - размер TCP буфера для отправки. Влияет на размер "окна переполнения".

Например:

net.inet.ip.intr_queue_maxlen=5000
kern.ipc.maxsockbuf=8388608
net.inet.tcp.sendspace=3217968
net.inet.tcp.recvspace=3217968
net.inet.tcp.rfc1323=1


Много информации было почерпнуто отсюда. За что автору спасибо.
Отправить комментарий