socket -
интерфейс
сокетов Linux
#include <sys/socket.h>
sockfd = socket(int socket_family, int socket_type, int protocol);
В этой
справочной
странице
описывается
пользовательский
интерфейс
уровня
сетевых
сокетов Linux.
Совместимый
с сокетами BSD,
он
предоставляет
унифицированный
интерфейс
между
пользовательскими
процессами
и стеком
сетевых
протоколов
в ядре.
Модули
протоколов
группируются
по
семействам
протоколов,
такими, как
AF_INET,
AF_IPX и
AF_PACKET, и
типам
сокетов,
такими, как
SOCK_STREAM или
SOCK_DGRAM.
Более
подробная
информация
о
семействах
и типах
приведена
в
socket(2).
These functions are used by the user process to send or receive packets and to
do other socket operations. For more information, see their respective manual
pages.
Вызов
socket(2)
создаёт
сокет,
connect(2)
соединяет
сокет с
удалённым
сокетным
адресом,
bind(2)
привязывает
сокет к
локальному
адресу,
listen(2)
сообщает
сокету, что
должны
приниматься
новые
соединения,
а
accept(2)
используется
для
получения
нового
сокета для
нового
входящего
соединения.
Вызов
socketpair(2)
возвращает
два
соединённых
анонимных
сокета
(реализовано
только для
некоторых
локальных
семейств,
например
AF_UNIX).
Вызовы
send(2),
sendto(2) и
sendmsg(2)
отправляют
данные в
сокет, а
recv(2),
recvfrom(2) и
recvmsg(2)
принимают
данные из
сокета.
Вызовы
poll(2) и
select(2) ожидают
поступления
данных или
готовятся
к передаче
данных.
Кроме того,
для чтения
и записи
данных
могут
использоваться
стандартные
операции
ввода-вывода:
write(2),
writev(2),
sendfile(2),
read(2) и
readv(2).
Вызов
getsockname(2)
возвращает
адрес
локального
сокета, а
getpeername(2)
возвращает
адрес
удалённого
сокета.
Вызовы
getsockopt(2) и
setsockopt(2)
используются
для
установки
или
считывания
параметров
протокола
или уровня
сокетов.
Вызов
ioctl(2)
может быть
использован
для
установки
или чтения
некоторых
других
параметров.
Вызов
close(2)
используется
для
закрытия
сокета.
Вызов
shutdown(2)
закрывает
части
полнодуплексного
сокетного
соединения.
Перемещение
(seeking), или
вызовы
pread(2) и
pwrite(2) с
ненулевой
позицией,
для
сокетов не
поддерживается.
Для
сокетов
возможно
создание
неблокирующего
ввода/вывода
путём
установки
в файловый
дескриптор
сокета
флага
O_NONBLOCK с
помощью
вызова
fcntl(2).
При этом
все
блокировавшие
раньше
операции,
будут
возвращать
EAGAIN
(операция
должна
быть
повторена
позднее);
connect(2)
возвратит
ошибку
EINPROGRESS.
Пользователь
может
подождать
наступления
различных
событий
через
poll(2)
или
select(2).
События
ввода-вывода |
|
|
Событие |
Флаг poll |
Когда
происходит |
Чтение |
POLLIN |
Поступили
новые
данные. |
Чтение |
POLLIN |
Установка
соединения
выполнена
(для
сокетов с
установлением
соединения) |
Чтение |
POLLHUP |
Другая
сторона
инициировала
запрос на
разъединение. |
Чтение |
POLLHUP |
Соединение
разорвано
(только для
протоколов
с
установлением
соединения).
Если
производится
запись в
сокет, то
также
посылается
сигнал SIGPIPE. |
Запись |
POLLOUT |
Сокет
имеет
достаточно
места в
буфере
отправки
для записи
в него
новых
данных. |
Чтение/Запись |
POLLIN | POLLOUT |
Исходящий
connect(2)
завершён. |
Чтение/Запись |
POLLERR |
Произошла
асинхронная
ошибка. |
Чтение/Запись |
POLLHUP |
Другая
сторона
закрыла (shut down)
одно
направление. |
Исключение |
POLLPRI |
Пришли
неотложные
данные.
После
посылается
сигнал SIGURG. |
. |
|
|
. |
|
|
. |
|
|
. |
|
|
. |
|
|
. |
|
|
Альтернативе
poll(2) и
select(2) в
ядре
существует
возможность
информировать
приложение
о событиях
с помощью
сигнала
SIGIO.
Для этого
необходимо
установить
с помощью
fcntl(2) в
файловом
дескрипторе
сокета
флаг
O_ASYNC, а
также
назначить
с помощью
sigaction(2)
корректный
обработчик
сигнала
SIGIO.
Смотрите
ниже
раздел
Сигналы.
Каждый
сокетный
домен
имеет свой
формат
сокетных
адресов,
выраженный
в
отдельной
адресной
структуре.
Каждая из
этих
структур
начинается
с
целочисленного
поля
«семейства»
(с типом
sa_family_t),
в котором
указывается
тип
адресной
структуры.
Это
позволяет
различным
системным
вызовам
(например,
connect(2),
bind(2),
accept(2),
getsockname(2),
getpeername(2)),
которые
являются
общими для
всех
сокетов,
определить
домен
конкретного
сокетного
адреса.
Для
передачи
сокетного
адреса
любого
типа через
программный
интерфейс
сокетов
служит тип
struct sockaddr. Целью
данного
типа
является
приведение
типов
сокетных
адресов
определённого
домена к
«общему»
типу, что
позволяет
избежать
предупреждений
компилятора
о
несовпадении
типов в
вызовах API
сокетов.
Также,
программный
интерфейс
сокетов
предоставляет
тип данных
struct sockaddr_storage.
Данный тип
удобен для
размещения
всех
поддерживаемых
структур
сокетных
адресов
определённого
домена; он
достаточно
большой и
имеет
корректное
выравнивание
(в
частности,
он
позволяет
хранить
сокетные
адреса IPv6).
Для
определения
типа
сокетного
адреса,
который
хранится в
структуре,
служит
следующее
поле:
sa_family_t ss_family;
Структура
sockaddr_storage
полезна
для
программ,
которые
должны
работать с
сокетными
адресами
единообразно
(например, в
программах,
использующих
одновременно
сокетные
адреса IPv4 и IPv6).
Следующие
параметры
сокета
могут быть
установлены
с помощью
setsockopt(2) или
прочитаны
с помощью
getsockopt(2) с
уровнем
сокета,
равным
SOL_SOCKET
для всех
сокетов:
- SO_ACCEPTCONN
- Определить,
был или не
был данный
сокет
помечен
для
прослушивания
и приёма
соединений
с помощью
listen(2).
Возвращаемое
значение 0
обозначает,
что это не
прослушивающий
сокет.
Значение 1
обозначает,
что это
прослушивающий
сокет.
Данный
параметр
сокета
доступен
только для
чтения.
-
SO_ATTACH_FILTER
(начиная с Linux
2.2), SO_ATTACH_BPF
(начиная с Linux
3.19)
- Присоединить
классическую
( SO_ATTACH_FILTER) или
расширенную
( SO_ATTACH_BPF)
программу
BPF к сокету,
которая
будет
использоваться
как фильтр
входящих
пакетов.
Пакет
будет
отброшен,
если
фильтрующая
программа
возвращает
ноль. Если
фильтрующая
программа
возвращает
ненулевое
значение,
меньше
длины
данных
пакета, то
пакет
будет
обрезан до
возвращаемой
длины. Если
возвращаемое
фильтром
значение
больше или
равно
длине
данных
пакета, то
пакет
разрешён к
обработке
без
изменений.
- Для SO_ATTACH_FILTER
аргументом
является
структура
sock_fprog,
определяемая
в <linux/filter.h>:
-
struct sock_fprog {
unsigned short len;
struct sock_filter *filter;
};
- Для SO_ATTACH_BPF
аргументом
является
файловый
дескриптор,
возвращаемый
системным
вызовом bpf(2),
он должен
указывать
на
программу
с типом
BPF_PROG_TYPE_SOCKET_FILTER.
- Эти
параметры
могут быть
назначены
заданному
сокету
несколько
раз, если
перед этим
заменять
фильтрующую
программу.
Для одного
сокета
могут
вызываться
классическая
и
расширенная
версии, но
предыдущий
фильтр
всегда
будет
заменён,
так как для
сокета
допускается
определять
не более
одного
фильтра.
- Классический
и
расширенный
BPF описаны в
файле
исходного
кода ядра
Documentation/networking/filter.txt.
-
SO_ATTACH_REUSEPORT_CBPF,
SO_ATTACH_REUSEPORT_EBPF
- При
использовании
вместе с
SO_REUSEPORT эти
параметры
позволяют
пользователю
задавать
классическую
( SO_ATTACH_REUSEPORT_CBPF) или
расширенную
( SO_ATTACH_REUSEPORT_EBPF)
программу
BPF, которая
определяет
как пакеты
назначаются
сокетам в
группе reuseport
(то есть
всем
сокетам, у
которых
установлен
SO_REUSEPORT, и
использующим
один
локальный
адрес для
приёма
пакетов).
- Программа
BPF должна
возвращать
индекс от 0
до N-1,
представляющий
сокет,
который
должен
получить
пакет (где N
—
количество
сокетов в
группе).
Если
программа
BPF
возвращает
некорректный
индекс, то
выбор
сокета
будет
выполнен с
помощью
простого
механизма
SO_REUSEPORT.
- Сокеты
нумеруются
в порядке
их
добавления
в группу
(то есть, в
порядке
вызовов bind(2)
для
сокетов UDP и
в порядке
вызовов listen(2)
для
сокетов TCP).
Новые
сокеты,
добавляемые
в группу reuseport,
будут
наследовать
программу
BPF. Когда
сокет
удаляется
из группы
reuseport (с
помощью close(2)),
последний
сокет в
группе
будет
перемещён
в позицию
закрытого
сокета.
- Эти
параметры
могут быть
повторно
назначены
в любое
время
любому
сокету в
группе для
замены
текущей
программы
BPF,
используемой
всеми
сокетами в
группе.
- Для SO_ATTACH_REUSEPORT_CBPF
учитывается
тот же тип
аргумента
как у SO_ATTACH_FILTER, а
для SO_ATTACH_REUSEPORT_EBPF
учитывается
тот же тип
аргумента
как у SO_ATTACH_BPF.
- Поддержка
этого
свойства
для UDP
доступна
начиная с Linux
4.5;
Поддержка
этого
свойства
для TCP
доступна
начиная с Linux
4.6.
- SO_BINDTODEVICE
- Bind this socket to a particular device like
“eth0”, as specified in the passed interface name. If the
name is an empty string or the option length is zero, the socket device
binding is removed. The passed option is a variable-length null-terminated
interface name string with the maximum size of IFNAMSIZ. If a
socket is bound to an interface, only packets received from that
particular interface are processed by the socket. Note that this works
only for some socket types, particularly AF_INET sockets. It is not
supported for packet sockets (use normal bind(2) there).
- До Linux 3.8,
данный
параметр
сокета
можно было
устанавливать,
но нельзя
прочитать
с помощью
getsockopt(2).
Начиная с Linux
3.8 он
доступен
для чтения.
Аргумент
optlen должен
содержать
размер
буфера,
способного
разместить
имя
устройства;
рекомендуемое
значение —
IFNAMSIZ байт.
Реальная
длина
имени
устройства
возвращается
обратно
через
аргумент
optlen.
- SO_BROADCAST
- Задать
или
считать
флаг
широковещания.
Если он
установлен,
то через
датаграммные
сокеты
разрешено
отправлять
пакеты на
широковещательный
адрес. Этот
параметр
не
действует
на
потоковые
сокеты.
- SO_BSDCOMPAT
- Разрешить
совместимость
по ошибкам
с BSD.
Используется
модулем
протокола
UDP в Linux версии 2.0
и 2.2. Если
включено,
то
полученные
UDP-сокетом
ошибки ICMP не
будут
передаваться
пользовательской
программе.
В
последний
версиях
ядер
поддержка
этого
параметра
удалена: в Linux
2.4 он
игнорируется,
а в Linux 2.6 при
использовании
в
программе
для него
генерируется
предупреждение
ядра (printk()). В Linux 2.0
также
включён
параметр
совместимости
по ошибкам
с BSD и для
неструктурированных
сокетов
(произвольное
изменение
заголовка,
пропуск
флага
широковещательной
передачи),
но в Linux 2.2 это
было
удалено.
- SO_DEBUG
- Включить
отладку
сокета.
Разрешено
только
процессам
с мандатом
CAP_NET_ADMIN или
имеющим
нулевой
идентификатор
эффективного
пользователя.
-
SO_DETACH_FILTER
(начиная с Linux
2.2), SO_DETACH_BPF
(начиная с Linux
3.19)
- Эти два
параметра,
синонимы,
можно
использовать
для
удаления
классической
или
расширенной
программы
BPF,
присоединённой
к сокету с
помощью
SO_ATTACH_FILTER или SO_ATTACH_BPF.
Значение
параметра
игнорируется.
-
SO_DOMAIN
(начиная с Linux
2.6.32)
- Получить
доменный
сокет в
виде
целого
числа;
пример
возвращаемого
значения:
AF_INET6.
Подробней
смотрите в
socket(2). Этот
параметр
сокета
доступен
только для
чтения.
- SO_ERROR
- Получить
и очистить
ожидающую
обработки
ошибку
сокета.
Этот
параметр
сокета
доступен
только для
чтения.
Ожидает
целое
число.
- SO_DONTROUTE
- Не
выполнять
отправку
через шлюз,
посылать
только на
машины,
соединенные
напрямую.
Тот же
эффект
может быть
достигнут
путём
установки
для сокета
флага MSG_DONTROUTE
во время
вызова send(2). В
качестве
параметра
ожидается
целочисленный
логический
флаг.
-
SO_INCOMING_CPU
(чтение,
начиная с Linux
3.19; запись,
начиная с Linux
4.4)
- Изменяет
или
возвращает
привязку
сокета к
ЦП. В
качестве
параметра
ожидается
целочисленный
логический
флаг.
-
int cpu = 1;
setsockopt(fd, SOL_SOCKET, SO_INCOMING_CPU, &cpu,
sizeof(cpu));
- Так как
все пакеты
одного
потока (т. е.,
все пакеты
одной
связки 4-х
значений
(4-tuple))
поступают
в одно
очередь RX,
которая
связана с
определённым
ЦП, обычно,
это
используется
для
привязки
слушающего
процесса к
очереди RX,
чтобы
входящий
поток,
обрабатываемый
слушающим,
был на том
же ЦП,
который
обслуживает
очередь RX.
Это
предоставляет
оптимальное
поведение
NUMA и
поддерживает
кэши ЦП в
актуальном
состоянии.
-
SO_INCOMING_NAPI_ID (gettable since Linux 4.12)
- Returns a system-level unique ID called NAPI ID that is
associated with a RX queue on which the last packet associated with that
socket is received.
- This can be used by an application to split the incoming
flows among worker threads based on the RX queue on which the packets
associated with the flows are received. It allows each worker thread to be
associated with a NIC HW receive queue and service all the connection
requests received on that RX queue. This mapping between a app thread and
a HW NIC queue streamlines the flow of data from the NIC to the
application.
- SO_KEEPALIVE
- Включить
отправку
«поддерживающих»
(keep-alive)
сообщений
для
сокетов,
ориентированных
на
соединение.
Ожидается
целочисленный
логический
флаг.
- SO_LINGER
- Задать
или
считать
параметр
SO_LINGER.
Аргументом
является
структура
linger.
-
struct linger {
int l_onoff; /* задержка активна */
int l_linger; /* величина задержки в секундах */
};
- Если
этот
параметр
установлен,
то close(2) или
shutdown(2) не
вернут
управление
до тех пор,
пока не
будут
отправлены
все
сообщения
в очереди
сокета или
до
истечения
времени
задержки (linger).
В
противном
случае
вызовы
вернут
управление
немедленно
и закрытие
будет
произведено
в фоновом
режиме.
Если сокет
закрывается
как часть
вызова exit(2),
то
задержка
всегда
происходит
в фоновом
режиме.
- SO_LOCK_FILTER
- Если
указан, то
это
запрещает
изменять
фильтры,
связанные
с сокетом.
К фильтрам
относятся
любые,
добавленные
с помощью
параметров
сокета SO_ATTACH_FILTER
SO_ATTACH_BPF SO_ATTACH_REUSEPORT_CBPF и
SO_ATTACH_REUSEPORT_EBPF.
- Обычно,
он
используется
так:
настраивается
неструктурированный
сокет
привилегированного
процесса
(операция
требует
мандата
CAP_NET_RAW),
применяется
ограничивающий
фильтр,
назначается
параметр
SO_LOCK_FILTER, а затем
сбрасываются
привилегии
или
файловый
дескриптор
сокета
передаётся
непривилегированного
процессу
через
доменный
сокет UNIX.
- После
установки
параметра
SO_LOCK_FILTER, все
попытки
изменить,
удалить
присоединённый
к сокету
фильтр или
отключить
с помощью
параметра
SO_LOCK_FILTER, будут
завершаться
с ошибкой
EPERM.
-
SO_MARK
(начиная с Linux
2.6.25)
- Устанавливать
метку на
каждый
пакет,
отправленный
через
сокет
(похоже на
цель netfilter MARK, но
для
сокетов).
Изменение
метки
можно
использовать
для
маршрутизации
на основе
меток не
задействуя
netfilter или для
фильтрации
пакетов.
Для
установки
этого
параметра
требуется
мандат
CAP_NET_ADMIN.
- SO_OOBINLINE
- Если
включён
этот
параметр,
то
внепоточные
данные
помещаются
непосредственно
во входной
поток
данных. В
противном
случае
внепоточные
данные
передаются
только,
если во
время
приёма
установлен
флаг MSG_OOB.
- SO_PASSCRED
- Enable or disable the receiving of the
SCM_CREDENTIALS control message. For more information, see
unix(7).
- SO_PASSSEC
- Enable or disable the receiving of the SCM_SECURITY
control message. For more information, see unix(7).
-
SO_PEEK_OFF
(начиная с Linux
3.4)
- Этот
параметр,
который
пока
поддерживается
только для
сокетов unix(7),
устанавливает
значение
«смещения
выборки» (peek
offset) для
системного
вызова recv(2),
когда он
используется
с флагом
MSG_PEEK.
- Если
этому
параметру
присваивается
отрицательное
значение
(равен -1 для
всех новых
сокетов),
то
действует
обычное
правило: recv(2)
с флагом MSG_PEEK
выбирает
данные из
начала (front)
очереди.
- Если
этому
параметру
присваивается
положительное
значение
или ноль,
то
следующая
выборка
данных из
очереди
сокета
произойдёт
по
байтовому
смещению,
определяемому
значением
этого
параметра.
В то же
время,
«смещение
выборки»
будет
увеличено
на
количество
байт,
выбранных
из очереди,
то есть
последовательные
операции
выборки
возвращают
следующие
данные из
очереди.
- Если
данные
удалены из
начала
очереди с
помощью
вызова recv(2)
(или
подобного)
без флага
MSG_PEEK, то
«смещение
выборки»
будет
уменьшено
на
количество
удалённых
байт.
Другими
словами,
приём
данных без
флага MSG_PEEK
корректирует
«смещение
выборки»
относительно
поддерживаемого
относительного
положения
данных в
очереди, и
последующая
выборка
возвратит
данные,
которые
были бы
получены,
если бы
данные не
удалялись.
- Для
датаграммных
сокетов,
если
«смещение
выборки»
указывает
в середину
пакета, то
возвращаемые
данные
маркируются
флагом MSG_TRUNC.
- В
следующем
примере
показано
использование
SO_PEEK_OFF.
Предположим,
в очереди
потокового
сокета
есть
входные
данные:
-
aabbccddeeff
- Следующая
последовательность
вызовов recv(2)
выполнила
бы то, что
описано в
комментариях:
-
int ov = 4; // установка смещения выборки равной 4
setsockopt(fd, SOL_SOCKET, SO_PEEK_OFF, &ov, sizeof(ov));
recv(fd, buf, 2, MSG_PEEK); // выборка «cc»; смещение 6
recv(fd, buf, 2, MSG_PEEK); // выборка «dd»; смещение 8
recv(fd, buf, 2, 0); // выборка «aa»; смещение 6
recv(fd, buf, 2, MSG_PEEK); // выборка «ee»; смещение 8
- SO_PEERCRED
- Возвращает
учётные
данные (credentials)
ответного
процесса,
подключённого
к сокету.
Дополнительную
информацию
смотрите в
unix(7).
-
SO_PEERSEC (since Linux 2.6.2)
- Return the security context of the peer socket connected to
this socket. For further details, see unix(7) and
ip(7).
- SO_PRIORITY
- Установить
определяемый
протоколом
приоритет
для всех
пакетов,
отправляемых
из этого
сокета. Linux
использует
это
значение
для
управления
сетевыми
очередями:
пакеты с
более
высоким
приоритетом
могут быть
обработаны
раньше (в
зависимости
от
выбранного
для
устройства
способа
постановки
в очередь).
Установка
значения
приоритета
не из
диапазона 0
до 6
требует
мандата
CAP_NET_ADMIN.
-
SO_PROTOCOL
(начиная с Linux
2.6.32)
- Получить
протокол
сокета в
виде
целого
числа;
пример
возвращаемого
значения:
IPPROTO_SCTP.
Подробней
смотрите в
socket(2). Этот
параметр
сокета
доступен
только для
чтения.
- SO_RCVBUF
- Задать
или
получить
максимальный
размер
буфера
приёма
сокета (в
байтах).
Ядро
удваивает
это
значение
(для
пространства
под учёт
ресурсов
(bookkeeping overhead)) при
установке
этого
параметра
с помощью
setsockopt(2), и это
удвоенное
значение
возвращается
getsockopt(2).
Значение
по
умолчанию
устанавливается
через файл
/proc/sys/net/core/rmem_default, а
максимальное
возможное
значение
устанавливается
через файл
/proc/sys/net/core/rmem_max.
Минимальное
(удвоенное)
значение
для этого
параметра
равно 256.
-
SO_RCVBUFFORCE
(начиная с Linux
2.6.14)
- С
помощью
этого
параметра
сокета
привилегированный
( CAP_NET_ADMIN)
процесс
может
выполнить
ту же
работу, что
и с помощью
SO_RCVBUF, но
возможно
превысить
ограничение
rmem_max.
-
SO_RCVLOWAT и SO_SNDLOWAT
- Задать
минимальное
количество
байт в
буфере до
которого
уровень
сокета
будет
отправлять
данные
протоколу (
SO_SNDLOWAT) или
получать
их от
пользователя
( SO_RCVLOWAT).
Начальное
значение
этих двух
элементов
равно 1. Для
SO_SNDLOWAT
значение в
Linux изменить
нельзя ( setsockopt(2)
завершает
выполнение
с ошибкой
ENOPROTOOPT).
Значение
для SO_RCVLOWAT
можно
изменить
начиная с Linux
версии 2.4.
- Before Linux 2.6.28 select(2), poll(2), and
epoll(7) did not respect the SO_RCVLOWAT setting on Linux,
and indicated a socket as readable when even a single byte of data was
available. A subsequent read from the socket would then block until
SO_RCVLOWAT bytes are available. Since Linux 2.6.28,
select(2), poll(2), and epoll(7) indicate a socket as
readable only if at least SO_RCVLOWAT bytes are available.
-
SO_RCVTIMEO и SO_SNDTIMEO
- Specify the receiving or sending timeouts until reporting
an error. The argument is a struct timeval. If an input or output
function blocks for this period of time, and data has been sent or
received, the return value of that function will be the amount of data
transferred; if no data has been transferred and the timeout has been
reached, then -1 is returned with errno set to EAGAIN or
EWOULDBLOCK, or EINPROGRESS (for connect(2)) just as
if the socket was specified to be nonblocking. If the timeout is set to
zero (the default), then the operation will never timeout. Timeouts only
have effect for system calls that perform socket I/O (e.g.,
accept(2), connect(2), read(2), recvmsg(2),
send(2), sendmsg(2)); timeouts have no effect for
select(2), poll(2), epoll_wait(2), and so on.
- SO_REUSEADDR
- Указать,
что
правила
проверки
адресов,
передаваемых
с помощью
вызова bind(2),
должны
позволять
повторное
использование
локальных
адресов. В
случае с
сокетами
AF_INET это
означает,
что сокет
может быть
привязан (bind),
за
исключением
случаев,
когда
активному
слушающему
сокету
присвоен
адрес. Если
слушающий
сокет
привязан к
INADDR_ANY с
определённым
портом, то
к этому
порту
невозможно
будет
привязать
любой
локальный
адрес.
Аргументом
является
целочисленный
логический
флаг.
-
SO_REUSEPORT
(начиная с Linux
3.9)
- Разрешить
многократную
привязку
сокета AF_INET
или AF_INET6 к
одинаковому
адресу
сокета.
Данный
параметр
должен
быть
указан на
каждом
сокете
(включая
первый
сокет) до
вызова bind(2).
Чтобы
предотвратить
захват
порта все
привязки
процессов
к одному
адресу
должны
иметь один
эффективный
UID. Данный
параметр
можно
применять
к сокетам TCP
и UDP.
- Для
сокетов TCP
данный
параметр
позволяет
accept(2)
распределить
нагрузку в
многонитевом
сервере,
назначая
разные
слушатели
сокета в
каждой
нити. Это
улучшает
распределение
нагрузки
по
сравнении
с обычными
методами,
например с
одной
принимающей
нитью accept(2),
которая
распределяет
соединения,
или с
несколькими
нитями,
которые
конкурируют
за accept(2)
единого
сокета.
- Для
сокетов UDP
использование
данного
параметра
может
улучшить
распределение
входящих
датаграмм
по
нескольким
процессам
(или нитям)
по
сравнении
с обычным
методом с
несколькими
процессами,
которые
конкурируют
при приёме
датаграмм
из единого
сокета.
-
SO_RXQ_OVFL
(начиная с Linux
2.6.33)
- Указывает,
что к
принятым skbs
должно
быть
прикреплено
вспомогательное
сообщение
(cmsg) с
беззнаковым
32-битным
значением,
которое
обозначает
количество
пакетов,
отброшенных
сокетом с
момента
его
создания.
-
SO_SELECT_ERR_QUEUE (since Linux 3.10)
- When this option is set on a socket, an error condition on
a socket causes notification not only via the exceptfds set of
select(2). Similarly, poll(2) also returns a POLLPRI
whenever an POLLERR event is returned.
- Background: this option was added when waking up on an
error condition occurred only via the readfds and writefds
sets of select(2). The option was added to allow monitoring for
error conditions via the exceptfds argument without simultaneously
having to receive notifications (via readfds) for regular data that
can be read from the socket. After changes in Linux 4.16, the use of this
flag to achieve the desired notifications is no longer necessary. This
option is nevertheless retained for backwards compatibility.
- SO_SNDBUF
- Задать
или
считать
максимальный
размер
буфера
отправки
сокета (в
байтах).
Ядро
удваивает
это
значение
(для
пространства
под учёт
ресурсов
(bookkeeping overhead)) при
установке
этого
параметра
с помощью
setsockopt(2), и это
удвоенное
значение
возвращается
getsockopt(2).
Значение
по
умолчанию
устанавливается
через файл
/proc/sys/net/core/wmem_default, а
максимальное
возможное
значение
устанавливается
через файл
/proc/sys/net/core/wmem_max.
Минимальное
(удвоенное)
значение
для этого
параметра
равно 2048.
-
SO_SNDBUFFORCE
(начиная Linux 2.6.14)
- С
помощью
этого
параметра
сокета
привилегированный
( CAP_NET_ADMIN)
процесс
может
выполнить
ту же
работу, что
и с помощью
SO_SNDBUF, но
возможно
превысить
ограничение
wmem_max.
- SO_TIMESTAMP
- Enable or disable the receiving of the SO_TIMESTAMP
control message. The timestamp control message is sent with level
SOL_SOCKET and a cmsg_type of SCM_TIMESTAMP. The
cmsg_data field is a struct timeval indicating the reception
time of the last packet passed to the user in this call. See
cmsg(3) for details on control messages.
-
SO_TIMESTAMPNS (since Linux 2.6.22)
- Enable or disable the receiving of the
SO_TIMESTAMPNS control message. The timestamp control message is
sent with level SOL_SOCKET and a cmsg_type of
SCM_TIMESTAMPNS. The cmsg_data field is a struct
timespec indicating the reception time of the last packet passed to
the user in this call. The clock used for the timestamp is
CLOCK_REALTIME. See cmsg(3) for details on control
messages.
- A socket cannot mix SO_TIMESTAMP and
SO_TIMESTAMPNS: the two modes are mutually exclusive.
- SO_TYPE
- Получить
тип сокета
в виде
целого
числа
(например,
SOCK_STREAM). Этот
параметр
сокета
доступен
только для
чтения.
-
SO_BUSY_POLL
(начиная с Linux
3.11)
- Задаёт
приблизительный
интервал в
микросекундах
для
задержки
опроса при
блокирующем
приёме при
отсутствии
данных.
Увеличение
этого
значения
требует
мандата
CAP_NET_ADMIN.
Значение
по
умолчанию
данного
параметра
управляется
через файл
/proc/sys/net/core/busy_read.
- Значение
в файле
/proc/sys/net/core/busy_poll
определяет
как долго
select(2) и poll(2)
задержат
опрос, если
они
работают с
сокетами с
установленным
SO_BUSY_POLL и
отсутствуют
события
для
извещения.
- В обоих
случаях
опрос с
задержкой
(busy polling) будет
завершён
только,
когда
сокет
примет все
данные из
сетевого
устройства,
которое
поддерживает
этот
параметр.
- Хотя
опрос с
задержкой
может
уменьшить
время
ожидания в
некоторых
приложениях,
этим нужно
пользоваться
с
осторожностью,
так как его
использование
увеличит
нагрузку
на ЦП и
энергопотребление.
При записи
в сокет,
ориентированный
на
соединение,
который
был
выключен (shutdown)
локальной
или
удалённой
стороной,
записывающему
процессу
посылается
сигнал
SIGPIPE и
возвращается
EPIPE. Сигнал
не
посылается,
если вызов
записи был
сделан с
флагом
MSG_NOSIGNAL.
Если был
произведён
вызов
fcntl(2) с
FIOSETOWN или
ioctl(2) с
SIOCSPGRP, то при
появлении
событий
ввода/вывода
посылается
сигнал
SIGIO.
Для
определения
сокета, в
котором
произошло
событие, в
обработчике
можно
воспользоваться
вызовом
poll(2)
или
select(2).
Альтернативным
способом (в
Linux 2.2) является
установка
сигнала
реального
времени с
помощью
вызова
fcntl(2) с
F_SETSIG; будет
вызван
обработчик
сигнала
реального
времени и в
его
структуре
siginfo_t поле
si_fd
будет
содержать
значение
файлового
дескриптора.
Дополнительная
информация
приведена
в
fcntl(2).
В
некоторых
случаях
(например,
при
наличии
доступа
нескольких
процессов
к одному
сокету)
условие,
вызвавшее
SIGIO, может
исчезнуть
на момент
обработки
процессом
сигнала.
Если это
происходит,
то процесс
должен
подождать
сигнала
ещё
какое-то
время, так
как Linux снова
пошлёт его
позже.
Основные
сетевые
параметры
сокета
доступны
через
файлы в
каталоге
/proc/sys/net/core/.
- rmem_default
- устанавливаемый
по
умолчанию
размер
буфера
приёма
сокета (в
байтах)
- rmem_max
- максимальный
размер
буфера
приёма
сокета (в
байтах),
который
может
установить
пользователь
с помощью
параметра
сокета SO_RCVBUF
- wmem_default
- устанавливаемый
по
умолчанию
размер
буфера
отправки
сокета (в
байтах)
- wmem_max
- максимальный
размер
буфера
отправки
сокета (в
байтах),
который
может
установить
пользователь
с помощью
параметра
сокета SO_SNDBUF
-
message_cost и message_burst
- фильтр
корзины
токенов,
используемый
для
ограничения
нагрузки
сети
предупреждающими
сообщениями,
вызванными
внешними
сетевыми
событиями
- netdev_max_backlog
- максимальное
количество
пакетов в
глобальной
входящей
очереди
- optmem_max
- максимальная
длина
вспомогательных
данных и
управляющих
данных
пользователя,
таких, как iovec
(для
каждого
сокета)
Следующие
операции
доступны
через
ioctl(2):
error = ioctl(ip_socket, ioctl_type, &value_result);
- SIOCGSTAMP
- Return a struct timeval with the receive timestamp
of the last packet passed to the user. This is useful for accurate round
trip time measurements. See setitimer(2) for a description of
struct timeval. This ioctl should be used only if the socket
options SO_TIMESTAMP and SO_TIMESTAMPNS are not set on the
socket. Otherwise, it returns the timestamp of the last packet that was
received while SO_TIMESTAMP and SO_TIMESTAMPNS were not set,
or it fails if no such packet has been received, (i.e., ioctl(2)
returns -1 with errno set to ENOENT).
- SIOCSPGRP
- Назначает
процесс
или группу
процессов,
которым
будут
посылаться
сигналы SIGIO
или SIGURG при
появлении
возможности
ввода-вывода
или при
появлении
срочных
данных.
Аргумент
является
указателем
на pid_t.
Дополнительная
информация
приведена
в описании
на F_SETOWN в fcntl(2).
- FIOASYNC
- Изменяет
флаг O_ASYNC для
включения
или
отключения
асинхронного
режима
ввода/вывода
сокета. В
асинхронном
режиме при
появлении
событий
ввода/вывода
посылается
сигнал SIGIO
или сигнал,
установленный
с помощью
F_SETSIG.
- Аргументом
является
целочисленный
логический
флаг.
Данная
операция
аналогична
вызову fcntl(2) с
установленным
флагом O_ASYNC.
- SIOCGPGRP
- Возвращает
процесс
или группу
процессов,
получающих
сигналы SIGIO
или SIGURG. Если
такой
процесс не
задан, то
возвращается
нулевое
значение.
Возможные
операции
fcntl(2):
- FIOGETOWN
- То же, что
и вызов ioctl(2)
SIOCGPGRP.
- FIOSETOWN
- То же, что
и вызов ioctl(2)
SIOCSPGRP.
Параметр
SO_BINDTODEVICE
появился в
Linux 2.0.30. Параметр
SO_PASSCRED
появился в
Linux 2.2.
Интерфейсы
/proc
появились
в Linux 2.2.
Параметры
SO_RCVTIMEO и
SO_SNDTIMEO
начали
поддерживаться
в Linux 2.3.41. До
этого,
времена
ожидания
были
жёстко
прописаны
в
настройках
протокола
и
недоступны
для чтения
или записи.
В Linux
предполагается,
что
половина
буфера
приёма/передачи
используется
для
размещения
внутренних
структур
ядра;
поэтому
соответствующие
файлы
/proc в
два раза
больше, чем
кажутся.
В Linux
разрешено
повторное
использование
порта с
параметром
SO_REUSEADDR только,
когда этот
параметр
установлен
и в
программе,
уже
выполнившей
bind(2) и в
программе,
которая
хочет
использовать
порт. Такое
поведение
отличается
от
некоторых
реализаций
(например, FreeBSD),
в которых
только
последняя
программа
должна
устанавливать
параметр
SO_REUSEADDR. Обычно,
это
отличие
незаметно,
так как,
например, в
серверных
программах
всегда
устанавливают
этот
параметр.
wireshark(1),
bpf(2),
connect(2),
getsockopt(2),
setsockopt(2),
socket(2),
pcap(3),
address_families(7),
capabilities(7),
ddp(7),
ip(7),
ipv6(7),
packet(7),
tcp(7),
udp(7),
unix(7),
tcpdump(8)
Русский
перевод
этой
страницы
руководства
был сделан
Alexander Golubev <
[email protected]>, Azamat Hackimov
<
[email protected]>, Hotellook, Nikita
<
[email protected]>, Spiros Georgaras <
[email protected]>, Vladislav
<
[email protected]>, Yuri Kozlov <
[email protected]>
и Иван
Павлов <
[email protected]>
Этот
перевод
является
бесплатной
документацией;
прочитайте
Стандартную
общественную
лицензию GNU
версии 3
или более
позднюю,
чтобы
узнать об
условиях
авторского
права. Мы не
несем
НИКАКОЙ
ОТВЕТСТВЕННОСТИ.
Если вы
обнаружите
ошибки в
переводе
этой
страницы
руководства,
пожалуйста,
отправьте
электронное
письмо на
[email protected]