syscalls - Linux
のシステムコール
Linux のシステムコール。
システムコールは、アプリケーションと
Linux カーネルとの間の
基本的なインターフェースである。
システムコールは一般には直接起動されず、
glibc
(や他の何らかのライブラリ)
経由で起動される。
システムコールの直接起動については、詳細は
intro(2) を参照のこと。
いつもという訳ではないが、普通は、ラッパー関数の名前はその関数が起動する
システムコールの名前と同じである。
例えば、glibc には
chdir()
という関数があり、この関数は
"chdir"
システムコールを起動する。
Often the glibc wrapper function is quite thin, doing little work other than
copying arguments to the right registers before invoking the system call, and
then setting
errno appropriately after the system call has returned.
(These are the same steps that are performed by
syscall(2), which can
be used to invoke system calls for which no wrapper function is provided.)
Note: system calls indicate a failure by returning a negative error number to
the caller on architectures without a separate error register/flag, as noted
in
syscall(2); when this happens, the wrapper function negates the
returned error number (to make it positive), copies it to
errno, and
returns -1 to the caller of the wrapper.
しかしながら、時には、ラッパー関数がシステムコールを起動する前に
何らかの追加の処理を行う場合がある。
例えば、現在、
二つの関連するシステムコール
truncate(2) と
truncate64(2)
があり、glibc
のラッパー関数
truncate()
は、カーネルがこれらのシステムコールのうちどちらを提供しているかをチェックし、
どちらを採用するかを決定する。
以下は Linux
のシステムコールのリストである。
このリストで、
Kernel
の列は、Linux 2.2
以降で登場したシステムコールが
登場したカーネルバージョンを示す。
以下に詳細な説明を記す。
- *
- カーネルバージョンがない場合、そのシステムコールは
カーネル 1.0
もしくはそれ以前に登場した。
- *
- システムコールに
"1.2"
と書かれている場合、
そのシステムコールがおそらくバージョン
1.1.x
のカーネルで登場し、
安定版のカーネルでは
1.2
で初めて登場したことを意味する。
(バージョン 1.2
のカーネルは、カーネル
1.0.6 から分岐し、
バージョン 1.1.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.0"
と書かれている場合、
そのシステムコールがおそらくバージョン
1.3.x
のカーネルで登場し、
安定版のカーネルでは
2.0
で初めて登場したことを意味する。
(バージョン 2.0
のカーネルは、バージョン
1.2.10 あたりのカーネル
1.2.x
から分岐し、バージョン
1.3.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.2"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.1.x
のカーネルで登場し、
安定版のカーネルでは
2.2.0
で初めて登場したことを意味する。
(バージョン 2.2
のカーネルは、カーネル
2.0.21 から分岐し、
バージョン 2.1.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.4"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.3.x
のカーネルで登場し、
安定版のカーネルでは
2.4.0
で初めて登場したことを意味する。
(バージョン 2.4
のカーネルは、カーネル
2.2.8 から分岐し、
バージョン 2.3.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.6"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.5.x
のカーネルで登場し、
安定版のカーネルでは
2.6.0
で初めて登場したことを意味する。
(バージョン 2.6
のカーネルは、カーネル
2.4.15 から分岐し、
バージョン 2.5.x
の不安定版のカーネル系列として開発された。)
- *
- Starting with kernel 2.6.0, the development model changed,
and new system calls may appear in each 2.6.x release. In this case, the
exact version number where the system call appeared is shown. This
convention continues with the 3.x kernel series, which followed on from
kernel 2.6.39; and the 4.x kernel series, which followed on from kernel
3.19; and the 5.x kernel series, which followed on from kernel 4.20.
- *
- 前の安定版カーネル系列から分岐した後に安定版カーネル系列にシステムコール
が追加された場合、以前の安定版カーネル系列にそのシステムコールが
移植 (backport)
されることがある。
例えば、2.6.x
で登場したシステムコールのいくつかは、
2.4.15 以降の 2.4.x
リリースにも backport
された。
この場合、システムコールが登場したバージョンとして、
両方の安定版系列のバージョンが記載されている。
カーネル 5.10
で利用可能なシステムコールのリストを以下に示す
(それ以前のカーネルでだけ利用可能なものも少数だが含まれる):
x86-32
を含む多くのプラットフォームでは、ソケット関連のシステムコールは
(glibc
のラッパー関数を介してだが)
すべて
socketcall(2)
経由に多重されている。
同様に、System V IPC
関連のシステムコールは
ipc(2)
経由に多重されている。
以下のシステムコールは、システムコールテーブルにスロットが予約されているが、
標準のカーネルには実装されていない:
afs_syscall(2),
break(2),
ftime(2),
getpmsg(2),
gtty(2),
idle(2),
lock(2),
madvise1(2),
mpx(2),
phys(2),
prof(2),
profil(2),
putpmsg(2),
security(2),
stty(2),
tuxcall(2),
ulimit(2),
vserver(2) (
unimplemented(2)
も参照)。 しかし、
ftime(3),
profil(3),
ulimit(3)
はライブラリルーチンとして
実装されている。
phys(2) 用の場所は 2.1.116
以降では
umount(2) 用に
使用されている;
将来においても
phys(2)
は実装されない。
getpmsg(2) と
putpmsg(2) は STREAMS
対応のパッチが適用された
カーネル用であり、標準のカーネルに登場することはないかもしれない。
set_zone_reclaim(2)
は少しの間だけ存在した。
Linux 2.6.13 で追加され、2.6.16
で削除された。このシステムコールがユーザー空間から使える状態になったことはない。
Some system calls only ever existed on Linux architectures that have since been
removed from the kernel:
- AVR32 (port removed in Linux 4.12)
- Blackfin (port removed in Linux 4.17)
- Metag (port removed in Linux 4.17)
- Tile (port removed in Linux 4.17)
たいていは、
/usr/include/asm/unistd.h
で定義されている番号
__NR_xxx
のシステムコールのコードは、
Linux カーネルソースの
sys_xxx()
というルーチンに書かれている。
しかしこれには多くの例外がある。古いシステムコールは新版に置き換えられて
きたが、この置き換えはあまり体系立てて行われて来なかったからである。
sparc, sparc64, alpha
といったプロプリエタリなオペレーティングシステムのエミュレーション機能があるプラットフォームでは、多くの追加システムコールがある。
mips64 には、32
ビットシステムコールのフルセットも含まれている。
Over time, changes to the interfaces of some system calls have been necessary.
One reason for such changes was the need to increase the size of structures or
scalar values passed to the system call. Because of these changes, certain
architectures (notably, longstanding 32-bit architectures such as i386) now
have various groups of related system calls (e.g.,
truncate(2) and
truncate64(2)) which perform similar tasks, but which vary in details
such as the size of their arguments. (As noted earlier, applications are
generally unaware of this: the glibc wrapper functions do some work to ensure
that the right system call is invoked, and that ABI compatibility is preserved
for old binaries.) Examples of systems calls that exist in multiple versions
are the following:
- *
- これまでに、
stat(2) には 3
種類の異なるバージョンが存在する。
sys_stat() (スロットは
__NR_oldstat)、 sys_newstat()
(スロットは __NR_stat)、
sys_stat64() (カーネル 2.4
で導入; スロットは
__NR_stat64)。
3つのうち最後のものが最新である。
lstat(2) と fstat(2)
についても同様である。
- *
- また、 __NR_oldolduname,
__NR_olduname, __NR_uname
という定義は、それぞれ
sys_olduname(), sys_uname(), sys_newuname()
というルーチンを参照している。
- *
- Linux 2.0 では、 vm86(2)
の新バージョンが登場した。カーネルルーチンの
古いバージョン、新しいバージョンはそれぞれ
sys_vm86old(), sys_vm86()
という名前である。
- *
- Linux 2.4 では、 getrlimit(2)
の新バージョンが登場した。カーネルルーチンの
古いバージョン、新しいバージョンはそれぞれ
sys_old_getrlimit() (スロットは
__NR_getrlimit), sys_getrlimit()
(スロットは __NR_ugetrlimit)
という名前である。
- *
- Linux 2.4 で、ユーザー
ID とグループ ID
のサイズが 16
ビットから 32
ビットに増えた。
この変更に対応するため、いくつかのシステムコールが追加された
( chown32(2), getuid32(2), getgroups32(2),
setresuid32(2) など)。
これらのシステムコールが、末尾の
"32"
が付かない同名の
古いバージョンに代わって使われるようになった。
- *
- Linux 2.4 では、32
ビットアーキテクチャー上のアプリケーションが
大きなファイル
(つまり、32
ビットでは表現できないサイズや
ファイルオフセットが必要なファイル)
にアクセスできるようになった。
この変更に対応するため、ファイルオフセットとサイズを扱う
システムコールの置き換えが必要となった。その結果、
fcntl64(2), getdents64(2), stat64(2),
statfs64(2), truncate64(2)
と、ファイルディスクリプターやシンボリックリンクで同じ機能を持つ
システムコールが追加された。
これらのシステムコールが、末尾の
"64"
が付かない同名の
古いバージョンに代わって使われるようになった。
但し、"stat"
系のシステムコールはその限りではない。
- On newer platforms that only have 64-bit file access and
32-bit UIDs/GIDs (e.g., alpha, ia64, s390x, x86-64), there is just a
single version of the UID/GID and file access system calls. On platforms
(typically, 32-bit platforms) where the *64 and *32 calls exist, the other
versions are obsolete.
- *
- リアルタイムシグナル
( signal(7) 参照)
への対応を追加するために、
rt_sig*
系のシステムコールがカーネル
2.2 で追加された。
これらのシステムコールが、先頭に
"rt_"
が付かない同名の
古いバージョンに代わって使われるようになった。
- *
- The select(2) and mmap(2) system calls use
five or more arguments, which caused problems in the way argument passing
on the i386 used to be set up. Thus, while other architectures have
sys_select() and sys_mmap() corresponding to
__NR_select and __NR_mmap, on i386 one finds
old_select() and old_mmap() (routines that use a pointer to
an argument block) instead. These days passing five arguments is not a
problem any more, and there is a __NR__newselect that corresponds
directly to sys_select() and similarly __NR_mmap2. s390x is
the only 64-bit architecture that has old_mmap().
- *
-
getxgid(2) returns a pair of GID and effective GID
via registers r0 and r20; it is provided instead of
getgid(2) and getegid(2).
- *
-
getxpid(2) returns a pair of PID and parent PID via
registers r0 and r20; it is provided instead of
getpid(2) and getppid(2).
- *
-
old_adjtimex(2) is a variant of adjtimex(2)
that uses struct timeval32, for compatibility with
OSF/1.
- *
-
getxuid(2) returns a pair of GID and effective GID
via registers r0 and r20; it is provided instead of
getuid(2) and geteuid(2).
- *
-
sethae(2) is used for configuring the Host Address
Extension register on low-cost Alphas in order to access address space
beyond first 27 bits.
intro(2),
syscall(2),
unimplemented(2),
errno(3),
libc(7),
vdso(7)
この man ページは Linux
man-pages
プロジェクトのリリース
5.10
の一部である。プロジェクトの説明とバグ報告に関する情報は
https://www.kernel.org/doc/man-pages/
に書かれている。