Simple Systemd

概述

按照Linux的管理,字母d既是守护进程(daemon)的意思,systemd名字的含义,就是他要守护整个系统.它的设计目标,为系统的启动和管理提供一套完整的解决方案.

使用了Systemd就不再需要init了,它取代了init成为了系统第一个进程(PID为1),其他进程都是他的子进程.

查看Systemd的版本:

$ systemctl --version

Systemd的功能强大,使用方便,但是其缺点是体系庞大,非常复杂.

系统管理

Systemd并不是一个命令,而是一组命令,涉及到系统的方方面面.

systemctl

systemctl是Systemd的主命令,用于管理系统.

# 重启系统
$ sudo systemctl reboot

# 关闭系统,切断电源
$ sudo systemctl poweroff

# CPU停止工作
$ sudo systemctl halt

# 暂停系统
$ sudo systemctl suspend

# 让系统进入冬眠状态
$ sudo systemctl hibernate

# 让系统进入交互式休眠状态
$ sudo systemctl hybrid-sleep

# 启动进入救援状态(单用户状态)
$ sudo systemctl rescue

systemd-analyze

用于查看启动耗时.

# 查看启动耗时
$ systemd-analyze                                                                                       

# 查看每个服务的启动耗时
$ systemd-analyze blame

# 显示瀑布状的启动过程流
$ systemd-analyze critical-chain

# 显示指定服务的启动流
$ systemd-analyze critical-chain atd.service

hostnamectl

用于查看当前的主机信息.

# 显示当前主机的信息
$ hostnamectl

# 设置主机名。
$ sudo hostnamectl set-hostname rhel7

localectl

用于查看本地化设置.

# 查看本地化设置
$ localectl

# 设置本地化参数。
$ sudo localectl set-locale LANG=en_GB.utf8
$ sudo localectl set-keymap en_GB

timedatectl

用于查看当前的时区设置.

# 查看当前时区设置
$ timedatectl

# 显示所有可用的时区
$ timedatectl list-timezones                                                                                   

# 设置当前时区
$ sudo timedatectl set-timezone America/New_York
$ sudo timedatectl set-time YYYY-MM-DD
$ sudo timedatectl set-time HH:MM:SS

loginctl

用于查看当前登录的用户.

# 列出当前session
$ loginctl list-sessions

# 列出当前登录用户
$ loginctl list-users

# 列出显示指定用户的信息
$ loginctl show-user ruanyf

Unit

Systemd可以管理所有系统资源,不同的资源统称为Unit(单位).

Unit一共分为12种:

  1. Service unit:系统服务
  2. Target unit:多个 Unit 构成的一个组
  3. Device Unit:硬件设备
  4. Mount Unit:文件系统的挂载点
  5. Automount Unit:自动挂载点
  6. Path Unit:文件或路径
  7. Scope Unit:不是由 Systemd 启动的外部进程
  8. Slice Unit:进程组
  9. Snapshot Unit:Systemd 快照,可以切回某个快照
  10. Socket Unit:进程间通信的 socket
  11. Swap Unit:swap 文件
  12. Timer Unit:定时器

systemctl list-units可以查看当前系统的所有Unit:

# 列出正在运行的 Unit
$ systemctl list-units

# 列出所有Unit,包括没有找到配置文件的或者启动失败的
$ systemctl list-units --all

# 列出所有没有运行的 Unit
$ systemctl list-units --all --state=inactive

# 列出所有加载失败的 Unit
$ systemctl list-units --failed

# 列出所有正在运行的、类型为 service 的 Unit
$ systemctl list-units --type=service

Unit的状态

systemctl status用于查看当前系统状态和单个Unit状态:

# 显示系统状态
$ systemctl status

# 显示单个 Unit 的状态
$ sysystemctl status bluetooth.service

# 显示远程主机的某个 Unit 的状态
$ systemctl -H root@rhel7.example.com status httpd.service

除了status命令,还提供了三个查询状态的简单方法,主要提供脚本内部的判断语句使用:

# 显示某个 Unit 是否正在运行
$ systemctl is-active application.service

# 显示某个 Unit 是否处于启动失败状态
$ systemctl is-failed application.service

# 显示某个 Unit 服务是否建立了启动链接
$ systemctl is-enabled application.service

Unit管理

用于启动和停止Unit:

# 立即启动一个服务
$ sudo systemctl start apache.service

# 立即停止一个服务
$ sudo systemctl stop apache.service

# 重启一个服务
$ sudo systemctl restart apache.service

# 杀死一个服务的所有子进程
$ sudo systemctl kill apache.service

# 重新加载一个服务的配置文件
$ sudo systemctl reload apache.service

# 重载所有修改过的配置文件
$ sudo systemctl daemon-reload

# 显示某个 Unit 的所有底层参数
$ systemctl show httpd.service

# 显示某个 Unit 的指定属性的值
$ systemctl show -p CPUShares httpd.service

# 设置某个 Unit 的指定属性
$ sudo systemctl set-property httpd.service CPUShares=500

依赖关系

Unit之间存在依赖关系,A依赖于B,意味着Systemd在启动A的同时会去启动B.

systemctl list-dependencies 命令列出一个Unit的所有依赖:

$ systemctl list-dependencies nginx.service

上面命令的输出结果中,有些依赖类型是Target类型,默认不会展开展示,如果需要展开,使用-all参数:

$ systemctl list-dependencies --all nginx.service

Unit的配置文件

每个Unit都有一个配置文件,告诉Systemd怎么启动这个Unit.默认从目录/etc/systemd/system/读取配置文件,但是里面存放的大部分文件都是符号连接,指向/usr/lib/systemd/system/,这是文件真正存放的目录.

systemctl enable 命令用于在以上两个目录之间建立符号链接:

$ sudo systemctl enable clamd@scan.service
# 等同于
$ sudo ln -s '/usr/lib/systemd/system/clamd@scan.service' '/etc/systemd/system/multi-user.target.wants/clamd@scan.service'

如果配置文件里设置了开机启动,systemctl enable 相当于激活开机启动.

于此对应的,systemctl disable 命令用于在两个目录之间撤销链接符号,相当于撤销开机启动:

$ sudo systemctl disable clamd@scan.service

配置文件后缀名,就是该Unit的种类,比如 sshd.socket.如果省略,Systemd的默认后缀名是service,所以sshd会被理解成service.

配置文件的状态

systemctl list-unit-files 命令用于列出所有的配置文件:

# 列出所有配置文件
$ systemctl list-unit-files

# 列出指定类型的配置文件
$ systemctl list-unit-files --type=service

这个命令会列出一个列表:

$ systemctl list-unit-files

UNIT FILE              STATE
chronyd.service        enabled
clamd@.service         static
clamd@scan.service     disabled

这个列表显示每个配置文件的状态,一共四种:

  1. enabled: 已建立启动链接
  2. disabled: 未建立启动链接
  3. static: 该配置文件没有[install]部分(无法执行),只能作为其他配置文件的依赖
  4. masked: 该配置文件被禁止建立启动链接

但是,从配置文件的状态无法看出该Unit是否在运行,必须执行前面提到的systemctl status命令:

$ systemctl status bluetooth.service

一旦修改配置文件,就要让Systemd重新加载配置文件,然后重新启动,否则修改不会生效:

$ sudo systemctl daemon-reload
$ sudo systemctl restart httpd.service

配置文件的格式

配置文件就是普通的文本文件,可以使用文本编辑器打开.systemctl cat 命令可以查看配置文件的内容:

$ systemctl cat atd.service

[Unit]
Description=ATD daemon

[Service]
Type=forking
ExecStart=/usr/bin/atd

[Install]
WantedBy=multi-user.target

从上面的配置文件可以看出,配置文件分为几个区块,每个区块的第一行,使用中括号区分各个区块的类型,比如[Unit].配置文件的区块名和字段名都是大小写敏感的.

每个区块都是一些等号连接的键值对:

[Section]
Directive1=value
Directive2=value

. . .

注意,等号的两侧不能有空格.

配置文件的区块

[Unit]通常是配置文件的第一个区块,用来定义Unit的元数据,以及配置与其他Unit的关系:

  1. Description:简短描述
  2. Documentation:文档地址
  3. Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败
  4. Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败
  5. BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行
  6. Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动
  7. After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动
  8. Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行
  9. Condition…:当前 Unit 运行必须满足的条件,否则不会运行
  10. Assert…:当前 Unit 运行必须满足的条件,否则会报启动失

[Install]通常是配置文件的最后一个区块,用来定义如何启动以及是否开机启动:

  1. WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中
  2. RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
  3. Alias:当前 Unit 可用于启动的别名
  4. Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]用来Service配置,只有Service类型的Unit才有这个区块:

  1. Type:定义启动时的进程行为。它有以下几种值:
    • Type=simple:默认值,执行ExecStart指定的命令,启动主进程
    • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
    • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
    • Type=dbus:当前服务通过D-Bus启动
    • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
    • Type=idle:若有其他任务执行完毕,当前服务才会运行
  2. ExecStart:启动当前服务的命令
  3. ExecStartPre:启动当前服务之前执行的命令
  4. ExecStartPost:启动当前服务之后执行的命令
  5. ExecReload:重启当前服务时执行的命令
  6. ExecStop:停止当前服务时执行的命令
  7. ExecStopPost:停止当其服务之后执行的命令
  8. RestartSec:自动重启当前服务间隔的秒数
  9. Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdog
  10. TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数
  11. Environment:指定环境变量

Unit配置完整清单参考官方文档.

Target

启动计算机的时候需要启动大量的Unit,如果每一次启动都逐个写明启动哪个Unit,显然很不方便,Systemd的解决方案就是Target.

简单的说,Target就是一个Unit组,包含许多相关的Unit.启动某个Target的时候,Systemd就会启动里面所有的Unit,Target就类似于某个状态点,启动某个Target就是启动到某种状态.

船艇的Init启动模式里面,有RunLevel的概念,跟Target的作用很类似.不同的是RunLevel是互斥的,不可能有多个RunLevel同时启动,但是多个Target可以同时启动.

# 查看当前系统的所有 Target
$ systemctl list-unit-files --type=target

# 查看一个 Target 包含的所有 Unit
$ systemctl list-dependencies multi-user.target

# 查看启动时的默认 Target
$ systemctl get-default

# 设置启动时的默认 Target
$ sudo systemctl set-default multi-user.target

# 切换 Target 时,默认不关闭前一个 Target 启动的进程,
# systemctl isolate 命令改变这种行为,
# 关闭前一个 Target 里面所有不属于后一个 Target 的进程
$ sudo systemctl isolate multi-user.target

Target与传统的Init对应关系如下:

Traditional runlevel      New target name     Symbolically linked to...

Runlevel 0           |    runlevel0.target -> poweroff.target
Runlevel 1           |    runlevel1.target -> rescue.target
Runlevel 2           |    runlevel2.target -> multi-user.target
Runlevel 3           |    runlevel3.target -> multi-user.target
Runlevel 4           |    runlevel4.target -> multi-user.target
Runlevel 5           |    runlevel5.target -> graphical.target
Runlevel 6           |    runlevel6.target -> reboot.target

日志管理

# 查看所有日志(默认情况下 ,只保存本次启动的日志)
$ sudo journalctl

# 查看内核日志(不显示应用日志)
$ sudo journalctl -k

# 查看系统本次启动的日志
$ sudo journalctl -b
$ sudo journalctl -b -0

# 查看上一次启动的日志(需更改设置)
$ sudo journalctl -b -1

# 查看指定时间的日志
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago"

# 显示尾部的最新10行日志
$ sudo journalctl -n

# 显示尾部指定行数的日志
$ sudo journalctl -n 20

# 实时滚动显示最新日志
$ sudo journalctl -f

# 查看指定服务的日志
$ sudo journalctl /usr/lib/systemd/systemd

# 查看指定进程的日志
$ sudo journalctl _PID=1

# 查看某个路径的脚本的日志
$ sudo journalctl /usr/bin/bash

# 查看指定用户的日志
$ sudo journalctl _UID=33 --since today

# 查看某个 Unit 的日志
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today

# 实时滚动显示某个 Unit 的最新日志
$ sudo journalctl -u nginx.service -f

# 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today

# 查看指定优先级(及其以上级别)的日志,共有8级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
$ sudo journalctl -p err -b

# 日志默认分页输出,--no-pager 改为正常的标准输出
$ sudo journalctl --no-pager

# 以 JSON 格式(单行)输出
$ sudo journalctl -b -u nginx.service -o json

# 以 JSON 格式(多行)输出,可读性更好
$ sudo journalctl -b -u nginx.serviceqq
 -o json-pretty

# 显示日志占据的硬盘空间
$ sudo journalctl --disk-usage

# 指定日志文件占据的最大空间
$ sudo journalctl --vacuum-size=1G

# 指定日志文件保存多久
$ sudo journalctl --vacuum-time=1years

开机启动

对于那些支持Systemd的应用,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件.如果想让该软件自动启动,就执行下面的命令:

$ sudo systemctl enable httpd

上面的命令等于在/etc/systemd/system目录添加了一个符号连接,指向/usr/lib/systemd/system里面的httpd.service文件.

启动服务

设置开机启动服务之后,软件并不会立即启动,必须等到下一次开机,如果想立即启动软件,需要执行下面的命令:

$ sudo systemctl start httpd

执行上面的命令之后,有可能执行失败,因此可以使用命令systemctl status 查看运行状态:

$ sudo systemctl status httpd

会显示该服务的运行属性:

  1. Loaded行:配置文件的位置,是否设为开机启动
  2. Active行:表示正在运行
  3. Main PID行:主进程ID
  4. Status行:由应用本身(这里是 httpd )提供的软件当前状态
  5. CGroup块:应用的所有子进程
  6. 日志块:应用的日志

停止服务

终止正在运行的服务需要使用systemctl stop命令:

$ sudo systemctl stop httpd.service

有时候该命令没有响应,服务停不下来,这时候不得不杀进程了.向正在运行服务发送kill命令:

$ sudo systemctl kill httpd.service

此外,重启该服务的命令:

$ sudo systemctl restart httpd.service

读懂配置文件

一个服务怎么启动完全由他的配置文件决定,上面说过,配置文件主要在/usr/lib/systemd/system目录,也可以在/etc/lib/systemd/system.

下面是以sshd.service服务为例,他的作用是启动一个SSH服务,供其他用户以SSH方式登录:

$ systemctl cat sshd.service

[Unit]
Description=OpenSSH server daemon
Documentation=man:sshd(8) man:sshd_config(5)
After=network.target sshd-keygen.service
Wants=sshd-keygen.service

[Service]
EnvironmentFile=/etc/sysconfig/sshd
ExecStart=/usr/sbin/sshd -D $OPTIONS
ExecReload=/bin/kill -HUP $MAINPID
Type=simple
KillMode=process
Restart=on-failure
RestartSec=42s

[Install]
WantedBy=multi-user.target

阮一峰: Systemd 入门教程