差错报文类型
5.2 ping 的工作原理
IP 协议的助手 —— ICMP 协议
ping 是基于 ICMP 协议工作的,所以要明白 ping 的工作,首先我们先来熟悉 ICMP 协议。
ICMP 是什么 ?
ICMP 全称是 Internet Control Message Protocol ,也就是互联网控制报文协议。
里面有个关键词 —— 控制,如何控制的呢?
网络包在复杂的网络传输环境里,常常 会遇到各种问题。当遇到问题的时候,总不能死的不明不
白,没头没脑的作⻛不是计算机网络的⻛格。所以需要传出消息,报告遇到了什么 问题,这样才
可以调整传输策略,以此来控制整个局面。
ICMP 功能都有啥?
ICMP 主要的功能包括:确认 IP 包是否成功送达目标地址 、报告发送过程中 IP 包被废弃的原因
和改善网络设置等。
在 IP 通信中如果某 个 IP 包因为某种原因未能达到目标地址 ,那么这个具体的原因将由 ICMP
负责 通知。

如上图例子,主机 A 向主机 B 发送了数据包,由于某种原因,途中的路由器 2 未能发现主
机 B 的存在,这时,路由器 2 就会向主机 A 发送一个 ICMP 目标不可达数据包,说明发往
主机 B 的包未能成功。
ICMP 的这种通知消息会使 用 IP 进行发送 。
因此,从路由器 2 返回的 ICMP 包会按照往常的路由控制先经过路由器 1 再转发给主机 A
。收到该 ICMP 包的主机 A 则分 解 ICMP 的首部和数据域以后得知具体发生问题的原因。
ICMP 包头格式
ICMP 报文是封装在 IP 包里面,它工作在网络层,是 IP 协议的助手。

ICMP 包头的类型字段,大致可以分为两 大类:
一类是用于诊断的查询消息,也就是「查询报文类型」
另一类是通知出错原因的错误消息,也就是「差错报文类型」

查询报文类型
回送消息 —— 类型 0 和 8
回送消息用于进行通信的主机或路由器之间,判断所发送的数据包是否已经成功到 达对端的一种
消息, ping 命令就是利用这个消息实现的。

可以向对端主机发送回送请求的消息( ICMP Echo Request Message ,类型 8 ),也可以接收对端主机发回来的回送应答消息( ICMP Echo Reply Message ,类型 0 )。

相比原生的 ICMP ,这里多了两个 字段:
标识符:用以区分是哪个应用程序发 ICMP 包,比如用进程 PID 作为标识符;
序号:序列号从 0 开始,每发送一次新的回送请求就会加 1 , 可以用来确认网络包是否有
丢失。
在选项数据中, ping 还会存放发送请求的时间值,来计算往返时间,说明路程的⻓短。
差错报文类型
接下来,说明几个常用的 ICMP 差错报文的例子:
目标不可达消息 —— 类型 为 3
原点抑制消息 —— 类型 4
重定向消息 —— 类型 5
超时消息 —— 类型 11
目标不可达消息(Destination Unreachable Message ) —— 类型为 3
IP 路由器无法将 IP 数据包发 送给目标地址 时,会给发送端主机返回一个目标不可达的 ICMP 消
息,并在这个消息中显示不可达的具体原因,原因记录在 ICMP 包头的代码字段。
由此,根据 ICMP 不可达的具体消息,发送端主机也就可以了解此次 发送不可达的具体原因。
举例 6 种常⻅的目标不可达类型的代码:

网络不可达代码为 0
主机不可达代码为 1
协议不可达代码为 2
端口不可达代码为 3
需要进行分片但设置了不 分片位代 码为 4
a. 网络不可达代码为 0
IP 地址 是分为网络号和 主机号的,所以当路由器中的路由器表匹配不到接收方 IP 的网络号,就通
过 ICMP 协议以网络不可达( Network Unreachable )的原因告知主机。
自从不 再有网络分类以后,网络不可达也渐渐 不再使用了。
b. 主机不可达代码为 1
当路由表中没有该主机的信息,或者该主机没有连接到网络,那么会通过 ICMP 协议以主机不可达
( Host Unreachable )的原因告知主机。
c. 协议不可达代码为 2
当主机使用 TCP 协议访 问对端主机时,能找到对端的主机了,可是对端主机的防火墙已经禁止
TCP 协议访 问,那么会通过 ICMP 协议以协议不可达的原因告知主机。
d. 端口不可达代码为 3
当主机访问对端主机 8080 端口时,这次能找到对端主机了,防火墙也没有限制,可是发现对端主
机没有进程监听 8080 端口,那么会通过 ICMP 协议以端口不可达的原因告知主机。
e. 需要进行分片但设置了不 分片位代 码为 4
发送端主机发送 IP 数据报时,将 IP 首部的分片禁止标志位设置为 1 。根据这个标志位,途中的
路由器遇到超过 MTU 大小的数据包时,不会进行分片,而是直接抛弃。
随后,通过一个 ICMP 的不可达消息类型,代码为 4 的报文,告知发送端主机。
原点抑制消息(ICMP Source Quench Message ) —— 类型 4
在使用低速广域线路的情况下,连接 WAN 的路由器可能会遇到网络拥堵的问题。
ICMP原点抑制消息的目的就是为了 缓和这种拥堵情况。
当路由器向低速线路发送数据时,其发送队列的缓存变为零而无法发送出去时,可以向 IP 包的源
地址 发送一个 ICMP 原点抑制消息。
收到这个消息的主机借此了解在整个线路的某一处发生了拥堵的情况,从而增大 IP 包的传输间隔,减少网络拥堵的情况。
然而,由于这种 ICMP 可能会引起不公平的网络通信,一般不被使用。
重定向消息(ICMP Redirect Message ) —— 类型 5
如果路由器发现发送端主机使用了「不是最优」的路径发送数据,那么它会返回一个 ICMP 重定向
消息给这个主 机。
在这个消息中包含了最合适的路由信息和源数据。这主要发生在路由器持有更 好的路由信息的情
况下。路由器会通过这 样的 ICMP 消息告知发送端,让它下次发给另外一个路由器。
超时消息(ICMP Time Exceeded Message ) —— 类型 11
IP 包中有一个字段叫做 TTL ( Time To Live ,生存周期),它的值随着每经过一次路由器就会
减 1,直到减到 0 时该 IP 包会被丢弃。
此时,路由器将会发送一个 ICMP 超时消息给发送端主机,并通知该包已被丢弃。
设置 IP 包生存周期的主要目的,是为了 在路由控制遇到问题发生循环状况时,避免 IP 包无休止地在网络上被转发。

此外,有时可以用 TTL 控制包的到达范围,例如设置一个较小的 TTL 值。
ping —— 查询报文类型的使用
接下来,我们重点来看 ping 的发送和接收过程。
同个子网下的主机 A 和 主机 B,主机 A 执行 ping 主机 B 后,我们来看看 其间发送了什么 ?

ping 命令执行的时候,源主机首先会构建一个 ICMP 回送请求消息数据包。
ICMP 数据包内包含多个字段,最重要的是两个 :
第一个是类型,对于回送请求消息而言该字段为 8 ;
另外一个是序号,主要用于区分连续 ping 的时候发出的多个数据包。
每发出一个请求数据包,序号会自动加 1 。为了 能够计算往返时间 RTT ,它会在报文的数据部
分插入发送时间。

然后,由 ICMP 协议将这个数据包连同地址 192.168.1.2 一起交给 IP 层。IP 层将 以 192.168.1.2 作为目的地址 ,本机 IP 地址 作为源地址 ,协议字段设置为 1 表示是 ICMP 协议,再加上一些其他
控制信息,构建一个 IP 数据包。

接下来,需要加入 MAC 头。如果在本地 ARP 映射表中查找出 IP 地址 192.168.1.2 所对应的 MAC
地址 ,则可以直接使用;如果没有,则需要发送 ARP 协议查询 MAC 地址 ,获得 MAC 地址 后,
由数据链路层构建一个数据帧,目的地址 是 IP 层传过来的 MAC 地址 ,源地址 则是本机 的 MAC 地址;还要附加上一些控制信息,依据以太网的介质访问规则,将它们传 送出去。

主机 B 收到这个数据帧后,先检查它的目的 MAC 地址 ,并和本机 的 MAC 地址 对比,如符合,
则接收,否则就丢弃。
接收后检查该数据帧,将 IP 数据包从帧中提取出来,交给本机 的 IP 层。同样,IP 层检查后,将有
用的信息提取后交给 ICMP 协议。
主机 B 会构建一个 ICMP 回送响应消息数据包,回送响应数据包的类型字段为 0 ,序号为接收
到的请求数据包中的序号,然后再发送出去给主机 A。

在规定的时候间内,源主机如果没有接到 ICMP 的应答包,则说明目标主机不可达;如果接收到了
ICMP 回送响应消息,则说明目标主机可达。
此时,源主机会检查,用当前时刻减去该数据包最初从源主机上发出的时刻,就是 ICMP 数据包的
时间延迟。
针对上面发送的事情,总结成了如下图:

当然这只是最简单的,同一个局域网里面的情况。如果跨网段的话,还会涉及网关的转发、路由
器的转发等等 。
但是对于 ICMP 的头来讲,是没什么 影响的。会影响的是根据目标 IP 地址 ,选择路由的下一跳,
还有每经过一个路由器到达一个新的局域网,需要换 MAC 头里面的 MAC 地址 。
说了这么多,可以看出 ping 这个程序是使用了 ICMP 里面的 ECHO REQUEST (类型为 8 ) 和
ECHO REPLY (类型为 0)。
traceroute —— 差错报文类型的使用
有一款充分利 用 ICMP 差错报文类型的应用叫做 traceroute (在UNIX 、MacOS 中是这个命令,
而在Windows 中对等的命令叫做 tracert )。
- traceroute
作用一
traceroute 的第一个作用就是故意设置特殊的 TTL ,来追踪去往目的地时沿途经过的路由器。
traceroute 的参数指向某个目的 IP 地址 :
这个作用是如何工作的呢?
它的原理就是利用 IP 包的生存期限 从 1 开始按照顺序递增的同时发送 UDP 包,强制接收 ICMP
超时消息的一种方法。
比如,将 TTL 设置 为 1 ,则遇到第一个路由器, 就牺牲 了,接着返回 ICMP 差错报文网络包,
类型是时间超时。
接下来将 TTL 设置为 2 ,第一个路由器过了,遇到第二个路由器也牺牲 了,也同时返回了 ICMP
差错报文数据包,如此往复,直到到 达目的主机。
这样的过程,traceroute 就可以拿到了所有的路由器 IP 。
当然有的路由器根本就不会返回这个 ICMP ,所以对于有的公网地址 ,是看不到中间经过的路由
的。
发送方如何知道发出的 UDP 包是否到达了目的主机呢?
traceroute 在发送 UDP 包时,会填入一个不可能的端口号值作为 UDP 目标端口号:33434 。然
后对于每个下 一个探针,它都会增加一个,这些端口都是通常认为不 会被使用,不过,没有人知
道当某些应用程序监听此类端口时会发生什么 。
当目的主机,收到 UDP 包后,会返回 ICMP 差错报文消息,但这个差错报文消息的类型是「端口
不可达」。
所以,当差错报文类型是端口不可达时,说明发送方发出的 UDP 包到达了目的主机。
- traceroute
作用二
traceroute 还有一个作用是故意设置不分片,从而确定路径的 MTU 。
这么做是为了什么 ?
这样做的目的是为了 路径MTU 发现。
因为有的时候我们并不知道路由器的 MTU 大小,以太网的数据链路上的 MTU 通常是 1500 字
节,但是非以太网的 MTU 值就不一样了,所以我们要知道 MTU 的大小,从而控制发送的包大
小。

它的工作原理如下:
首先在发送端主机发送 IP 数据报时,将 IP 包首部的分片禁止标志位设置为 1。根据这个标志
位,途中的路由器不会对大数据包进行分片,而是将包丢弃。
随后,通过一个 ICMP 的不可达消息将数据链路上 MTU 的值一起给发送主机,不可达消息的类型
为「需要进行分片但设置了不 分片位」。
发送主机端每次 收到 ICMP 差错报文时就减少包的大小,以此来定位一个合适的 MTU 值,以便 能
到达目标主机。
