本文将以粘包问题分享一下swoole教程,什么是粘包问题,为什么我们要讲这个看起来比较奇怪的问题呢?

不着急解释,我们先看一个例子

创建一个server,server端代码如下

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 
<?php  class TcpBufferServer {  private $_serv;   /**  * init  */  public function __construct()  {  $this->_serv = new Swoole\Server("127.0.0.1", 9501);  $this->_serv->set([  'worker_num' => 1,  ]);  $this->_serv->on('Receive', [$this, 'onReceive']);  }  public function onReceive($serv, $fd, $fromId, $data)  {  echo "Server received data: {$data}" . PHP_EOL;  }  /**  * start server  */  public function start()  {  $this->_serv->start();  } }  $reload = new TcpBufferServer; $reload->start(); 

server的代码很简单,仅仅是在收到客户端代码后,标准输出一句话而已,client的代码需要注意了,我们写了一个for循环,连续向server send三条信息,代码如下

1 2 3 4 5 6 7 8 9 10 
<?php  $client = new swoole_client(SWOOLE_SOCK_TCP, SWOOLE_SOCK_SYNC); $client->connect('127.0.0.1', 9501) || exit("connect failed. Error: {$client->errCode}\n");  // 向服务端发送数据 for ($i = 0; $i < 3; $i++) {  $client->send("Just a test.\n"); } $client->close(); 

在未运行测试的情况下,我们期望server所在终端输出的结果应该是这样的

1 2 3 
Server received data: Just a test. Server received data: Just a test. Server received data: Just a test. 

注意哦,我们期望的结果是server被回调了3次,才有上述期望的结果值

实际运行的结果呢,是否与我们所期望的一致?我们看下

上图左边是server输出的信息。

我们看到,左侧显示的结果是server一次性输出的结果,按理论来说,client发起了3次请求,server应该跟我们期望的结果一致,会执行3次呀,这怎么回事呢?

这个问题,便是我们今天要说的粘包问题。

为了说清楚这个问题,我们先来看下client/server之间数据传递的过程

客户端->发送数据
服务端->接收数据
通常我们直觉性的认为,客户端直接向网络中传输数据,对端从网络中读取数据,但是这是不正确的。

socket有缓冲区buffer的概念,每个TCP socket在内核中都有一个发送缓冲区和一个接收缓冲区。客户端send操作仅仅是把数据拷贝到buffer中,也就是说send完成了,数据并不代表已经发送到服务端了,之后才由TCP协议从buffer中发送到服务端。此时服务端的接收缓冲区被TCP缓存网络上来的数据,而后server才从buffer中读取数据。

所以,在onReceive中我们拿到的数据并没有办法保证数据包的完整性,swoole_server可能会同时收到多个请求包,也可能只收到一个请求包的一部分数据。

这就是一个大问题呀,如此TCP协议不行呀,这货虽然能保证我们能正确的接收到数据但是数据不对呀,这麻烦不容小觑。

既然是个问题,那我们自然也就有解决问题的方法,不然我下面说啥呢,对吧。

swoole给我们提供了两种解决方案

EOF结束协议

EOF,end of file,意思是我们在每一个数据包的结尾加一个eof标记,表示这就是一个完整的数据包,但是如果你的数据本身含有EOF标记,那就会造成收到的数据包不完整,所以开启EOF支持后,应避免数据中含有EOF标记。

在swoole_server中,我们可以配置open_eof_check为true,打开EOF检测,配置package_eof来指定EOF标记。

swoole_server收到一个数据包时,会检测数据包的结尾是否是我们设置的EOF标记,如果不是就会一直拼接数据包,直到超出buffer或者超时才会终止,一旦认定是一个完整的数据包,就会投递给Worker进程,这时候我们才可以在回调内处理数据。

这样server就能保证接收到一个完整的数据包了?不能保证,这样只能保证server能收到一个或者多个完整的数据包。

为啥是多个呢?

我们说了开启EOF检测,即open_eof_check设置为true,server只会检测数据包的末尾是否有EOF标记,如果向我们开篇的案例连发3个EOF的数据,server可能还是会一次性收到,这样我们只能在回调内对数据包进行拆分处理。

我们拿开篇的案例为例

server开启eof检测并指定eof标记是\r\n,代码如下(完整的代码都有上传到github,见文末)

1 2 3 4 5 
$this->_serv->set([   'worker_num' => 1,   'open_eof_check' => true, //打开EOF检测   'package_eof' => "\r\n", //设置EOF  ]); 

客户端设置发送的数据末尾是\r\n符号,代码如下

1 2 3 
for ($i = 0; $i < 3; $i++) {   $client->send("Just a test.\r\n");  } 

按照我们刚才的分析,server的效果可能会一次性收到多个完整的包,我们运行看看结果

因此我们还需要在onReceive回调内对收到的数据进行拆分处理

1 2 3 4 5 6 7 8 9 10 11 12 13 
public function onReceive($serv, $fd, $fromId, $data) {  // echo "Server received data: {$data}" . PHP_EOL;   $datas = explode("\r\n", $data);  foreach ($datas as $data)  {  if(!$data)  continue;   echo "Server received data: {$data}" . PHP_EOL;  } } 

此时我们再看下运行结果

自行分包的效果便实现了,考虑到自行分包稍微麻烦,swoole提供了open_eof_split配置参数,启用该参数后,server会从左到右对数据进行逐字节对比,查找数据中的EOF标记进行分包,效果跟我们刚刚自行拆包是一样的,性能较差。

在案例的基础上我们看看open_eof_split配置

1 2 3 4 5 6 
$this->_serv->set([  'worker_num' => 1,  'open_eof_check' => true, //打开EOF检测  'package_eof' => "\r\n", //设置EOF  'open_eof_split' => true, ]); 

onReceive的回调,我们不需要自行拆包

1 2 3 4 
public function onReceive($serv, $fd, $fromId, $data) {  echo "Server received data: {$data}" . PHP_EOL; } 

client的测试代码使用\r\n(同server端package_eof标记一致),我们看下运行效果

EOF标记解决粘包就说这么多,下面我们再看看另一种解决方案

固定包头+包体协议

下面我们要说的,对于部分同学可能有点难度,对于不理解的,建议多看多操作多问多查,不躲避不畏惧,这样才能有所提高。

固定包头是一种非常通用的协议,它的含义就是在你要发送的数据包的前面,添加一段信息,这段信息了包含了你要发送的数据包的长度,长度一般是2个或者4个字节的整数。

在这种协议下,我们的数据包的组成就是包头+包体。其中包头就是包体长度的二进制形式。比如我们本来想向服务端发送一段数据 “Just a test.” 共12个字符,现在我们要发送的数据就应该是这样的

1 
pack('N', strlen("Just a test.")) . "Just a test." 

其中php的pack函数是把数据打包成二进制字符串。

为什么这样就能保证Worker进程收到的是一个完整的数据包呢?我来解释一下:

当server收到一个数据包(可能是多个完整的数据包)之后,会先解出包头指定的数据长度,然后按照这个长度取出后面的数据,如果一次性收到多个数据包,依次循环,如此就能保证Worker进程可以一次性收到一个完整的数据包。

估计好多人都看蒙了,这都是神马玩意?我们以案例来分析

server代码

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 
<?php  class ServerPack {  private $_serv;   /**  * init  */  public function __construct()  {  $this->_serv = new Swoole\Server("127.0.0.1", 9501);  $this->_serv->set([  'worker_num' => 1,  'open_length_check'     => true,      // 开启协议解析  'package_length_type'   => 'N',     // 长度字段的类型  'package_length_offset' => 0,       //第几个字节是包长度的值  'package_body_offset'   => 4,       //第几个字节开始计算长度  'package_max_length'    => 81920,  //协议最大长度  ]);  $this->_serv->on('Receive', [$this, 'onReceive']);  }  public function onReceive($serv, $fd, $fromId, $data)  {  $info = unpack('N', $data);  $len = $info[1];  $body = substr($data, - $len);  echo "server received data: {$body}\n";  }  /**  * start server  */  public function start()  {  $this->_serv->start();  } }  $reload = new ServerPack; $reload->start(); 

客户端的代码

1 2 3 4 5 6 7 8 9 10 11 12 13 
<?php  $client = new swoole_client(SWOOLE_SOCK_TCP, SWOOLE_SOCK_SYNC); $client->connect('127.0.0.1', 9501) || exit("connect failed. Error: {$client->errCode}\n");  // 向服务端发送数据 for ($i = 0; $i < 3; $i++) {  $data = "Just a test.";  $data = pack('N', strlen($data)) . $data;  $client->send($data); }  $client->close(); 

运行的结果

结果没错,是我们期望的结果。

我们来分析下这是为什么

1、首先,在server端我们配置了open_length_check,该参数表明我们要开启固定包头协议解析

2、package_length_type配置,表明包头长度的类型,这个类型跟客户端使用pack打包包头的类型一致,一般设置为N或者n,N表示4个字节,n表示2个字节

3、我们看下客户端的代码 pack(‘N’, strlen($data)) . $data,这句话就是包头+包体的意思,包头是pack函数打包的二进制数据,内容便是真实数据的长度 strlen($data)。

在内存中,整数一般占用4个字节,所以我们看到,在这段数据中0-4字节表示的是包头,剩余的就是真实的数据。但是server不知道呀,怎么告诉server这一事实呢?

看配置package_length_offset和package_body_offset,前者就是告诉server,从第几个字节开始是长度,后者就是从第几个字节开始计算长度。

4、既然如此,我们就可以在onReceive回调对数据解包,然后从包头中取出包体长度,再从接收到的数据中截取真正的包体。

1 2 3 4 
$info = unpack('N', $data); $len = $info[1]; $body = substr($data, - $len); echo "server received data: {$body}\n"; 

这便是swoole教程对于粘包问题的解决,想要获取更多关于swoole相关资讯或者教程,持续关注编程学习网