^ _ ^
简介
Netty是JBoss提供的一个Java开源框架,主要针对在TCP协议下,面向Client端的高并发应用,或者点对点场景下的大量数据持续的传输。Netty本质上是一个NIO框架,封装了进行NIO的一系列操作。
Netty的实际应用
- 大数据领域:Apache-Flink、Apache-Spark
- 游戏领域:联机游戏
- 互联网领域:分布式系统中结点之间的远程调用,如Dubbo
一般来说,需要用到高并发网络通信的地方都需要用到Netty
推荐书籍
Netty实战、Netty权威指南
Java IO模型
Java支持三种网络IO模型,分别是BIO(阻塞IO),NIO(非阻塞IO),AIO(异步非阻塞IO,但只在windows系统上适用)
BIO模型
工作机制:
- Server启动一个监听线程监听Client请求
- 对于每一个可接收的Client请求,Server将创建一个线程与客户端进行通信
弊端:
- 每个通信线程都是阻塞式的,如果和客户端交流并不频繁,则CPU浪费率很大
- 对于每一个客户端都需要新建一个线程,当客户端很多是,系统负荷太大
应用场景:连接数目较小且固定的场景
NIO模型
工作机制:
- Server启动一个Channel Manager作为所有通信通道的管理者
- 每个Client若希望与Server进行网络IO通信,则它会将希望进行的操作(如读、写、建立连接等)在Channel Manager处注册一个Channel
- Channel Manager会不断轮询所有注册在册的Channel,若这个Channel中有事件发生,则对这个事件进行处理
- 处理事件的线程既可以是Channel Manager所处线程,也可以是从线程池中取一个线程来进行处理(通常这种方式更高效)
Channel Manager通常被称作Selector
,除此之外,NIO的核心组件还包括Buffer
,Channel
。
Buffer在上图中未表现,它实际上是Channel和Socket之间的缓冲区。
应用场景:连接数目较多且连接比较短的场景,如聊天服务器、弹幕系统、服务器之间的通讯等
Buffer
Buffer是缓冲区,正是因为NIO模型具有Buffer,因此它是基于块的读写,相比于BIO基于流的读写更有效率。Buffer类派生了IntBuffer,ByteBuffer等子类,所有Buffer类保存数据的底层结构都是数组。
Buffer类的核心属性
属性 | 描述 | 备注 |
---|---|---|
capacity | 容量 | 可容纳的最大数据量,在缓冲区创建时设定,设定后不可改变 |
limit | 缓冲区当前终点 | 不能对缓冲区中超过limit的位置进行读写,limit是可以修改的 |
position | 位置 | 下一个读/写元素的索引 |
mark | 标记 | 可以在某些位置设置一些标记以方便用户操作 |
Channel
相比于流只能单向操作(读或者写),而通道支持同时读写。在NIO中,Channel从Buffer中读数据(write(ByteBuffer src)),写数据到Buffer中(read(ByteBuffer dst))。
Channel是NIO中的一个接口,常用的Channel类如下:
- ServerSocketChannel:对应服务器监听客户请求Socket
- SocketChannel:对应Server-Client通信Socket
- DatagramChannel:对应UDP数据报通信
- FileChannel:对应文件读写
Selector
在NIO模型中充当一个管理者的角色,将不断轮询所有在它这注册过的channel,当channel处有事件发生时,通知相应程序来处理事件。这种机制使得服务器一个线程可以负责与多个客户端之间的通信,其中每个线程对应一个Selector。
Selector常见操作
1 | // 创建一个Selector |
NIO与零拷贝
零拷贝并不意味着拷贝数目为0,而意味着CPU拷贝次数为0
传统网络通信IO过程
- 数据一开始是存在于硬件驱动(
Hard Driver
)中的 - 通过DMA将硬件中的数据传输到操作系统的内核空间里的缓冲区(
Kernel Buffer
) - 通过CPU总线将内核空间中的数据复制到用户空间里的缓冲区(
User Buffer
) - 通过CPU总线将用户空间的数据复制到内核空间中的套接字缓冲区(
Socket Buffer
)中 - 套接字缓冲区再将数据复制到协议栈引擎(
Protocol Engine
)中
传统IO过程经历了4次复制,3次(用户态和内核态的)上下文切换
mmap优化
mmap通过内存映射,将文件映射到内核缓冲区。同时,用户空间可以共享内核空间的数据。这样,在网络传输过程中,就可以减少一次内核空间到用户空间的拷贝。
mmap优化后网络通信过程经历了3次复制,3次上下文切换
sendFile优化
Linux2.1提供了sendFile函数,使得内核缓冲区中的数据可以不经过用户态直接拷贝到socket缓冲区内。
sendFile优化后网络通信过程经历了3次复制,2次上下文切换
零拷贝
Linux2.4对sendFile函数做了优化,避免了从内核缓冲区将数据拷贝到socket缓冲区的操作,直接将内核缓冲区中的数据拷贝到了协议栈。这里其实有一次cpu拷贝(kernel buffer–>socket buffer),但拷贝的信息很少(如length,offset),消耗低,可以忽略。
这种方式可以近似经历了2次复制,2次上下文切换
AIO模型
AIO引入了异步通道的概念,采用Proactor模式,简化了程序编写:有效的请求才启动线程,它的特点是先由操作系统完成后才通知服务端启动线程去处理。
应用场景:连接数目比较多且连接比较长的场景,如相册服务器
Reactor模式
Reactor模式是一种设计模式,它是基于事件驱动的,可以并发的处理多个服务请求,当请求抵达后,依据多路复用策略,同步的派发这些请求至相关的请求处理程序。
- Handle:操作系统的一种资源,用于表示一个事件(在网络编程中可以是连接事件、写事件、读事件)
- Synchronous Event Demultiplexer:本质上是一个系统调用,用于等待事件的发生。调用方在调用它是会阻塞,直到同步事件分离器上有事件发生
- Initiation Dispatcher:定义了一些控制事件的调度规范,提供事件管理。
- Event Handler:事件处理器的接口
- Concrete Event Handler:事件处理器的实现
Reactor模式的工作流程
- 初始化Initiation Dispatcher,若干个Concret Event Handler注册到Dispatcher中(希望Dispatcher会在注册的事件发生时通知自己)
- Initiation Dispatcher会要求每个Handler向其传递内部Handle,操作系统可以通过Handle标识对应的Handler
- 当所有Concret Event Handler注册完毕,Initiation Dispatcher将启动循环,使用Synchronous Event Demultiplexer等待事件的发生
- 当某个Handle发生时,Synchronous Event Demultiplexer会通知Initiation Dispatcher
- Initiation Dispatcher再调用相应的Handler回调方法处理这个事件
单Reactor单线程
工作机制
- Reactor通过select监听客户端请求事件,当有事件发生时,调用dispatcher进行分发
- 如果是建立连接请求事件,则Acceptor通过accept处理连接请求事件,然后创建一个Handler对象处理完成连接后的各种事件
- 如果不是连接请求,则由Reactor分发调用对应的Handler进行处理
Reactor和Handler都在同一线程中,说明当Handler在处理时,Reactor是不能工作的,那么此时到来的客户端请求就会被阻塞。
单Reactor多线程
工作机制
- Reactor通过select监听客户端请求事件,当有事件发生时,调用dispatcher进行分发
- 如果是建立连接请求事件,则Acceptor通过accept处理连接请求事件,然后创建一个Handler对象处理完成连接后的各种事件
- 如果不是连接请求,则由Reactor分发调用对应的Handler进行处理
- Handler只负责响应事件,不做具体的业务处理。响应事件的Handler,会在读完数据后,分发给工作线程池中的某个线程处理具体的业务逻辑
- 工作线程池会分配独立线程完成真正的业务,并将结果返回给Handler
- Handler收到响应后,通过send方法将结果返回给客户端
主从Reactor多线程
工作机制
- Reactor主线程MainReactor对象通过select监听事件,收到连接事件后,通过Acceptor处理
- 当Acceptor处理完连接事件后,MainReactor将连接分配给SubReactor
- SubReactor将连接放入连接队列中进行监听,并创建Handler进行各种事件处理
- 当有事件发生时,SubReactor就会调用对应的Handler进行处理
- Handler通过read读取事件,然后分发给工作线程处理
- 工作线程池分配独立的工作线程进行业务处理,返回结果给Handler
- Handler收到响应的结果后,再通过send方法将结果返回给Client
MainReactor可以关联多个SubReactor
Netty模型
- Netty抽象出两组线程池
- BossGroup专门负责处理与客户端之间的连接;
- WorkGroup专门负责网络读写
- BossGroup和WorkGroup类型都是NioEventLoopGroup
- NioEventLoopGroup相当于一个事件循环组,这个组中包含多个事件循环,每个循环都是一个NioEventLoop
- NioEventLoop表示一个不断循环的执行处理任务的线程,每个NioEventLoop上都有一个Selector,用于绑定在其上的socket网络通信
- NioEventLoopGroup可以有多个线程,即可以含有多个NioEventLoop
- 每个Work NioEventLoop处理业务时,会使用PipeLine(管道),PipeLine中包含了Channel(即可以通过PipeLine获取对应的Channel),同时管道中维护了很多Handler(处理器)
数量关系
- NioEventLoopGroup下包含多个NioEventLoop
- 每个NioEventLoop包含一个Selector,一个TaskQueue
- 每个Selector上可以注册多个NioChannel
- 每个NioChannel只会绑定在唯一的Selector上
- 每个NioChannel都绑定一个自己的ChannelPipeLine
Boss NioEventLoop执行步骤
- 轮询accept事件
- 处理accept事件,与Client建立连接,生成NioSocketChannel,并将其注册到某个Work NioEventLoop上的Selector
- 处理任务队列的任务,即runAllTasks
Work NioEventLoop执行步骤
- 轮询read/write事件
- 处理IO事件(即read/write事件),在对应的NioSocketChannel上进行处理
- 处理任务队列的其他任务,即runAllTasks
Netty核心组件
EventLoopGroup
EventLoopGroup是一个接口,常用实现类为NioEventLoopGroup。
- BossGroup和WorkerGroup都属于NioEventLoopGroup类,一个EventLoopGroup中可以包含多个EventLoop,具体数目默认为8,也可在创建时由程序员配置
- 一般将BossGroup配置1个EventLoop,对应着一个Selector,一个ServerSocketChannel,处理来自客户端的连接事件
- 如果连接结果是OP_ACCEPT,则交由Acceptor进行处理,否则则交给WorkerGroup处理后续I/O操作
- WorkerGroup对应多个EventLoop,每个EventLoop对应着一个Selector,每个Selector轮询注册到此EventLoop上的所有Channel
- EventLoopGroup具有next方法,返回下一个EventLoop
创建方法
1 | // nThread默认个数为8 |
关闭方法
1 | group.shutdownGracefully(); |
Bootstrap
Bootstrap的意思是引导,Netty程序通常是从一个Bootstrap开始,用作配置整个Netty程序。其中,服务端程序使用的是ServerBootstrap,客户端使用的是Bootstrap。
常见方法
1 | // Server端使用ServerBootstrap配置两个EventLoopGroup |
ChannelOption
SO_BACKLOG
对应TCP/IP协议中的listen函数的backlog参数,用来初始化服务器可连接队列大小。服务端对客户端的请求是顺序处理的,且在同一时间只能处理一个客户端的连接请求。当服务端正在处理连接请求时,有新的连接请求到来则会被放入可连接队列中等待。
SO_KEEPALIVE
设置为true的话则代表一直保持连接状态
ChannelFuture
Netty中所有的IO操作的异步的,若想知道消息是否被正确处理,就需要通过ChannelFuture注册一个监听,当操作完成时监听会自动触发注册的监听事件。
异步机制
当异步执行某个操作时,当前线程不需要等待操作完成。当前线程调用此操作会立即得到一个返回的Future接口,然后此操作(任务)会在其他线程中执行。通过调用Future接口中的一系列方法此可以知道任务异步执行的情况,同时也可以通过添加监听器的方式来指示任务异步完成后自动执行的回调函数。
Future-Listener机制
1 | // 绑定一个端口并且同步 |
ChannelHandler
ChannelHandler是一个接口,处理或拦截I/O事件,并将其转发到ChannelPipeLine(业务处理链)中的下一个处理程序
以客户端为例:
- 出站:如果事件的运动方向是从客户端到服务端,则称这些事件为出站
- 入站:如果事件的运动方向是从服务端到客户端,则称这些事件为入站
ChannelPipeline
入站和出站事件在一个双向链表中:
- 入站事件会从链表head往后传递到最后一个入站的handler;
- 出站事件会从链表tail往前传递到最前一个出站的handler。
- 两种类型的handler互不影响,因为入站handler和出站handler分别保存在两条不同的双向链表中
- 入站handler实现ChannelInboundHandler<C>接口,如解码器
- 出站handler实现ChannelOutboundHandler<C>接口,如编码器
- C代表通道类型,在网络通信中一般是SocketChannel
TaskQueue
任务队列保存某些了耗时长的业务操作,TaskQueue中的任务会异步执行。在Netty模型中,TaskQueue有一个线程,它会不断从队头取一个任务进行执行。
将任务加入TaskQueue的方法
方案1:用户程序自定义普通任务
1 | ctx.channel().eventLoop().excute(new Runnable(){ |
方案2:用户自定义定时任务
1 | // 该任务是提交到scheduleTaskQueue |
方案3:非当前Reactor线程调用Channel中的各种方法
一般是用在推送系统中。做法是用一个集合类保存需要推送消息的Channel,在需要推送时,遍历这个集合,获取每个Channel,然后调用eventLoop()函数获得他们所在的NioEventLoop,在对应的TaskQueue或ScheduleTaskQueue中加入任务。
Unpooled
Unpooled类是Netty提供的一个专门用来操纵缓冲区的工具类
ByteBuf底层是一个数组,因此创建时可以指定其大小
1 | ByteBuf buf = Unpooled.buffer(10); |
在Netty中,ByteBuf不需要flip进行反转。Netty底层通过维护readIndex,writeIndex,capacity三个变量来控制读写区域。其中[0,readIndex)表示已读取区域; [readIndex,writeIndex)表示可读区域; [writeIndex,capacity)表示可写区域。
1 | buf.writeByte(i); // 写入数据 |
Netty编码解码
在编写网络应用程序时,由于数据在网络中都是以二进制形式进行传输,因此在发送数据时就需要将业务数据编码成字节码,在接收数据后就需要将字节码解码成业务数据。
codec(编解码器)由两部分组成,分别是:decoder(解码器);encoder(编码器)
Netty自身编码解码机制和问题
- Netty自身提供了一些codec
- StringEncoder、StringDecoder:字符串编码、解码器
- ObjectEncoder、ObjectDecoder:Java对象编码、解码器
- Netty本身自带的Java对象编码、解码器底层使用的是序列化技术,此技术存在一些问题
- Java序列化技术效率不高
- 无法跨语言
- 序列化后体积太大,是二进制编码的5倍多
- 新的解决方案是Google的Protobuf
Protobuf
Protobuf是谷歌发布的开源项目,全称Google Protocol Buffers,是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化(序列化)。
它很适合做数据存储或者RPC(Remote Procedure Call)数据交换格式。目前很多公司都从http+json的方式转换到tcp+protobuf的方式。
ProtoBuf在java中的使用原理
- 将类的定义通过.proto文件进行描述
- 然后通过protoc.exe编译器根据.proto自动生成.java文件
ProtoBuf在IDEA中使用步骤
在pom.xml中添加protobuf-java依赖
1
2
3
4
5<dependency>
<groupId>com.google.protobuf</groupId>
<artifactId>protobuf-java</artifactId>
<version>3.13.0</version>
</dependency>编写.proto文件
在pom.xml文件中添加编译插件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29<build>
<plugins>
<plugin>
<groupId>org.xolstice.maven.plugins</groupId>
<artifactId>protobuf-maven-plugin</artifactId>
<version>0.6.1</version>
<configuration>
<protocExecutable>
D:\protoc-3.13.0\bin\protoc.exe <!-- 刚刚环境变量配置的位置 -->
</protocExecutable>
<pluginId>protoc-java</pluginId>
<!-- proto文件放置的目录 -->
<protoSourceRoot>${project.basedir}/src/main/java/com/dynner/netty/codec2</protoSourceRoot>
<!-- 生成文件的目录 -->
<outputDirectory>${project.basedir}/src/main/java/com/dynner/netty/codec2</outputDirectory>
<!-- 生成文件前是否把目标目录清空,这个最好设置为false,以免误删项目文件 -->
<clearOutputDirectory>false</clearOutputDirectory>
</configuration>
<executions>
<execution>
<goals>
<goal>compile</goal>
</goals>
</execution>
</executions>
</plugin>
</plugins>
</build>利用Maven项目编译
ByteToMessageDecoder
由于不知道远程节点是否会一次性发送一个完整消息,TCP可能会出现粘包拆包问题。这个类会对入站数据进行缓冲,知道它准备好被处理。
handler链中的解码编码handler
- 不论解码handler还是编码handler,接收的消息必须与待处理的消息类型一致,否则handler不会被执行
- 在解码器进行解码时,需要判断缓存(ByteBuf)的数据是否足够,否则接收到的结果可能会与期望的结果不一致
Netty其他常用编码、解码器
ReplayingDecoder
ReplayingDecoder<S> 扩展了ByteToMessageDecoder类
- 优点
- 不必调用readableBytes方法人工判定缓存中数据量是否足够做转换
- 参数S指定了用户状态管理类型(void表示不需要状态管理)
- 缺点
- 并不是所有ByteBuf操作都支持
- 某些情况下速度比ByteToMessageDecoder慢
LineBasedFrameDecoder
使用行尾控制符(\n或\r\n)作为分隔符来解析数据
DelimiterBasedFrameDecoder
使用自定义的特殊字符作为消息的分隔符
HttpObjectDecoder
一个Http数据的解码器
LengthFieldBasedFrameDecoder
通过指定长度来标识整包消息,这样就可以自动的处理粘包和半包消息
TCP粘包和拆包
TCP是面向连接、面向流的,提供高可靠性服务。消息收发两端都要有一个成对的socket。发送端为了更高效的将包发送给接收方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合成一个大的数据块,然后进行封包。这样做虽然提高的效率,但接收端就难以分辨出完整的数据包了。因为面向流的通信是无消息保护边界的。由于TCP无消息保护边界,需要在接收端处理消息边界问题。
案例说明
- 前提:客户端发送了两个数据包 D1 和 D2 给服务端
- 情况1:服务端分两次读取到两个独立数据包 D1 和 D2。没有粘包和拆包
- 情况2:服务端一次接收到了两个数据包,D1 和 D2 粘合在一起。称之为TCP粘包
- 情况3:服务端分两次读取到了数据包:第一次读取到完整的 D1 包和 D2 包部分内容;第二次读取到 D2 包剩余内容。称之为 TCP拆包
- 情况4:服务端分两次读取到了数据包:第一次读取到了 D1 包的部分内容;第二次读取到了 D1 包的剩余内容和 D2 包。