Simple Java: NIO

简介

Java NIO提供了与标准IO不同的IO工作方式：

Channels and Buffers（通道和缓冲区）：标准的IO基于字节流和字符流进行操作的，而NIO是基于通道（Channel）和缓冲区（Buffer）进行操作，数据总是从通道读取到缓冲区中，或者从缓冲区写入到通道中。
Asynchronous IO（异步IO）：Java NIO可以让你异步的使用IO，例如：当线程从通道读取数据到缓冲区时，线程还是可以进行其他事情。当数据被写入到缓冲区时，线程可以继续处理它。从缓冲区写入通道也类似。
Selectors（选择器）：Java NIO引入了选择器的概念，选择器用于监听多个通道的事件（比如：连接打开，数据到达）。因此，单个的线程可以监听多个数据通道。

NIO核心

Channels
Buffers
Selectors

所有的IO在NIO中都是从一个Channel开始，channel有点像是流，数据可以从channel读到buffer中，也可以冲buffer写到channel中。
channel和buffer有很多种实现。

一些主要的channel实现，这些通道涵盖了文件、UDP、TCP：

FileChannel
DatagramChannel
SocketChannel
ServerSocketChannel

一些主要的Buffer实现：

ByteBuffer
CharBuffer
DoubleBuffer
FloatBuffer
IntBuffer
LongBuffer
ShortBuffer

另外有Mappedyteuffer用于表示内存映射文件。

Selector允许单线程处理多个Channel。如果一个应用打开了多个连接（Channel），每个连接的流量又很低，Selector就会很合适。
要使用Selector，需要向Selector中注册Channel，然后调用他的select()方法。这个方法会一直阻塞到某个注册的channel有事件就绪。
一旦这个方法返回，线程就可以处理这些事件，比如新建连接、接收数据等。

IO与NIO的区别

主要区别如下:
NIOwithIO

面相流与面相缓冲：
NIO与IO的最大区别就是IO面相流，而NIO面相缓冲。面相流意味着每次从流中读取一个或多个字节，直到读取所有字节，这些字节没有被缓存在任何地方，并且不能前后移动流中的数据。如果需要前后移动从流中读取的数据，需要先将它缓冲到一个缓存区。
而NIO的缓冲导向方法略有不同，数据读取到一个稍后用来处理的缓冲区，需要时可在缓冲区中进行前后移动。这就增加了处理过程中的灵活性。

阻塞与非阻塞IO：
IO中的各种流式阻塞的。当一个线程调用read()或write()时，该线程阻塞，直到有一些数据被读取，或数据完全写入，该线程在此期间不能做别的任务。
而NIO的非阻塞模式，使一个线程从某通道发送请求读取数据，但是它仅能得到目前可用的数据，目前没有可用诗句时，就什么都不会获取。而不是保持线程阻塞，所以直到数据变得可以读之前，该线程可以继续做其他事情，非阻塞写也是同样。

选择器Selector：
NIO的选择器允许一个单独的线程监视多个通道，即你可以注册多个channel到一个选择器，然后使用一个单独的线程来选择通道：这些通道里已经有可以处理的输入，或者选择已准备写入的通道。

Channel通道

NIO类似于流，但又有所不同：

既可以从通道中读取数据，又可以写入到通道中，但流的处理只能是单向的。
通道可以异步的读写。
通道中的数据总是要先读到一个buffer，或者总是要从一个buffer中写入。

几种重要的Channel实现：

- FileChannel：从文件中读写数据。
- DatagramChannel：通过UDP读写网络中的数据。
- SocketChannel：通过TCP读写网络中的数据。
- ServerSocketChannel：可以监听新进来的TCP连接，像web服务器一样，对每个新进来的连接都会创建一个SocketChannel。

Example：

RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
FileChannel inChannel = aFile.getChannel();
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buf);
while(bytesRead != -1){
    System.out.println("Read " + bytesRead);
    buf.flip();
    while(buf.hasRemaining()){
        System.out.println((char) buf.get());
    }
    buf.clear();
    bytesRead = inChannel.read(buf);
}
aFile.close()

注意上面flip()的调用，首先读取数据到buffer，然后翻转buffer，然后从buffer中读取数据。

Buffer缓冲区

使用Buffer读写数据一般遵循四个步骤：
1 写入数据到buffer
2 调用flip()方法
3 从buffer中读取数据
4 调用clear()方法或compact()方法

当向buffer写入数据时，buffer会记录下写入了多少数据。一旦要读取数据，通过flip()方法将buffer从写模式切换到读模式，在读模式下，可以读取之前写入到buffer的所有数据。
一旦读完了所有数据，就需要清空缓冲区，让它可以被再次写入。有两种方式能够清空缓冲区：调用clear或compact。clear会清空整个缓冲区，compact只会清空已读取过的数据，任何未读取的数据都被移到缓冲区的起始处，新写入的数据将放到缓冲区中未读取部分的后面。

Example：

RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");  
FileChannel inChannel = aFile.getChannel();  

//create buffer with capacity of 48 bytes  
ByteBuffer buf = ByteBuffer.allocate(48);  

int bytesRead = inChannel.read(buf); //read into buffer.  
while (bytesRead != -1) {  

  buf.flip();  //make buffer ready for read  

  while(buf.hasRemaining()){  
      System.out.print((char) buf.get()); // read 1 byte at a time  
  }  

  buf.clear(); //make buffer ready for writing  
  bytesRead = inChannel.read(buf);  
}  
aFile.close();

Buffer的capacity,position和limit

缓冲区本质上是一块可以写入数据，然后可以从中读取数据的内存。这块内存被包装成NIO buffer的对象，并提供一些方法以方便的访问这块内存。
Buffer的三个属性：

capacity：容量
position：位置
limit：限制

position和limit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式，capacity的含义总是一样的。

capacity：
作为一块内存，buffer有一个固定的大小值，只能往里写入capacity数量的byte、long，char等类型数据，一旦buffer满了，就需要清空(通过读数据或清除数据)才能继续往里写数据。

position：
当写数据到buffer中时，position表示当前的位置。初始状态下position为0，当一个byte或long等类型的数据写入到buffer后，position会向前移动到下一个可插入数据的buffer单元，position最大可为 capacity -1。当读取数据时，也是从某个特定位置读取。当buffer从写模式切换到读模式，position会被重置为0。当从buffer的position读取到数据时，position向前移动到写一个可读位置。

limit：
在写模式下，buffer的limit表示你能往buffer中写入多少数据，即写模式下，其limit等于其capacity。当切换到读模式时，limit表示你最多能读取到多少数据。因此，当切换到读模式时，limit会被设置成写模式时的position值，即写模式时写入了多少数据，读模式是就能读到多少数据。

Buffer的分配

要想获得一个Buffer对象首先要进行分配。每一个Buffer类都有一个allocate方法。下面是一个分配48字节capacity的ByteBuffer的例子。

ByteBuffer buf = ByteBuffer.allocate(48);

这是分配一个可存储1024个字符的CharBuffer：

CharBuffer buf = CharBuffer.allocate(1024);

向Buffer写入数据

写数据到buffer有两种方式：
1 从channel写到buffer
2 通过Buffer的put方法写到buffer里

从channel写入buffer：

int bytesRead = inChannel.read(buf); //read into buffer.

通过put方法写Buffer的例子：

buf.put(127);

flip()方法：
flip方法将Buffer从写模式切换到读模式。调用flip()方法会将position设回0，并将limit设置成之前position的值。

从Buffer中读取数据

从Buffer中读取数据有两种方式：
1 从Buffer读取数据到Channel。
2 使用get()方法从Buffer中读取数据。

从Buffer读取数据到Channel的例子：

//read from buffer into channel.  
int bytesWritten = inChannel.write(buf);

使用get()方法从Buffer中读取数据的例子：

byte aByte = buf.get();

rewind()方法：
Buffer.rewind()将position设回0，所以你可以重读Buffer中的所有数据。limit保持不变，仍然表示能从Buffer中读取多少个元素（byte、char等）。

clear()与compact()方法：

一旦读完Buffer中的数据，需要让Buffer准备好再次被写入。可以通过clear()或compact()方法来完成。
如果调用的是clear()方法，position将被设回0，limit被设置成 capacity的值。换句话说，Buffer 被清空了。Buffer中的数据并未清除，只是这些标记告诉我们可以从哪里开始往Buffer里写数据。
如果Buffer中有一些未读的数据，调用clear()方法，数据将“被遗忘”，意味着不再有任何标记会告诉你哪些数据被读过，哪些还没有。
如果Buffer中仍有未读的数据，且后续还需要这些数据，但是此时想要先先写些数据，那么使用compact()方法。
compact()方法将所有未读的数据拷贝到Buffer起始处。然后将position设到最后一个未读元素正后面。limit属性依然像clear()方法一样，设置成capacity。现在Buffer准备好写数据了，但是不会覆盖未读的数据。

mark()与reset()方法：
通过调用Buffer.mark()方法，可以标记Buffer中的一个特定position。之后可以通过调用Buffer.reset()方法恢复到这个position。例如：

buffer.mark();  
//call buffer.get() a couple of times, e.g. during parsing.  
buffer.reset();  //set position back to mark.

equals()与compareTo()方法：
可以使用equals()和compareTo()方法比较两个Buffer。

equals()：
当满足下列条件时，表示两个Buffer相等：

有相同的类型（byte、char、int等）。
Buffer中剩余的byte、char等的个数相等。
Buffer中所有剩余的byte、char等都相同。

如你所见，equals只是比较Buffer的一部分，不是每一个在它里面的元素都比较。实际上，它只比较Buffer中的剩余元素。

compareTo()方法：
compareTo()方法比较两个Buffer的剩余元素(byte、char等)，如果满足下列条件，则认为一个Buffer“小于”另一个Buffer：

第一个不相等的元素小于另一个Buffer中对应的元素。
所有元素都相等，但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。

分散（Scatter）/聚集（Gather）

Java NIO开始支持scatter/gather，scatter/gather用于描述从Channel（译者注：Channel在中文经常翻译为通道）中读取或者写入到Channel的操作。
分散（scatter）从Channel中读取是指在读操作时将读取的数据写入多个buffer中。因此，Channel将从Channel中读取的数据“分散（scatter）”到多个Buffer中。
聚集（gather）写入Channel是指在写操作时将多个buffer的数据写入同一个Channel，因此，Channel 将多个Buffer中的数据“聚集（gather）”后发送到Channel。
scatter / gather经常用于需要将传输的数据分开处理的场合，例如传输一个由消息头和消息体组成的消息，你可能会将消息体和消息头分散到不同的buffer中，这样你可以方便的处理消息头和消息体。

Scattering Reads

Example：

ByteBuffer header = ByteBuffer.allocate(128);  
ByteBuffer body   = ByteBuffer.allocate(1024);    
ByteBuffer[] bufferArray = { header, body };  
channel.read(bufferArray);

注意buffer首先被插入到数组，然后再将数组作为channel.read() 的输入参数。read()方法按照buffer在数组中的顺序将从channel中读取的数据写入到buffer，当一个buffer被写满后，channel紧接着向另一个buffer中写。
Scattering Reads在移动下一个buffer前，必须填满当前的buffer，这也意味着它不适用于动态消息(译者注：消息大小不固定)。换句话说，如果存在消息头和消息体，消息头必须完成填充（例如 128byte），Scattering Reads才能正常工作。

Gathering Writes

Example：

ByteBuffer header = ByteBuffer.allocate(128);  
ByteBuffer body   = ByteBuffer.allocate(1024);  
//write data into buffers  
ByteBuffer[] bufferArray = { header, body };  
channel.write(bufferArray);

buffers数组是write()方法的入参，write()方法会按照buffer在数组中的顺序，将数据写入到channel，注意只有position和limit之间的数据才会被写入。因此，如果一个buffer的容量为128byte，但是仅仅包含58byte的数据，那么这58byte的数据将被写入到channel中。因此与Scattering Reads相反，Gathering Writes能较好的处理动态消息。

通道之间的数据传输

在Java NIO中，如果两个通道中有一个是FileChannel，那你可以直接将数据从一个channel传输到另外一个channel。

transferFrom() ：FileChannel的transferFrom()方法可以将数据从源通道传输到FileChannel中。

RandomAccessFile fromFile = new RandomAccessFile("fromFile.txt", "rw");  
FileChannel      fromChannel = fromFile.getChannel();  

RandomAccessFile toFile = new RandomAccessFile("toFile.txt", "rw");  
FileChannel      toChannel = toFile.getChannel();  

long position = 0;  
long count = fromChannel.size();  

toChannel.transferFrom(position, count, fromChannel);

方法的输入参数position表示从position处开始向目标文件写入数据，count表示最多传输的字节数。如果源通道的剩余空间小于count 个字节，则所传输的字节数要小于请求的字节数。
此外要注意，在SoketChannel的实现中，SocketChannel只会传输此刻准备好的数据（可能不足count字节）。因此，SocketChannel可能不会将请求的所有数据(count个字节)全部传输到FileChannel中

transferTo() ：将数据从FileChannel传输到其他的channel中。

RandomAccessFile fromFile = new RandomAccessFile("fromFile.txt", "rw");  
FileChannel      fromChannel = fromFile.getChannel();  

RandomAccessFile toFile = new RandomAccessFile("toFile.txt", "rw");  
FileChannel      toChannel = toFile.getChannel();  

long position = 0;  
long count = fromChannel.size();  

fromChannel.transferTo(position, count, toChannel);

选择器（Selector）

Selector（选择器）是Java NIO中能够检测一到多个NIO通道，并能够知晓通道是否为诸如读写事件做好准备的组件。这样，一个单独的线程可以管理多个channel，从而管理多个网络连接。

通过调用Selector.open()方法创建一个Selector，如下：

Selector selector = Selector.open();

向Selector注册通道：为了将Channel和Selector配合使用，必须将channel注册到selector上。通过SelectableChannel.register()方法来实现，如下：

channel.configureBlocking(false);  
SelectionKey key = channel.register(selector, Selectionkey.OP_READ);

与Selector一起使用时，Channel必须处于非阻塞模式下。这意味着不能将FileChannel与Selector一起使用，因为FileChannel不能切换到非阻塞模式。而套接字通道都可以。
注意register()方法的第二个参数。这是一个“interest集合”，意思是在通过Selector监听Channel时对什么事件感兴趣。
可以监听四种不同类型的事件：
1 Connect
2 Accept
3 Read
4 Write

通道触发了一个事件意思是该事件已经就绪。
所以，某个channel成功连接到另一个服务器称为“连接就绪”。
一个server socket channel准备好接收新进入的连接称为“接收就绪”。
一个有数据可读的通道可以说是“读就绪”。
等待写数据的通道可以说是“写就绪”。
这四种事件用SelectionKey的四个常量来表示：
1 SelectionKey.OP_CONNECT
2 SelectionKey.OP_ACCEPT
3 SelectionKey.OP_READ
4 SelectionKey.OP_WRITE

如果你对不止一种事件感兴趣，那么可以用“位或”操作符将常量连接起来，如下：

int interestSet = SelectionKey.OP_READ | SelectionKey.OP_WRITE;

SelectionKey：
当向Selector注册Channel时，register()方法会返回一个SelectionKey对象。这个对象包含了一些你感兴趣的属性：
interest集合：你所选择的感兴趣的事件集合。可以通过SelectionKey读写interest集合，像这样：

int interestSet = selectionKey.interestOps();  
boolean isInterestedInAccept  = (interestSet & SelectionKey.OP_ACCEPT) == SelectionKey.OP_ACCEPT；  
boolean isInterestedInConnect = interestSet & SelectionKey.OP_CONNECT;  
boolean isInterestedInRead    = interestSet & SelectionKey.OP_READ;  
boolean isInterestedInWrite   = interestSet & SelectionKey.OP_WRITE;

ready集合：通道已经准备就绪的操作的集合。在一次选择(Selection)之后，你会首先访问这个ready set。访问方式：

int readySet = selectionKey.readyOps(); 
同样可以用以下四种方法检测哪种事件就绪了：

selectionKey.isAcceptable();  
selectionKey.isConnectable();  
selectionKey.isReadable();  
selectionKey.isWritable();

Channel
Selector
附加的对象（可选

Channel + Selector：
从SelectionKey访问Channel和Selector很简单。如下：

1 2	Channel channel = selectionKey.channel(); Selector selector = selectionKey.selector();

通过Selector选择通道：
一旦向Selector注册了一或多个通道，就可以调用几个重载的select()方法。这些方法返回你所感兴趣的事件（如连接、接受、读或写）已经准备就绪的那些通道。换句话说，如果你对“读就绪”的通道感兴趣，select()方法会返回读事件已经就绪的那些通道。

wakeUp() ：
某个线程调用select()方法后阻塞了，即使没有通道已经就绪，也有办法让其从select()方法返回。只要让其它线程在第一个线程调用select()方法的那个对象上调用Selector.wakeup()方法即可。阻塞在select()方法上的线程会立马返回。
如果有其它线程调用了wakeup()方法，但当前没有线程阻塞在select()方法上，下个调用select()方法的线程会立即“醒来（wake up）”。

close() ：
用完Selector后调用其close()方法会关闭该Selector，且使注册到该Selector上的所有SelectionKey实例无效。同时通道本身并不会关闭。

完整的示例，这里有一个完整的示例，打开一个Selector，注册一个通道注册到这个Selector上(通道的初始化过程略去),然后持续监控这个Selector的四种事件（接受，连接，读，写）是否就绪。

Selector selector = Selector.open();  
channel.configureBlocking(false);  
SelectionKey key = channel.register(selector, SelectionKey.OP_READ);  
while(true) {  
  int readyChannels = selector.select();  
  if(readyChannels == 0) continue;  
  Set selectedKeys = selector.selectedKeys();  
  Iterator keyIterator = selectedKeys.iterator();  
  while(keyIterator.hasNext()) {  
    SelectionKey key = keyIterator.next();  
    if(key.isAcceptable()) {  
        // a connection was accepted by a ServerSocketChannel.  
    } else if (key.isConnectable()) {  
        // a connection was established with a remote server.  
    } else if (key.isReadable()) {  
        // a channel is ready for reading  
    } else if (key.isWritable()) {  
        // a channel is ready for writing  
    }  
    keyIterator.<tuihighlight class="tuihighlight"><a href="javascript:;" style="display:inline;float:none;position:inherit;cursor:pointer;color:#7962D5;text-decoration:underline;" onclick="return false;">remove</a></tuihighlight>();  
  }  
}

文件通道

Java NIO中的FileChannel是一个连接到文件的通道。可以通过文件通道读写文件。
FileChannel无法设置为非阻塞模式，它总是运行在阻塞模式下。

打开FileChannel
在使用FileChannel之前，必须先打开它。但是，我们无法直接打开一个FileChannel，需要通过使用一个InputStream、OutputStream或RandomAccessFile来获取一个FileChannel实例。下面是通过RandomAccessFile打开FileChannel的示例：

RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");  
FileChannel inChannel = aFile.getChannel();

从FileChannel读取数据
调用多个read()方法之一从FileChannel中读取数据。如：

ByteBuffer buf = ByteBuffer.allocate(48);  
int bytesRead = inChannel.read(buf);

向FileChannel写数据
使用FileChannel.write()方法向FileChannel写数据，该方法的参数是一个Buffer。如：

String newData = "New String to write to file..." + System.currentTimeMillis();  

ByteBuffer buf = ByteBuffer.allocate(48);  
buf.clear();  
buf.put(newData.getBytes());  

buf.flip();  

while(buf.hasRemaining()) {  
    channel.write(buf);  
}

注意FileChannel.write()是在while循环中调用的。因为无法保证write()方法一次能向FileChannel写入多少字节，因此需要重复调用write()方法，直到Buffer中已经没有尚未写入通道的字节。

关闭FileChannel
用完FileChannel后必须将其关闭。如：

channel.close();

FileChannel的position方法

long pos = channel.position();  
channel.position(pos +123);

FileChannel的size方法：FileChannel实例的size()方法将返回该实例所关联文件的大小。

long fileSize = channel.size();

FileChannel的truncate方法：可以使用FileChannel.truncate()方法截取一个文件。截取文件时，文件将中指定长度后面的部分将被删除。

channel.truncate(1024);

FileChannel的force方法
FileChannel.force()方法将通道里尚未写入磁盘的数据强制写到磁盘上。出于性能方面的考虑，操作系统会将数据缓存在内存中，所以无法保证写入到FileChannel里的数据一定会即时写到磁盘上。要保证这一点，需要调用force()方法。
force()方法有一个boolean类型的参数，指明是否同时将文件元数据（权限信息等）写到磁盘上。
下面的例子同时将文件数据和元数据强制写到磁盘上：

channel.force(true);

Socket 通道

Java NIO中的SocketChannel是一个连接到TCP网络套接字的通道。可以通过以下2种方式创建SocketChannel：
打开一个SocketChannel并连接到互联网上的某台服务器。
一个新连接到达ServerSocketChannel时，会创建一个SocketChannel。

打开 SocketChannel
下面是SocketChannel的打开方式：

SocketChannel socketChannel = SocketChannel.open();  
socketChannel.connect(new InetSocketAddress("http://jenkov.com", 80));

关闭 SocketChannel
当用完SocketChannel之后调用SocketChannel.close()关闭SocketChannel：

socketChannel.close();

从 SocketChannel 读取数据
要从SocketChannel中读取数据，调用一个read()的方法之一。以下是例子：

ByteBuffer buf = ByteBuffer.allocate(48);  
int bytesRead = socketChannel.read(buf);

首先，分配一个Buffer。从SocketChannel读取到的数据将会放到这个Buffer中。
然后，调用SocketChannel.read()。该方法将数据从SocketChannel 读到Buffer中。read()方法返回的int值表示读了多少
字节进Buffer里。如果返回的是-1，表示已经读到了流的末尾（连接关闭了）。

写入 SocketChannel
写数据到SocketChannel用的是SocketChannel.write()方法，该方法以一个Buffer作为参数。示例如下：

String newData = "New String to write to file..." + System.currentTimeMillis();  

ByteBuffer buf = ByteBuffer.allocate(48);  
buf.clear();  
buf.put(newData.getBytes());  

buf.flip();  

while(buf.hasRemaining()) {  
    channel.write(buf);  
}

注意SocketChannel.write()方法的调用是在一个while循环中的。Write()方法无法保证能写多少字节到SocketChannel。
所以，我们重复调用write()直到Buffer没有要写的字节为止。

非阻塞模式
可以设置 SocketChannel 为非阻塞模式（non-blocking mode）.设置之后，就可以在异步模式下调用connect(), read()和write()了。

connect()
如果SocketChannel在非阻塞模式下，此时调用connect()，该方法可能在连接建立之前就返回了。为了确定连接是否建立，可以
调用finishConnect()的方法。像这样：

socketChannel.configureBlocking(false);  
socketChannel.connect(new InetSocketAddress("http://jenkov.com", 80));  

while(! socketChannel.finishConnect() ){  
    //wait, or do something else...  
}

write()
非阻塞模式下，write()方法在尚未写出任何内容时可能就返回了。所以需要在循环中调用write()。前面已经有例子了，这里就不赘述了。

read()
非阻塞模式下,read()方法在尚未读取到任何数据时可能就返回了。所以需要关注它的int返回值，它会告诉你读取了多少字节。

非阻塞模式与选择器
非阻塞模式与选择器搭配会工作的更好，通过将一或多个SocketChannel注册到Selector，可以询问选择器哪个通道已经准备好了读取，写入等。Selector与SocketChannel的搭配使用会在后面详讲。