Java IO - 分类(传输,操作)
Java IO - 分类(传输,操作)
本文主要从
传输方式
和数据操作
两个方面分析Java IO的分类。
1. IO理解分类 - 从传输方式上
从数据传输方式或者说是运输方式角度看,可以将 IO 类分为:
- 字节流
- 字符流
字节
是个计算机看的,字符
才是给人看的
1.1 字节流
(整体结构如下,部分派生类有缺失)
1.2 字符流
(整体结构如下,部分派生类有缺失)
1.3 字节流和字符流的区别
- 字节流读取单个字节,字符流读取单个字符(一个字符根据编码的不同,对应的字节也不同,如 UTF-8 编码中文汉字是 3 个字节,GBK编码中文汉字是 2 个字节。)
- 字节流用来处理二进制文件(图片、MP3、视频文件),字符流用来处理文本文件(可以看做是特殊的二进制文件,使用了某种编码,人可以阅读)。
简而言之,字节是个计算机看的,字符才是给人看的。
1.4 字节转字符Input/OutputStreamReader/Writer
编码就是把字符转换为字节,而解码是把字节重新组合成字符。
如果编码和解码过程使用不同的编码方式那么就出现了乱码。
- GBK 编码中,中文字符占 2 个字节,英文字符占 1 个字节;
- UTF-8 编码中,中文字符占 3 个字节,英文字符占 1 个字节;
- UTF-16be 编码中,中文字符和英文字符都占 2 个字节。
UTF-16be 中的 be 指的是 Big Endian,也就是大端。相应地也有 UTF-16le,le 指的是 Little Endian,也就是小端。
Java 使用双字节编码 UTF-16be,这不是指 Java 只支持这一种编码方式,而是说 char 这种类型使用 UTF-16be 进行编码。char 类型占 16 位,也就是两个字节,Java 使用这种双字节编码是为了让一个中文或者一个英文都能使用一个 char 来存储。
2. IO理解分类 - 从数据操作上
从数据来源或者说是操作对象角度看,IO 类可以分为:
2.1 文件(file)
FileInputStream、FileOutputStream、FileReader、FileWriter
2.2 数组([])
- 字节数组(byte[]): ByteArrayInputStream、ByteArrayOutputStream
- 字符数组(char[]): CharArrayReader、CharArrayWriter
2.3 管道操作
PipedInputStream、PipedOutputStream、PipedReader、PipedWriter
2.4 基本数据类型
DataInputStream、DataOutputStream
2.5 缓冲操作
BufferedInputStream、BufferedOutputStream、BufferedReader、BufferedWriter
2.6 打印
PrintStream、PrintWriter
2.6 对象序列化反序列化
ObjectInputStream、ObjectOutputStream
2.7 转换
InputStreamReader、OutputStreamWriter