Os

Go文件操作 #

文件系统简介 #

文件系统是计算机用于存储和组织数据的一种方式,它定义了如何在计算机硬件上存储、读取、写入和管理文件和目录。文件系统通常由操作系统提供,它们可以支持不同的文件格式和存储设备,如磁盘驱动器、闪存驱动器、CD-ROM和网络驱动器等。文件系统可以帮助用户和应用程序组织和管理计算机中的文件和文件夹,使它们易于访问和处理。它们还提供了安全性和数据完整性方面的保护,以确保用户的数据不会被意外删除或破坏。一些常见的文件系统包括Windows的NTFS和FAT32、Linux的EXT4和Btrfs,以及Mac OS X的HFS+和APFS。

Windows操作系统支持 NTFS, FAT32, and exFAT三种不同文件系统。NTFS是目前Windows系统中一种现代文件系统,目前使用最广泛,内置的硬盘大多数都是NTFS格式。FAT32是一种相对老旧的文件系统,不能像NTFS格式支持很多现代文件格式的属性,但对于不同系统平台具有良好的兼容性,可以在Linux、Mac或Android系统平台上通用。exFAT是FAT32文件格式的替代品,很多设备和操作系统都支持该文件系统,但是目前用的不多。

目前的大部分 Linux 文件系统都默认采用 ext4 文件系统,正如以前的 Linux 发行版默认使用 ext3、ext2 以及更久前的 ext。

NTFS #

NTFS(New Technology File System)是Windows操作系统中使用的一种先进的文件系统,是Windows NT家族的标准文件系统。NTFS支持更高级的文件管理功能,如文件和目录的权限、加密、压缩、磁盘配额等,也支持更大的磁盘容量和更大的文件大小。以下是NTFS的一些特点:

  1. 安全性:NTFS支持文件和文件夹的权限控制,可以为每个用户或组设置不同的访问权限,确保数据的安全性和隐私性。
  2. 可靠性:NTFS使用日志记录和故障容错技术,可以检测并修复磁盘上的错误和损坏。
  3. 空间利用率:NTFS使用动态存储分配和簇大小调整,使得文件系统可以更有效地利用磁盘空间。
  4. 文件压缩:NTFS支持文件和文件夹的压缩,可以节省磁盘空间,并且对于大量文本数据可以获得更高的数据压缩比。
  5. 数据加密:NTFS支持文件和文件夹的加密,可以保护数据的机密性。
  6. 大文件支持:NTFS支持极大的文件和分区大小,最大文件大小为16EB(EB表示艾字节,1EB=1024PB),最大分区大小为256TB。

总之,NTFS是一个高级的、功能强大的文件系统,提供了许多重要的功能和优势,因此它被广泛用于Windows操作系统和应用程序中。

FAT32 #

FAT32(File Allocation Table 32),用于在Windows操作系统中格式化存储设备,如磁盘、USB驱动器等。FAT32是FAT文件系统的一种升级版本,它支持更大的磁盘空间和文件大小,并且具有更好的兼容性。以下是FAT32的一些特点:

  1. 兼容性:FAT32是一种通用的文件系统,几乎可以在所有操作系统和设备上进行访问和读取,例如Windows、Mac、Linux、Android和其他平台。
  2. 可移植性:FAT32格式化的设备可以轻松地从一台计算机或设备移动到另一台计算机或设备,这是它在可移动存储设备上广泛使用的原因之一。
  3. 支持大容量存储设备:FAT32支持最大容量为2TB的存储设备,因此它被广泛用于外部硬盘、闪存驱动器等大容量存储设备上。
  4. 支持大文件:FAT32支持最大文件大小为4GB,这是相对较小的文件大小限制,但对于大多数常见文件类型而言足够了。
  5. 简单:FAT32是一个相对简单的文件系统,易于实现和使用。

总之,FAT32是一种简单、兼容性强、可移植性好的文件系统,它被广泛应用于可移动存储设备、外部硬盘和其他大容量存储设备上。虽然它有一些限制,例如文件大小限制,但对于普通用户而言,它仍然是一种可靠和方便的文件系统。

EXFAT #

exFAT(Extended File Allocation Table)是一种用于可移动存储设备的文件系统,由Microsoft开发,它是FAT文件系统的一种升级版本。exFAT支持更大的文件和存储设备容量,也具有更好的兼容性。以下是exFAT的一些特点:

  1. 大文件支持:exFAT支持极大的文件大小,最大文件大小为16EB,这是比FAT32更高的限制,对于处理大型媒体文件等需要大文件支持的应用程序非常有用。
  2. 大容量支持:exFAT支持极大的存储设备容量,最大容量为128PB,这使得它非常适合用于大型存储设备,如高容量的移动硬盘或SD卡。
  3. 兼容性:exFAT文件系统可以在Windows、Mac OS X、Linux和其他操作系统上进行访问和读取,这使得它非常适合在跨平台环境中使用。
  4. 文件系统简单:exFAT文件系统比NTFS更简单,因此更易于实现和使用。
  5. 文件碎片化更少:与FAT32相比,exFAT可以减少文件碎片化的问题,从而提高文件访问速度。

总之,exFAT是一种高效、可靠、具有更大文件和存储设备容量限制的文件系统,特别适合用于可移动存储设备,如SD卡、U盘等。由于其更好的兼容性,它在跨平台数据共享和数据传输方面非常有用。

EXT4 #

EXT4是Linux操作系统中使用的一种高性能的日志式文件系统。它是EXT3文件系统的后继版本,支持更大的文件和文件系统容量,并且具有更好的文件系统安全性和稳定性。以下是EXT4的一些特点:

  1. 支持大文件和大容量:EXT4支持极大的文件和文件系统容量,最大文件大小为16TB,最大文件系统容量为1EB,这使得它非常适合于处理大型数据库和媒体文件等应用程序。
  2. 快速的文件系统检查和修复:EXT4引入了一个称为ext4fsck的新工具,它可以更快地检查和修复文件系统错误,这可以大大减少系统恢复的时间。
  3. 可靠性和稳定性:EXT4使用日志式文件系统技术,它记录文件系统操作,可以在文件系统崩溃或意外断电等情况下恢复数据。此外,EXT4还使用了额外的检查和纠正功能,可以减少数据损坏和丢失的可能性。
  4. 高性能:EXT4的读取和写入速度比EXT3更快,它采用了新的文件分配方式,提高了文件系统的性能,特别是在处理大型文件和大容量数据的情况下。
  5. 支持多种操作系统:EXT4文件系统可以在Linux、BSD和其他一些操作系统上进行访问和读取,这使得它非常适合在跨平台环境中使用。

总之,EXT4是一种高性能、可靠和稳定的文件系统,支持大文件和大容量,特别适合于处理大型数据库和媒体文件等应用程序。它的快速检查和修复功能可以提高文件系统的可用性,同时它也具有更好的数据安全性和稳定性。由于它可以在多种操作系统上进行访问和读取,它在跨平台环境中的使用也越来越广泛。

ext3 文件系统使用 32 位寻址,这限制它仅支持 2 TB 文件大小和 16 TB 文件系统系统大小(这是假设在块大小为 4 KB 的情况下,一些 ext3 文件系统使用更小的块大小,因此对其进一步被限制)。

ext4 使用 48 位的内部寻址,理论上可以在文件系统上分配高达 16 TB 大小的文件,其中文件系统大小最高可达 1000000 TB(1 EB)。在早期 ext4 的实现中有些用户空间的程序仍然将其限制为最大大小为 16 TB 的文件系统,但截至 2011 年,e2fsprogs 已经直接支持大于 16 TB 大小的 ext4 文件系统。例如,红帽企业 Linux 在其合同上仅支持最高 50 TB 的 ext4 文件系统,并建议 ext4 卷不超过 100 TB。

基本操作 #

创建文件 #

newFile, err = os.Create("test.txt")
if err != nil {
    log.Fatal(err)
}
log.Println(newFile)
newFile.Close()

创建文件夹 #

dirPath := "path/to/directory"
err := os.MkdirAll(dirPath, 0755)
if err != nil {
			fmt.Println("无法创建文件夹:", err)
			return
}

Truncate文件 #

裁剪一个文件到100个字节。 如果文件本来就少于100个字节,则文件中原始内容得以保留,剩余的字节以null字节填充。 如果文件本来超过100个字节,则超过的字节会被抛弃。 这样我们总是得到精确的100个字节的文件。 传入0则会清空文件。

err := os.Truncate("test.txt", 100)
if err != nil {
    log.Fatal(err)
}

得到文件信息 #

var (
    fileInfo os.FileInfo
    err      error
)
func main() {
    // 如果文件不存在,则返回错误
    fileInfo, err = os.Stat("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println("File name:", fileInfo.Name())
    fmt.Println("Size in bytes:", fileInfo.Size())
    fmt.Println("Permissions:", fileInfo.Mode())
    fmt.Println("Last modified:", fileInfo.ModTime())
    fmt.Println("Is Directory: ", fileInfo.IsDir())
    fmt.Printf("System interface type: %T\n", fileInfo.Sys())
    fmt.Printf("System info: %+v\n\n", fileInfo.Sys())
}

获取文件当前路径 #

func main() {
       dir,_ := os.Getwd()
       fmt.Println("当前路径:",dir)
}

重命名和移动 #

originalPath := "test.txt"
newPath := "test2.txt"
err := os.Rename(originalPath, newPath)
if err != nil {
    log.Fatal(err)
}

rename 和 move 原理一样

删除文件 #

err := os.Remove("test.txt")
if err != nil {
    log.Fatal(err)
}

打开和关闭文件 #

简单地以只读的方式打开

file, err := os.Open("test.txt")
if err != nil {
    log.Fatal(err)
}
file.Close()
file, err = os.OpenFile("test.txt", os.O_APPEND|os.O_RDWR|os.O_SYNC, os.ModePerm)
if err != nil {
    log.Fatal(err)
}
file.Close()
// os.O_RDONLY // 只读
// os.O_WRONLY // 只写
// os.O_RDWR // 读写
// os.O_APPEND // 往文件中添建(Append)
// os.O_CREATE // 如果文件不存在则先创建
// os.O_TRUNC // 文件打开时裁剪文件
// os.O_EXCL // 和O_CREATE一起使用,文件不能存在
// os.O_SYNC // 以同步I/O的方式打开
const (    
    ModeDir        FileMode = 1 << (32 - 1 - iota) // 文件夹模式    
    ModeAppend                                     // 追加模式    
    ModeExclusive                                  // 单独使用    
    ModeTemporary                                  // 临时文件    
    ModeSymlink                                    // 象征性的关联    
    ModeDevice                                     // 设备文件    
    ModeNamedPipe                                  // 命名管道    
    ModeSocket                                     // Unix 主机 socket 
    ModeSetuid                                     // 设置uid    
    ModeSetgid                                     // 设置gid    
    ModeCharDevice                                 // UNIX 字符串设备,当设备模式是设置unix    
    ModeSticky                                     // 粘性的    
    ModeIrregular                                  // 非常规文件;对该文件一无所知    
    ModeType = ModeDir | ModeSymlink | ModeNamedPipe | ModeSocket | ModeDevice | ModeCharDevice | ModeIrregular   // bit位遮盖,不变的文件设置为none
    ModePerm FileMode = 0777 // 权限位
)
os.O_WRONLY | os.O_CREATE | O_EXCL       【如果已经存在,则失败】
os.O_WRONLY | os.O_CREATE                【如果已经存在,会覆盖写,不会清空原来的文件,而是从头直接覆盖写】
os.O_WRONLY | os.O_CREATE | os.O_APPEND  【如果已经存在,则在尾部添加写】

检查文件是否存在 #

var (
    fileInfo *os.FileInfo
    err      error
)
func main() {
    // 文件不存在则返回error
    fileInfo, err := os.Stat("test.txt")
    if err != nil {
        if os.IsNotExist(err) {
            log.Fatal("File does not exist.")
        }
    }
    log.Println("File does exist. File information:")
    log.Println(fileInfo)
}

检查文件夹是否存在 #

func main() {
	dirPath := "path/to/directory"

	// 检查文件夹是否存在
	if _, err := os.Stat(dirPath); os.IsNotExist(err) {
		// 文件夹不存在,创建它
		err := os.MkdirAll(dirPath, 0755)
		if err != nil {
			fmt.Println("无法创建文件夹:", err)
			return
		}
		fmt.Println("文件夹已创建:", dirPath)
	} else {
		fmt.Println("文件夹已存在:", dirPath)
	}
}

检查读写权限 #

func main() {
    // 这个例子测试写权限,如果没有写权限则返回error。
    // 注意文件不存在也会返回error,需要检查error的信息来获取到底是哪个错误导致。
    file, err := os.OpenFile("test.txt", os.O_WRONLY, 0666)
    if err != nil {
        if os.IsPermission(err) {
            log.Println("Error: Write permission denied.")
        }
    }
    file.Close()
    // 测试读权限
    file, err = os.OpenFile("test.txt", os.O_RDONLY, 0666)
    if err != nil {
        if os.IsPermission(err) {
            log.Println("Error: Read permission denied.")
        }
    }
    file.Close()
}

改变权限、拥有者、时间戳 #

// 使用Linux风格改变文件权限
err := os.Chmod("test.txt", 0777)
if err != nil {
    log.Println(err)
}
// 改变文件所有者
err = os.Chown("test.txt", os.Getuid(), os.Getgid())
if err != nil {
    log.Println(err)
}
// 改变时间戳
twoDaysFromNow := time.Now().Add(48 * time.Hour)
lastAccessTime := twoDaysFromNow
lastModifyTime := twoDaysFromNow
err = os.Chtimes("test.txt", lastAccessTime, lastModifyTime)
if err != nil {
    log.Println(err)
}

硬链接和软链接 #

一个普通的文件是一个指向硬盘的inode的地方。 硬链接创建一个新的指针指向同一个地方。只有所有的链接被删除后文件才会被删除。硬链接只在相同的文件系统中才工作。你可以认为一个硬链接是一个正常的链接。

symbolic link,又叫软连接,和硬链接有点不一样,它不直接指向硬盘中的相同的地方,而是通过名字引用其它文件。他们可以指向不同的文件系统中的不同文件。并不是所有的操作系统都支持软链接。

// 创建一个硬链接。
// 创建后同一个文件内容会有两个文件名,改变一个文件的内容会影响另一个。
// 删除和重命名不会影响另一个。
err := os.Link("original.txt", "original_also.txt")
if err != nil {
    log.Fatal(err)
}
fmt.Println("creating sym")
// Create a symlink
err = os.Symlink("original.txt", "original_sym.txt")
if err != nil {
    log.Fatal(err)
}
// Lstat返回一个文件的信息,但是当文件是一个软链接时,它返回软链接的信息,而不是引用的文件的信息。
// Symlink在Windows中不工作。
fileInfo, err := os.Lstat("original_sym.txt")
if err != nil {
    log.Fatal(err)
}
fmt.Printf("Link info: %+v", fileInfo)
//改变软链接的拥有者不会影响原始文件。
err = os.Lchown("original_sym.txt", os.Getuid(), os.Getgid())
if err != nil {
    log.Fatal(err)
}

获取文件夹下的所有文件和目录 #

使用 os.ReadDir() 获取文件夹下的所有文件和目录

func main() {
	// 指定要扫描的目录路径
	dirPath := "./test_folder"

	// 获取目录下的文件和子目录列表
	files, err := os.ReadDir(dirPath)
	if err != nil {
		fmt.Printf("无法读取目录: %v\n", err)
		return
	}

	// 遍历文件和目录
	fmt.Println("目录中的文件列表:")
	for _, file := range files {
		// 打印文件名
		if !file.IsDir() { // 判断是否为文件
			fmt.Println(file.Name())
		}
	}
}

读写 #

复制文件 #

func main() {
    originalFile, err := os.Open("test.txt")    // 打开原始文件
    if err != nil {
        log.Fatal(err)
    }
    defer originalFile.Close()
    newFile, err := os.Create("test_copy.txt")    // 创建新的文件作为目标文件
    if err != nil {
        log.Fatal(err)
    }
    defer newFile.Close()
    bytesWritten, err := io.Copy(newFile, originalFile)    // 从源中复制字节到目标文件
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Copied %d bytes.", bytesWritten)
    err = newFile.Sync()    // 将文件内容flush到硬盘中
    if err != nil {
        log.Fatal(err)
    }
}

跳转到文件指定位置(Seek) #

func main() {
    file, _ := os.Open("test.txt")
    defer file.Close()
    var offset int64 = 5    // 偏离位置,可以是正数也可以是负数
    var whence int = 0//用来计算offset的初始位置0=文件开始位置1=当前位置2=文件结尾处
    newPosition, err := file.Seek(offset, whence)
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println("Just moved to 5:", newPosition)
    newPosition, err = file.Seek(-2, 1)// 从当前位置回退两个字节
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println("Just moved back two:", newPosition)   
    currentPosition, err := file.Seek(0, 1)// 使用下面的技巧得到当前的位置
    fmt.Println("Current position:", currentPosition)
    newPosition, err = file.Seek(0, 0)// 转到文件开始处
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println("Position after seeking 0,0:", newPosition)
}

写文件 #

可以使用os包写入一个打开的文件。 因为Go可执行包是静态链接的可执行文件,你import的每一个包都会增加你的可执行文件的大小。其它的包如io、 ioutil、bufio提供了一些方法,但是它们不是必须的。

file, err := os.OpenFile(// 可写方式打开文件
    "test.txt",
    os.O_WRONLY|os.O_TRUNC|os.O_CREATE,
    0666,
)
if err != nil {
    log.Fatal(err)
}
defer file.Close()
// 写字节到文件中
byteSlice := []byte("Bytes!\n")
bytesWritten, err := file.Write(byteSlice)
if err != nil {
    log.Fatal(err)
}
log.Printf("Wrote %d bytes.\n", bytesWritten)

快写文件 #

ioutil包有一个非常有用的方法WriteFile()可以处理创建/打开文件、写字节slice和关闭文件一系列的操作。如果你需要简洁快速地写字节slice到文件中,你可以使用它。

func main() {
    err := ioutil.WriteFile("test.txt", []byte("Hi\n"), 0666)
    if err != nil {
        log.Fatal(err)
    }
}

使用缓存写 #

bufio包提供了带缓存功能的writer,所以你可以在写字节到硬盘前使用内存缓存。当你处理很多的数据很有用,因为它可以节省操作硬盘I/O的时间。在其它一些情况下它也很有用,比如你每次写一个字节,把它们攒在内存缓存中,然后一次写入到硬盘中,减少硬盘的磨损以及提升性能。

func main() {
    // 打开文件,只写
    file, err := os.OpenFile("test.txt", os.O_WRONLY, 0666)
    if err != nil {
        log.Fatal(err)
    }
    defer file.Close()
    // 为这个文件创建buffered writer
    bufferedWriter := bufio.NewWriter(file)
    // 写字节到buffer
    bytesWritten, err := bufferedWriter.Write(
        []byte{65, 66, 67},
    )
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Bytes written: %d\n", bytesWritten)
    // 写字符串到buffer
    // 也可以使用 WriteRune() 和 WriteByte()   
    bytesWritten, err = bufferedWriter.WriteString(
        "Buffered string\n",
    )
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Bytes written: %d\n", bytesWritten)
    // 检查缓存中的字节数
    unflushedBufferSize := bufferedWriter.Buffered()
    log.Printf("Bytes buffered: %d\n", unflushedBufferSize)
    // 还有多少字节可用(未使用的缓存大小)
    bytesAvailable := bufferedWriter.Available()
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Available buffer: %d\n", bytesAvailable)
    // 写内存buffer到硬盘
    bufferedWriter.Flush()
    // 丢弃还没有flush的缓存的内容,清除错误并把它的输出传给参数中的writer
    // 当你想将缓存传给另外一个writer时有用
    bufferedWriter.Reset(bufferedWriter)
    bytesAvailable = bufferedWriter.Available()
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Available buffer: %d\n", bytesAvailable)
    // 重新设置缓存的大小。
    // 第一个参数是缓存应该输出到哪里,这个例子中我们使用相同的writer。
    // 如果我们设置的新的大小小于第一个参数writer的缓存大小, 比如10,我们不会得到一个10字节大小的缓存,
    // 而是writer的原始大小的缓存,默认是4096。
    // 它的功能主要还是为了扩容。
    bufferedWriter = bufio.NewWriterSize(
        bufferedWriter,
        8000,
    )
    // resize后检查缓存的大小
    bytesAvailable = bufferedWriter.Available()
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Available buffer: %d\n", bytesAvailable)
}

读取最多N个字节 #

os.File提供了文件操作的基本功能, 而ioioutilbufio提供了额外的辅助函数。

func main() {
    // 打开文件,只读
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    defer file.Close()
    // 从文件中读取len(b)字节的文件。
    // 返回0字节意味着读取到文件尾了
    // 读取到文件会返回io.EOF的error
    byteSlice := make([]byte, 16)
    bytesRead, err := file.Read(byteSlice)
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Number of bytes read: %d\n", bytesRead)
    log.Printf("Data read: %s\n", byteSlice)
}

读取正好N个字节 #

func main() {
    // Open file for reading
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    // file.Read()可以读取一个小文件到大的byte slice中,
    // 但是io.ReadFull()在文件的字节数小于byte slice字节数的时候会返回错误
    byteSlice := make([]byte, 2)
    numBytesRead, err := io.ReadFull(file, byteSlice)
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Number of bytes read: %d\n", numBytesRead)
    log.Printf("Data read: %s\n", byteSlice)
}

读取至少N个字节 #

func main() {
    // 打开文件,只读
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    byteSlice := make([]byte, 512)
    minBytes := 8
    // io.ReadAtLeast()在不能得到最小的字节的时候会返回错误,但会把已读的文件保留
    numBytesRead, err := io.ReadAtLeast(file, byteSlice, minBytes)
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Number of bytes read: %d\n", numBytesRead)
    log.Printf("Data read: %s\n", byteSlice)
}

读取全部字节 #

func main() {
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    // os.File.Read(), io.ReadFull() 和
    // io.ReadAtLeast() 在读取之前都需要一个固定大小的byte slice。
    // 但ioutil.ReadAll()会读取reader(这个例子中是file)的每一个字节,然后把字节slice返回。
    data, err := ioutil.ReadAll(file)
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Data as hex: %x\n", data)
    fmt.Printf("Data as string: %s\n", data)
    fmt.Println("Number of bytes read:", len(data))
}

快读到内存 #

func main() {
    // 读取文件到byte slice中
    data, err := ioutil.ReadFile("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    log.Printf("Data read: %s\n", data)
}

使用缓存读 #

有缓存写也有缓存读。 缓存reader会把一些内容缓存在内存中。它会提供比os.Fileio.Reader更多的函数,缺省的缓存大小是4096,最小缓存是16。

func main() {
    // 打开文件,创建buffered reader
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    bufferedReader := bufio.NewReader(file)
    // 得到字节,当前指针不变
    byteSlice := make([]byte, 5)
    byteSlice, err = bufferedReader.Peek(5)
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Peeked at 5 bytes: %s\n", byteSlice)
    // 读取,指针同时移动
    numBytesRead, err := bufferedReader.Read(byteSlice)
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Read %d bytes: %s\n", numBytesRead, byteSlice)
    // 读取一个字节, 如果读取不成功会返回Error
    myByte, err := bufferedReader.ReadByte()
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Read 1 byte: %c\n", myByte)     
    // 读取到分隔符,包含分隔符,返回byte slice
    dataBytes, err := bufferedReader.ReadBytes('\n')
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Read bytes: %s\n", dataBytes)           
    // 读取到分隔符,包含分隔符,返回字符串
    dataString, err := bufferedReader.ReadString('\n')
    if err != nil {
        log.Fatal(err)
    }
    fmt.Printf("Read string: %s\n", dataString)     
    //这个例子读取了很多行,所以test.txt应该包含多行文本才不至于出错
}

使用 scanner #

Scannerbufio包下的类型,在处理文件中以分隔符分隔的文本时很有用。 通常我们使用换行符作为分隔符将文件内容分成多行。在CSV文件中,逗号一般作为分隔符。 os.File文件可以被包装成bufio.Scanner,它就像一个缓存reader。 我们会调用Scan()方法去读取下一个分隔符,使用Text()或者Bytes()获取读取的数据。

分隔符可以不是一个简单的字节或者字符,有一个特殊的方法可以实现分隔符的功能,以及将指针移动多少,返回什么数据。 如果没有定制的SplitFunc提供,缺省的ScanLines会使用newline字符作为分隔符,其它的分隔函数还包括ScanRunesScanWords,皆在bufio包中。

// To define your own split function, match this fingerprint
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)
// Returning (0, nil, nil) will tell the scanner
// to scan again, but with a bigger buffer because
// it wasn't enough data to reach the delimiter

下面的例子中,为一个文件创建了bufio.Scanner,并按照单词逐个读取:

func main() {
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    scanner := bufio.NewScanner(file)
    // 缺省的分隔函数是bufio.ScanLines,我们这里使用ScanWords。
    // 也可以定制一个SplitFunc类型的分隔函数
    scanner.Split(bufio.ScanWords)
    // scan下一个token.
    success := scanner.Scan()
    if success == false {
        // 出现错误或者EOF是返回Error
        err = scanner.Err()
        if err == nil {
            log.Println("Scan completed and reached EOF")
        } else {
            log.Fatal(err)
        }
    }
    // 得到数据,Bytes() 或者 Text()
    fmt.Println("First word found:", scanner.Text())
    // 再次调用scanner.Scan()发现下一个token
}

压缩 #

打包(zip) 文件 #

func main() {
    // 创建一个打包文件
    outFile, err := os.Create("test.zip")
    if err != nil {
        log.Fatal(err)
    }
    defer outFile.Close()
    // 创建zip writer
    zipWriter := zip.NewWriter(outFile)
    // 往打包文件中写文件。
    // 这里我们使用硬编码的内容,你可以遍历一个文件夹,把文件夹下的文件以及它们的内容写入到这个打包文件中。
    var filesToArchive = []struct {
        Name, Body string
    } {
        {"test.txt", "String contents of file"},
        {"test2.txt", "\x61\x62\x63\n"},
    }
    // 下面将要打包的内容写入到打包文件中,依次写入。
    for _, file := range filesToArchive {
            fileWriter, err := zipWriter.Create(file.Name)
            if err != nil {
                    log.Fatal(err)
            }
            _, err = fileWriter.Write([]byte(file.Body))
            if err != nil {
                    log.Fatal(err)
            }
    }
    // 清理
    err = zipWriter.Close()
    if err != nil {
            log.Fatal(err)
    }
}

抽取(unzip) 文件 #

func main() {
    zipReader, err := zip.OpenReader("test.zip")
    if err != nil {
        log.Fatal(err)
    }
    defer zipReader.Close()
    // 遍历打包文件中的每一文件/文件夹
    for _, file := range zipReader.Reader.File {
        // 打包文件中的文件就像普通的一个文件对象一样
        zippedFile, err := file.Open()
        if err != nil {
            log.Fatal(err)
        }
        defer zippedFile.Close()
        // 指定抽取的文件名。
        // 你可以指定全路径名或者一个前缀,这样可以把它们放在不同的文件夹中。
        // 我们这个例子使用打包文件中相同的文件名。
        targetDir := "./"
        extractedFilePath := filepath.Join(
            targetDir,
            file.Name,
        )
        // 抽取项目或者创建文件夹
        if file.FileInfo().IsDir() {
            // 创建文件夹并设置同样的权限
            log.Println("Creating directory:", extractedFilePath)
            os.MkdirAll(extractedFilePath, file.Mode())
        } else {
            //抽取正常的文件
            log.Println("Extracting file:", file.Name)
            outputFile, err := os.OpenFile(
                extractedFilePath,
                os.O_WRONLY|os.O_CREATE|os.O_TRUNC,
                file.Mode(),
            )
            if err != nil {
                log.Fatal(err)
            }
            defer outputFile.Close()
            // 通过io.Copy简洁地复制文件内容
            _, err = io.Copy(outputFile, zippedFile)
            if err != nil {
                log.Fatal(err)
            }
        }
    }
}

压缩文件 #

// 这个例子中使用gzip压缩格式,标准库还支持zlib, bz2, flate, lzw
func main() {
    outputFile, err := os.Create("test.txt.gz")
    if err != nil {
        log.Fatal(err)
    }
    gzipWriter := gzip.NewWriter(outputFile)
    defer gzipWriter.Close()
    // 当我们写如到gizp writer数据时,它会依次压缩数据并写入到底层的文件中。
    // 我们不必关心它是如何压缩的,还是像普通的writer一样操作即可。
    _, err = gzipWriter.Write([]byte("Gophers rule!\n"))
    if err != nil {
        log.Fatal(err)
    }
    log.Println("Compressed data written to file.")
}

解压缩文件 #

// 这个例子中使用gzip压缩格式,标准库还支持zlib, bz2, flate, lzw
func main() {
    // 打开一个gzip文件。
    // 文件是一个reader,但是我们可以使用各种数据源,比如web服务器返回的gzipped内容,
    // 它的内容不是一个文件,而是一个内存流
    gzipFile, err := os.Open("test.txt.gz")
    if err != nil {
        log.Fatal(err)
    }
    gzipReader, err := gzip.NewReader(gzipFile)
    if err != nil {
        log.Fatal(err)
    }
    defer gzipReader.Close()
    // 解压缩到一个writer,它是一个file writer
    outfileWriter, err := os.Create("unzipped.txt")
    if err != nil {
        log.Fatal(err)
    }
    defer outfileWriter.Close()
    // 复制内容
    _, err = io.Copy(outfileWriter, gzipReader)
    if err != nil {
        log.Fatal(err)
    }
}

其它 #

临时文件和目录 #

ioutil提供了两个函数: TempDir()TempFile()。 使用完毕后,调用者负责删除这些临时文件和文件夹。 有一点好处就是当你传递一个空字符串作为文件夹名的时候,它会在操作系统的临时文件夹中创建这些项目(/tmp on Linux)。 os.TempDir()返回当前操作系统的临时文件夹。

func main() {
     // 在系统临时文件夹中创建一个临时文件夹
     tempDirPath, err := ioutil.TempDir("", "myTempDir")
     if err != nil {
          log.Fatal(err)
     }
     fmt.Println("Temp dir created:", tempDirPath)
     // 在临时文件夹中创建临时文件
     tempFile, err := ioutil.TempFile(tempDirPath, "myTempFile.txt")
     if err != nil {
          log.Fatal(err)
     }
     fmt.Println("Temp file created:", tempFile.Name())
     // ... 做一些操作 ...
     // 关闭文件
     err = tempFile.Close()
     if err != nil {
        log.Fatal(err)
    }
    // 删除我们创建的资源
     err = os.Remove(tempFile.Name())
     if err != nil {
        log.Fatal(err)
    }
     err = os.Remove(tempDirPath)
     if err != nil {
        log.Fatal(err)
    }
}

通过HTTP下载文件 #

func main() {
     newFile, err := os.Create("devdungeon.html")
     if err != nil {
          log.Fatal(err)
     }
     defer newFile.Close()
     url := "http://www.devdungeon.com/archive"
     response, err := http.Get(url)
     defer response.Body.Close()
     // 将HTTP response Body中的内容写入到文件
     // Body满足reader接口,因此我们可以使用ioutil.Copy
     numBytesWritten, err := io.Copy(newFile, response.Body)
     if err != nil {
          log.Fatal(err)
     }
     log.Printf("Downloaded %d byte file.\n", numBytesWritten)
}

哈希和摘要 #

func main() {
    // 得到文件内容
    data, err := ioutil.ReadFile("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    // 计算Hash
    fmt.Printf("Md5: %x\n\n", md5.Sum(data))
    fmt.Printf("Sha1: %x\n\n", sha1.Sum(data))
    fmt.Printf("Sha256: %x\n\n", sha256.Sum256(data))
    fmt.Printf("Sha512: %x\n\n", sha512.Sum512(data))
}

上面的例子复制整个文件内容到内存中,传递给hash函数。 另一个方式是创建一个hash writer, 使用WriteWriteStringCopy将数据传给它。 下面的例子使用 md5 hash,但你可以使用其它的Writer。

func main() {
    file, err := os.Open("test.txt")
    if err != nil {
        log.Fatal(err)
    }
    defer file.Close()
    //创建一个新的hasher,满足writer接口
    hasher := md5.New()
    _, err = io.Copy(hasher, file)
    if err != nil {
        log.Fatal(err)
    }
    // 计算hash并打印结果。
    // 传递 nil 作为参数,因为我们不通参数传递数据,而是通过writer接口。
    sum := hasher.Sum(nil)
    fmt.Printf("Md5 checksum: %x\n", sum)
}

设置底层读取缓存 #

如果你直接使用 os.File 读取文件,Go 会使用默认的缓冲区大小(一般是 4KB)。

通过 bufio.NewReaderSize 来手动指定缓冲区大小

dokan挂载的文件系统,使用默认4k读取会非常慢,使用1M跟它保持一致,速度很快。

func main() {
    file, err := os.Open("example.txt")
    if err != nil {
        fmt.Println(err)
        return
    }
    defer file.Close()

    // 设置缓冲区大小为 1MB
    reader := bufio.NewReaderSize(file, 1*1024*1024)

    buffer := make([]byte, 1024)
    for {
        n, err := reader.Read(buffer)
        if err != nil {
            break
        }
        fmt.Print(string(buffer[:n]))
    }
}