在生产环境中使用Docker,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作。
容器中的管理数据主要有两种方式:
- 数据卷(Data Volumes):容器内数据直接映射到本地主机环境;
- 数据卷容器(Data Volume Containers):使用特定容器维护数据卷。
本篇主要讲解如何在容器内创建数据卷,并且把本地的目录或文件挂载到容器内的数据卷中。如何使用数据卷容器在容器和主机、容器和容器之间共享数据,并实现数据的备份和恢复。
1.数据卷
数据卷(Data Volumes)是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于Linux中的mount行为。
数据卷可以提供很多有用的特性:
- 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效与方便;
- 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作;
- 对数据卷的更新不会影响镜像,解耦开应用和数据;
- 卷会一直存在,直到没有容器使用,可以安全地卸载它。
“卷”是容器上的一个或多个“目录”,此类目录可绕过联合文件系统,与宿主机上的某个目录“绑定(关联)”;
类似于挂载一样,宿主机的/data/web目录与容器中的/container/data/web目录绑定关系,然后容器中的进程向这个目录中写数据时,是直接写在宿主机的目录上的,绕过容器文件系统与宿主机的文件系统建立关联关系,使得可以在宿主机和容器内共享数据库内容,让容器直接访问宿主机中的内容,也可以宿主机向容器供集内容,两者是同步的。
mount名称空间本来是隔离的,可以让两个本来是隔离的文件系统,在某个子路径上建立一定程度的绑定关系,从而使得在两个容器之间的文件系统的某个子路径上不再是隔离的,实现一定程度上共享的效果。
在宿主机上能够被共享的目录(可以是文件)就被称为volume。
1.1 数据卷优势
优点是容器中进程所生成的数据,都保存在数据卷上,从而脱离容器文件系统自身后,当容器被关闭甚至被删除时,都不用担心数据被丢失,实现数据可以脱离容器生命周期而持久,当再次重建容器时,如果可以让它使用到或者关联到同一个数据卷上时,再创建容器,虽然不是之前的容器,但是数据还是那个数据,特别类似于进程的运行逻辑,进程本身不保存任何的数据,数据都在进程之外的文件系统上,或者是专业的存储服务之上,所以进程每次停止,只是保存程序文件,对于容器也是一样;容器就是一个有生命周期的动态对象来使用,容器关闭就是容器删除的时候,但是它底层的镜像文件还是存在的,可以基于镜像再重新启动容器。
但是容器有一个问题,一般与进程的启动不太一样,就是容器启动时选项比较多,如果下次再启动时,很容器会忘记它启动时的选项,所以最好有一个文件来保存容器的启动,这就是容器编排工具的作用。一般情况下,是使用命令来启动操作docker,但是可以通过文件来读,也就读文件来启动,读所需要的数据卷等,但是它也只是操作一个容器,这也是需要专业的容器编排工具的原因。
另一个优势就是容器就可以不置于启动在那台主机之上了,如几台主机后面挂载一个NFS,在各自主机上创建容器,而容器上通过关联到宿主机的某个目录上,而这个目录也是NFS所挂载的目录中,这样容器如果停止或者是删除都可以不限制于只能在原先的宿主机上启动才可以,可以实现全集群范围内调试容器的使用,当再分配存储、计算资源时,就不会再局限于单机之上,可以在集群范围内建立起来,基本各种docker的编排工具都能实现此功能,但是后面严重依赖于共享存储的使用。
1.2 数据卷类型
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上位置有所不同;
Bind mount volume(绑定挂载卷):在宿主机上的路径要人工的指定一个特定的路径,在容器中也需要指定一个特定的路径,两个已知的路径建立关联关系
Docker-managed volume(docker管理卷): 只需要在容器内指定容器的挂载点是什么,而被绑定宿主机下的那个目录,是由容器引擎daemon自行创建一个空的目录,或者使用一个已经存在的目录,与数据卷建立存储关系,这种方式极大解脱用户在使用卷时的耦合关系,缺陷是用户无法指定那些使用目录,临时存储比较适合;
2. 绑定数据卷
在创建容器时将主机本地的任意路径挂载到容器内作为数据卷,这种形式创建的数据卷称为绑定数据卷。
如何挂载 volume、bind mount、tmpfs mount:
- Docker 17.06 之前:-v \ --volume \ --tmpfs 参数设定
- Docker 17.06 之后:--mount 参数设定,更清晰
在用docker [container]run命令的时候,可以使用-mount选项来使用数据卷。
-mount 选项支持三种类型的数据卷,包括:
- volume:普通数据卷,映射到主机/var/1ib/docker/volumes路径下;
- bind:绑定数据卷,映射到主机指定路径下;
- tmpfs:临时数据卷,只存在于内存中。
--mount <key>=<value>,<key>=<value>,<key>=<value>
其中,key 的具体取值说明:
volume (volume、bind mount)相关参数的含义:
bind mounts:意为着可以存储在宿主机系统的任意位置;(比较常用的方式)
但是,bind mount在不同的宿主机系统时不可移植的,比如Windows和Linux的目录结构是不一样的,bind mount所指向的host目录也不能一样。这也是为什么bind mount不能出现在Dockerfile中的原因,因为这样Dockerfile就不可移植了。
注意:
- 宿主机的目录路径必须为全路径(要以/或~/开始的路径)
- 如果宿主机的目录不存在,docker会自动创建该目录
- 如果container中的目录不存在,docker会自动创建该目录
- 如果container中的目录已经有内容,那么docker会使用host上的目录将其覆盖掉
tmpfs:挂载存储在宿主机系统的内存中,而不会写入宿主机的文件系统;(一般都不会用的方式)
关于 volume、bind mount、tmpfs mount 的使用实践:
2.1 Bind mount
2.1.1 基本知识
关于 Bind mount:
Docker 的早期方案
作用:
- 依赖 bind mount,可以将宿主机 FS 上的文件 or 目录,挂载到容器内
具体用法:
- 使用宿主机的「完整路径名」(绝对路径)或「相对路径名」
- 宿主机的目录或文件,如果不存在,则,在挂载过程中,会自动创建
- 仅限于使用 -v 和 --volume 方式,进行 bind mount,此时,自动创建的都是「目录」
- --mount 方式,不会自动创建,而会抛出异常
使用建议:
- 优先使用 volume
- 无法使用 docker client 的命令行,直接进行 bind mount 的管理
- container 中进程,可以直接进行 FS 上重要文件的读写,很灵活,但需要谨慎
2.1.2 操作案例
上图中首先,使用镜像nginx:latest创建了mynginx容器,然后指定宿主数据卷路径/home/doker ,mynginx数据卷路径/zabbx。
同时在宿主机创建123.txt,然后验证mynginx 文件已经同步。
查看,容器详情,mount信息。
2.2 volume
作用:
- 数据存储在宿主机的 FS 上,为 Docker 独占的空间,非 Docker 进程不应该修改,推荐使用
注意事项:
- 容器之间,数据共享
- 首次挂载时,自动创建目录
- 容器终止,数据仍存在
- 多容器,同时挂载
- 宿主机,无法提前明确创建目录
- volume 是逻辑视图
- 在具体使用时,会自动创建
- 远端存储:数据存储到远端
2.2.1 基本知识
Docker提供了volume子命令来管理数据卷,如下命令可以快速在本地创建一个数据卷:
docker volume COMMAND COMMAND
docker volume create [OPTIONS] [VOLUME] # 创建一个卷
--driver , -d # 指定卷驱动程序名称 默认:local
--label # 设置卷的元数据
--name # 指定卷名
--opt , -o # 设置驱动程序特定选项
docker volume inspect [OPTIONS] VOLUME [VOLUME...] # 显示一个或多个卷上的详细信息
--format , -f # 使用给定的Go模板格式化输出
docker volume ls [OPTIONS] # 列出卷清单
--filter , -f # 提供过滤器值
--format # 使用Go模板打印的卷
--quiet , -q # 仅显示卷名
docker volume prune [OPTIONS] # 删除所有未使用的本地卷
--filter # 提供过滤器值
--force , -f # 不提示确认
docker volume rm [OPTIONS] VOLUME [VOLUME...] # 删除一个或多个卷
--force , -f # 强制删除一个或多个卷
本地创建数据卷 dongzao
存储位置默认local 不修改的话 ,就会创建在 /var/lib/docker/volumes文件夹下面。
其他操作
2.2.2 操作案例
首先,使用nginx:latest镜像创建,dongzao容器。
然后,指定 宿主目录为默认:local(/var/lib/docker/volume),容器地址为/dongzao.
2.3 tmpfs mount
2.3.1 基础知识
使用场景:
- 非持久化存储
- 在 Container 存活期间,使用
- Linux 版本的宿主机
用于存储:
- 非持久化的状态 or 敏感信息
实例:
- swarm 集群管理中,使用 tmpfs mount 来挂载 secrets(密钥)
2.3.2 案例操作
首先,使用nginx:latest镜像创建,qinfen容器。设置数据卷类型tmpfs,设置参数:tmpfs 内存大小 和 mode,默认为物理内存大小,tmpfs-size(单位 Byte).
关于 tmpfs-mode 的默认 1777 模式,其中使用了 sticky bit:(约束 删除、移动等特殊的写权限,只有 owner 才有权限)
评论区