Docker Registry V2源码解读-DockerInfo

Registry概述

用一句话解释docker registry就是：存放docker image的远程仓库。在使用docker的过程中，我们一定会用到docker registry，当我们使用docker的pull命令（下载镜像），或者run一个本地没有的镜像时,docker engine会从默认的仓库下载对应的镜像。

目前，docker pull命令默认仓库是docker的官方仓库，这样就导致一个问题，下载镜像速度比较慢。所以在大型分布式docker集群中，通常都会配置一个私有的docker registry，这样能提高镜像下载速度，从而提升应用的启动速度；也方便管理镜像。

docker registry的安装方式也很简单，docker公司已经把registry封装在一个docker容器中了，我们只需要下载这个容器，然后启动，就可以使用了，十分方便。但是，这样启动的方式，只能有一个registry，在稍大一点的集群中，单点故障和性能瓶颈问题就比较突出了，扩展成高可用的分布式结构势在必行，所以很多公司在优化registry方面做了很多工作，目前开源的有VMware的Habor[1]和京东的speedy[2]。

Registry发展历史

1、2013年3月13日

docker在github上有了第一个release[3]

2、2013年7月3日

docker在github上发布了docker registry v1[4]

3、2015年1月30日

docker registry v2(项目名叫docker distribution)有了第一个release，同时停止更新docker registry v1[5]

4、2015年4月16日

docker发布docker1.6，同时正式推广docker registry v2

在使用docker registry v2的时候需要注意，只有docker1.6以上版本才支持registry v2，但是docker是向前兼容的，我们从源代码里可以看出，docker engine在下载镜像的时候，会先判断远端仓库是v1还是v2版，从而使用不同的下载策略，这个策略可太重要了。下面我们就讲一下v1和v2下载策略的区别。

图1 v1版layer间结构如同一个链表

我们知道，一个docker image是由很多的layer组成的，registry v1的下载过程如图1所示，下载镜像时也是以layer为最小单元下载的，在v1的时代docker image，镜像结构有一种链表一样的组织，当下载完一个layer时，才能得到parent信息，然后再去下载parent layer，这样结构显然效率不高，所以在v2中，改变了这种结构，在image的manifest文件中存储了所有的layer信息，这样拿到所有的layer信息，就可以并行下载了，提高了下载效率，过程如图２所示。

图2 v2可以并行下载layer

还有两个明显的变化就是：

使用的开发语言也有改变，从python变成go；
使用layer内容计算layer ID，这样增加了docker镜像的安全性，在v1中这个ID仅仅是一个随机数；

整体架构

20161103102216

从架构图上我们发现，registry v2的架构还是很简单的，它的核心是一个web服务器，从阅读源码也会发现，具体实现是用go语言的net/http包中的http.Server，在registry初始化时绑定了rest接口。请求会触发相应的handler，handler会从后端存储中取出具体的数据并写入response。这个过程也很容易理解。

启动过程源码分析

接下我将从源码层面讲一下registry的启动过程，这我也是第一次细读开源项目的源码，也讲一下我作为一个新手是如何阅读源代码的。

既然registry是以一个docker container形式运行的，要看它是如何启动的，当然首先看它的Dockerfile。

图4 docker registry v2的Dockerfile

主要做了3件事：

1.拷贝代码到容器中；

2.编译成二进制可执行文件；

3.指定容器运行时的启动命令；

当我们运行docker run –p 5000:5000 registry:2时，容器内部registry的启动命令其实是registry serve /etc/docker/registry/config.yml，

进入到项目中找main函数，发现程序的入口文件是/cmd/registry/main.go，main函数也只有一句话：

20161103102239

其实在加载RootCmd时已经做了命令绑定，子命令serve对应的实现在/registry/registry.go L 30，调用的内容主要有：

1. 读取配置文件；

2. 把配置参数传递给NewRegistry()函数，用来实例化一个registry对象（虽然对象这个词用在go语言里并不合适，单张这样类比更好理解）；

3. registry进入端口监听状态，启动完毕。

Registry对象的结构定义在/registry/registry.go L68，Registry结构体声明了三个成员，如图5所示，有配置参数，app，还有一个http Server，显而易见，最重要的就是app这个成员了。

图5 Registry结构体定义

App结构体的定义在/registry/handlers/app.go L54，成员长，主要有：

1.driver 指明了后端存储，可以通过driver进行读/写/查询等操作；

2.router 包含了http路由规则，把不同的请求分发到不同的handler上；

3.registry 主要的app后端，其中绑定了storage；

4.accessController 访问控制器；

NewApp()函数完成了App实例的初始化，实现在/registry/handlers/app.go L91。该函数的大体流程如下：

1.声明一个app实例；

2.给app实例绑定web handler；

3.初始化app的后端存储驱动；

4.初始化app的密钥；

5.配置app的redis缓存；

6.初始化app的后端存储重定向功能；

7.根据参数初始化app的后端registry；

8.返回app实例；

至此，/registry/registry.go的NewRegistry()也调用结束，返回了registry实例，调用registry的ListenAndServe()进入监听状态，直到registry结束。

其实，上述还是从比较宏观的角度来看registry 的启动的。为了文章的流畅性，省略了很多结构体的初始化，比如后端storage的初始化过程中，还涉及到了内存cache的初始化。

体验&总结

作为一个阅读源码的新人，深感有一个好的IDE对于阅读源码是多么重要，我使用的是Idea14+GO插件作为开发环境，有一点需要注意的是，docker registry项目的引用都是github/***开头，所以需要把源码放在go语言的src下才能引用的到，这样也方便代码间跳转。同时，使用IDE提供的代码Forward/Backward功能，可以快速跳转到上一个光标位置，这样也会提高代码阅读效率。

目前，Docker在云计算中扮演了越来越重要的角色，Docker registry是整个平台重要的一环，但是它现在还存在很多问题，优化registry，是一个商用的容器云平台必须要做的一件事，阅读它的代码便是做优化的前提。

Docker Registry V2源码解读

Registry概述

Registry发展历史

整体架构

启动过程源码分析

体验&总结

相关推荐

评论抢沙发

评论前必须登录！

Registry概述

Registry发展历史

整体架构

启动过程源码分析

体验&总结

相关推荐

评论 抢沙发

评论前必须登录！

评论抢沙发