所有栏目 | 云社区美国云服务器[国内云主机商]

你的位置：首页 > 云社区 » 正文

为分布式做准备，如何实现调用链服务端？

发布时间：2020-04-12 08:45:05

资讯分类：调用链服务端分布式跟踪服务数据

分布式环境下，实现服务端调用链，市面上有很多开源的框架供选择，不过理论模型大多都是借鉴Google Dapper论文，常见的APM（Application Performance Management）组件有：

1.Zipkin

由Twitter公司开源，开放源代码分布式的跟踪系统，用于收集服务的定时数据，以解决微服务架构中的延迟问题，包括数据的收集、存储、查找和展现;

github地址：https://github.com/openzipkin/zipkin

2.Pinpoint

Pinpoint是一款对Java编写的大规模分布式系统的APM工具，由韩国人开源的分布式跟踪组件；

github地址：https://github.com/naver/pinpoint

3.SkyWalking

是一款国人主导开发的开源应用性能监控系统，包括指标监控，分布式追踪，分布式系统性能诊断；

github地址：https://github.com/apache/skywalking

4.CAT

CAT 是基于 Java 开发的实时应用监控平台，为美团点评提供了全面的实时监控告警服务

github地址：https://github.com/dianping/cat

类似的还有淘宝的EgleEye，京东的Hydra等；

本人之前写过一篇关于zipkin的快速入门文章，如下所示：

Zipkin快速开始

Zipkin是什么

Zipkin分布式跟踪系统；它可以帮助收集时间数据，解决在microservice架构下的延迟问题；它管理这些数据的收集和查找；Zipkin的设计是基于谷歌的Google Dapper论文。每个应用程序向Zipkin报告定时数据，Zipkin UI呈现了一个依赖图表来展示多少跟踪请求经过了每个应用程序；如果想解决延迟问题，可以过滤或者排序所有的跟踪请求，并且可以查看每个跟踪请求占总跟踪时间的百分比。

为什么使用Zipkin

随着业务越来越复杂，系统也随之进行各种拆分，特别是随着微服务架构和容器技术的兴起，看似简单的一个应用，后台可能有几十个甚至几百个服务在支撑；一个前端的请求可能需要多次的服务调用最后才能完成；当请求变慢或者不可用时，我们无法得知是哪个后台服务引起的，这时就需要解决如何快速定位服务故障点，Zipkin分布式跟踪系统就能很好的解决这样的问题。

Zipkin下载和启动

官方提供了三种方式来启动，这里使用第二种方式来启动;

wget -O zipkin.jar 'https://search.maven.org/remote_content?g=io.zipkin.java&a=zipkin-server&v=LATEST&c=exec'
java -jar zipkin.jar

首先下载zipkin.jar，然后直接使用-jar命令运行，要求jdk8以上版本；

基于Undertow WEB服务器，提供对外端口：9411，可以打开浏览器访问http://ip:9411

详细参考：https://zipkin.io/pages/quickstart.html

Zipkin架构跟踪器(Tracer)位于你的应用程序中，并记录发生的操作的时间和元数据,提供了相应的类库，对用户的使用来说是透明的，收集的跟踪数据称为Span;将数据发送到Zipkin的仪器化应用程序中的组件称为Reporter,Reporter通过几种传输方式之一将追踪数据发送到Zipkin收集器(collector)，然后将跟踪数据进行存储(storage),由API查询存储以向UI提供数据。架构图如下：

1.TraceZipkin使用Trace结构表示对一次请求的跟踪，一次请求可能由后台的若干服务负责处理，每个服务的处理是一个Span，Span之间有依赖关系，Trace就是树结构的Span集合；

2.Span每个服务的处理跟踪是一个Span，可以理解为一个基本的工作单元，包含了一些描述信息：id，parentId，name，timestamp，duration，annotations等，例如：

traceId：标记一次请求的跟踪，相关的Spans都有相同的traceId；

id：span id；

name：span的名称，一般是接口方法的名称；

parentId：可选的id，当前Span的父Span id，通过parentId来保证Span之间的依赖关系，如果没有parentId，表示当前Span为根Span；

timestamp：Span创建时的时间戳，使用的单位是微秒（而不是毫秒），所有时间戳都有错误，包括主机之间的时钟偏差以及时间服务重新设置时钟的可能性，出于这个原因，Span应尽可能记录其duration；

duration：持续时间使用的单位是微秒（而不是毫秒）；

annotations：注释用于及时记录事件；有一组核心注释用于定义RPC请求的开始和结束；

cs:Client Send，客户端发起请求；
sr:Server Receive，服务器接受请求，开始处理；
ss:Server Send，服务器完成处理，给客户端应答；
cr:Client Receive，客户端接受应答从服务器；

binaryAnnotations：二进制注释，旨在提供有关RPC的额外信息。

3.Transport

收集的Spans必须从被追踪的服务运输到Zipkin collector，有三个主要的传输方式：HTTP, Kafka和Scribe；

4.Components

有4个组件组成Zipkin：collector，storage，search，web UI

collector：一旦跟踪数据到达Zipkin collector守护进程，它将被验证，存储和索引，以供Zipkin收集器查找；

storage：Zipkin最初数据存储在Cassandra上，因为Cassandra是可扩展的，具有灵活的模式，并在Twitter中大量使用；但是这个组件可插入，除了Cassandra之外，还支持ElasticSearch和MySQL；

search：一旦数据被存储和索引，我们需要一种方法来提取它。查询守护进程提供了一个简单的JSON API来查找和检索跟踪，主要给Web UI使用；

web UI：创建了一个GUI，为查看痕迹提供了一个很好的界面；Web UI提供了一种基于服务，时间和注释查看跟踪的方法。

实战

使用Zipkin和Brave实现http服务调用的跟踪，Brave 是用来装备Java程序的类库，提供了面向标准Servlet、Spring MVC、Http Client、JAX RS、Jersey、Resteasy 和 MySQL 等接口的装备能力，可以通过编写简单的配置和代码，让基于这些框架构建的应用可以向 Zipkin 报告数据。同时 Brave 也提供了非常简单且标准化的接口，在以上封装无法满足要求的时候可以方便扩展与定制。

提供四个工程，分别对应四个服务分别是：zipkin1，zipkin2，zipkin3，zipkin4；zipkin1通过httpclient调用zipkin2，然后zipkin2通过httpclient调用zipkin3和zipkin4，形成一个调用链；四个服务都是基于spring-boot来实现，对应的端口分别是8081，8082，8083，8084；

1.公共maven依赖库

2.核心类ZipkinBean提供需要使用的Bean

3.核心类ZipkinController对外接口

分别启动四个服务，然后浏览器访问：http://localhost:8081/service1，正常调用结果返回：

可以观察zipkin web ui，查看服务的调用链：