[toc]

高可用的Eureka Server

Eureka Server即服务的注册中心,在刚才的案例中,我们只有一个EurekaServer,事实上EurekaServer也可以是一个集群,形成高可用的Eureka中心。

1. 服务同步

多个Eureka Server之间也会互相注册为服务,当服务提供者注册到Eureka Server集群中的某个节点时,该节点会把服务的信息同步给集群中的每个节点,从而实现数据同步。因此,无论客户端访问到Eureka Server集群中的任意一个节点,都可以获取到完整的服务列表信息。

2. 搭建高可用的EurekaServer

我们假设要运行两个EurekaServer的集群端口分别为:10086和10087。只需要把justweb-eureka启动两次即可。

2.1 启动第一个eurekaServer

所谓的高可用注册中心,其实就是把EurekaServer自己也作为一个服务进行注册,这样多个EurekaServer之间就能互相发现对方,从而形成集群。因此我们做了以下修改:

  • 把service-url的值改成了另外一台EurekaServer的地址,而不是自己
  • 启动报错,很正常。因为10087服务没有启动
1
2
3
4
5
6
7
8
9
10
11
12
server:
port: 10086
spring:
application:
#应用名称,会在eureka中显示
name: eureka-server
eureka:
client:
service-url:
#eureka的服务器地址
#如果是集群的话,需要指定其他服务器的地址
defaultZone: http://localhost:10087/eureka

2.2 启动第二个eurekaServer

  • idea中一个应用不能启动两次,我们需要重新配置一个启动器
  • application.yml
1
2
3
4
5
6
7
8
9
10
11
12
server:
port: 10087
spring:
application:
#应用名称,会在eureka中显示
name: eureka-server
eureka:
client:
service-url:
#eureka的服务器地址
#如果是集群的话,需要指定其他服务器的地址
defaultZone: http://localhost:10086/eureka

2.3 客户端注册服务到集群

  • 因为EurekaServer不止一个,因此注册服务的时候,service-url参数需要变化
1
2
3
4
5
eureka:
client:
service-url:
# EurekaServer地址,多个地址以','隔开
defaultZone: http://localhost:10086/eureka,http://localhost:10087/eureka

3. 服务提供者provider

服务提供者要向EurekaServer注册服务,并且完成服务续约等工作。

  • 服务注册
  • 服务续约

3.1 服务注册

服务提供者在启动时,会检测配置属性中的:eureka.client.register-with-eureka=true 参数是否正确,事实上默认就是true。如果值确实为true,则会向EurekaServer发起一个Rest请求,并携带自己的元数据信息,Eureka Server会把这些信息保存到一个双层Map结构中

  • 第一层Map的Key就是服务id,一般是配置中的spring.application.name属性
  • 第二层Map的key是服务的实例id。一般host+ serviceId + port,例如:locahost:service-provider:8081
  • 值则是服务的实例对象,也就是说一个服务,可以同时启动多个不同实例,形成集群。

3.2 服务续约

在注册服务完成以后,服务提供者会维持一个心跳(定时向EurekaServer发起Rest请求),告诉EurekaServer:“我还活着”。这个我们称为服务的续约(renew)

1
2
3
4
5
6
7
#有两个重要参数可以修改服务续约的行为:
#lease-renewal-interval-in-seconds:服务续约(renew)的间隔,默认为30秒
#lease-expiration-duration-in-seconds:服务失效时间,默认值90秒
eureka:
instance:
lease-expiration-duration-in-seconds: 90
lease-renewal-interval-in-seconds: 30
  • 也就是说,默认情况下每个30秒服务会向注册中心发送一次心跳,证明自己还活着。如果超过90秒没有发送心跳,EurekaServer就会认为该服务宕机,会从服务列表中移除,这两个值在生产环境不要修改,默认即可。

  • 但是在开发时,这个值有点太长了,经常我们关掉一个服务,会发现Eureka依然认为服务在活着。所以我们在开发阶段可以适当调小。

1
2
3
4
eureka:
instance:
lease-expiration-duration-in-seconds: 10 # 10秒即过期
lease-renewal-interval-in-seconds: 5 # 5秒一次心跳

4. 服务消费者consumer

4.1获取服务列表

当服务消费者启动时,会检测 eureka.client.fetch-registry=true 参数的值,如果为true,则会拉取Eureka Server服务的列表只读备份,然后缓存在本地。并且每隔30秒会重新获取并更新数据。我们可以通过下面的参数来修改:

1
2
3
4
5
6
eureka:
client:
registry-fetch-interval-seconds: 5

#生产环境中,我们不需要修改这个值。
#但是为了开发环境下,能够快速得到服务的最新状态,我们可以将其设置小一点。

5. 失效剔除和自我保护

5.1 服务下线

当服务进行正常关闭操作时,它会触发一个服务下线的REST请求给Eureka Server,告诉服务注册中心:“我要下线了”。服务中心接受到请求之后,将该服务置为下线状态。

5.2 失效剔除

有些时候,我们的服务提供方并不一定会正常下线,可能因为内存溢出、网络故障等原因导致服务无法正常工作。Eureka Server需要将这样的服务剔除出服务列表。因此它会开启一个定时任务,每隔60秒对所有失效的服务(超过90秒未响应)进行剔除。

可以通过eureka.server.eviction-interval-timer-in-ms参数对其进行修改,单位是毫秒,生产环境不要修改。

这个会对我们开发带来极大的不便,你对服务重启,隔了60秒Eureka才反应过来。开发阶段可以适当调整,比如:10秒

1
2
server:
eviction-interval-timer-in-ms: 10000

5.3 自我保护

我们关停一个服务,就会在Eureka面板看到一条警告:

1525618396076

这是触发了Eureka的自我保护机制。当一个服务未按时进行心跳续约时,Eureka会统计最近15分钟心跳失败的服务实例的比例是否超过了85%。在生产环境下,因为网络延迟等原因,心跳失败实例的比例很有可能超标,但是此时就把服务剔除列表并不妥当,因为服务可能没有宕机。Eureka就会把当前实例的注册信息保护起来,不予剔除。生产环境下这很有效,保证了大多数服务依然可用。

  • 但是这给我们的开发带来了麻烦, 因此开发阶段我们都会关闭自我保护模式:(justweb-eureka)
1
2
3
4
eureka:
server:
enable-self-preservation: false # 关闭自我保护模式(缺省为打开)
eviction-interval-timer-in-ms: 1000 # 扫描失效服务的间隔时间(缺省为60*1000ms)