一个系统,搞定闲鱼服务端复杂问题告警

  • 时间:
  • 浏览:0
  • 来源:5分PK10APP下载_5分PK10APP官方

下面是我的订单列表的简单抽象,其执行过程是先拿到我买到的订单列表。订单列表中又用到了卖家,商品以及店铺信息服务,每个服务又关联着单次请求中提供服务对应的主机信息。



以线上常见的服务超时为例,上图中可能性127.123.12.12这台机器老出 异常导致 商品服务超时,进而导致 我的订单列表服务超时。根据日常中排查思路都能否 总结

服务端问题排查(服务稳定性/基础设施异常/业务数据不符合预期等)对于开发而言是家常便饭,问题不言而喻可怕,否则每天时会花大量时间去补救问题会很可怕;个人面故障的快速补救至关重要。没办法 目前问题排查最大的障碍是什么呢?亲戚亲戚当我门认为哪几个导致 导致 :

1) 大量的告警信息。

2) 链路的复杂化性。

3) 排查过程复杂化。

4) 依赖经验。

然而实际工作中的排查过程不言而喻无迹可寻,其排查思路和手段是都能否 沉淀出一套经验模型。

作者:闲鱼技术-吴白