跳到主要内容

Smart DNS 相关问题

启用 Smart DNS 后解析失败

现象

在启用了 istio 的 Smart DNS (智能 DNS) 后,我们发现有些情况下 DNS 解析失败,比如:

  • 基于 alpine 镜像的容器内解析 dns 失败。
  • grpc 服务解析 dns 失败。

原因

Smart DNS 初期实现存在一些问题,响应的 DNS 数据包格式跟普通 DNS 有些差别,走底层库 glibc 解析没问题,但使用其它 dns 客户端可能就会失败:

  • alpine 镜像底层库使用 musl libc,解析行为跟 glibc 有些不一样,musl libc 在这种这种数据包格式异常的情况会导致解析失败,而大多应用走底层库解析,导致大部分应用解析失败。
  • 基于 c/c++ 的 grpc 框架的服务,dns 解析默认使用 c-ares 库,没有走系统调用让底层库解析,c-ares 在这种数据包异常情况,部分场景会解析失败。

修复

在 istio 1.9.2 的时候修复了这个问题,参考关键 PR #31251 以及其中一个 issue

规避

如果暂时无法升级 istio 到 1.9.2 以上,可以通过以下方式来规避:

  • 基础镜像从 alpine 镜像到其它镜像 (其它基础镜像底层库基本都是 glibc)。
  • c/c++ 的 grpc 服务,指定 GRPC_DNS_RESOLVER 环境变量为 native,表示走底层库解析,不走默认的 c-ares 库。环境变量解释参考 GRPC 官方文档