想请问各位大佬,在K8S工作中都遇到过哪些实景性问题?

真成运维 2025-7-26 14 7/26

你好,我是老成。今天,分享一个星球球友提问。

想请问各位大佬,在K8S工作中都遇到过哪些实景性问题?

同时欢迎大家,加入我的免费知识星球,进行学习交流,提问。我也会在星球中持续分享干货内容,反正免费不妨来围观瞅瞅,扫一扫下方二尾码,vx小程序即可进入。

想请问各位大佬,在K8S工作中都遇到过哪些实景性问题?

回答:由于提的问题范围说的比较大哈,那这里也说的范围比较大和笼统,这里按照岗位来划分。

K8s 运维一般分为两个大类吧,K8s平台运维、K8s项目运维(也叫业务运维),分别也对应两个岗位。工作中遇到的问题和工作内容息息相关,所以这里会简单介绍这两个岗位的工作内容。

一、K8s 平台运维

一般工作内容包含:K8s 集群的建设(包含架构,如多地多中心)、集群维护、平台工具的建设,包含流水线、K8s管理平台等。可能遇到的问题,如下:

1)K8s集群的建设

  • 如何创建K8s集群
  • 版本的选择,集群升级问题
  • 存储类创建(一般会对接Ceph商业存储)
  • K8s 的网络建设
  • Ingress的规划,每个集群 Ingress 应该做一个 LB 负载均衡

2)集群维护

  • Pod 资源调度是否均衡准确问题
  • K8s 节点的剔除和添加,这里可能是因为节点故障或资源不足,如果节点使用的是物理机还有可能节点需要迁移机柜,所以需要剔除
  • 节点故障进行日常的排查处理
  • 日常巡检

3)流水线的建设

  • 流水线脚本的编写
  • 流水线权限管理,因为开发、测试、运维权限各不相同。
  • 多集群发布流水线,可以选择支持多集群同时发布(多地多中心或备节点需要)

4)K8s管理平台

  • 管理平台选型,是否支持纳管多个集群
  • 如果管理平台不可用,需进行排查处理

二、K8s 项目运维

一般工作内容包含:开发后的项目部署,部署流程也就是创建项目所需的微服务流水线 -》 运行各个流水线 -》添加或修改配置 -》使 Deployment 可正常运行 -》提供域名访问服务(Ingress)-》日常维护变更。可能遇到的问题,如下:

1)创建项目所需的微服务流水线

  • 如何创建

2)运行各个流水线

  • 项目编译问题
  • Dockerfile编写,项目打包

3)添加或修改配置

  • 配置包含,Nacos配置、ConfigMap配置

4)使 Deployment 可正常运行

  • 使服务正常运行,处理相关报错。如,连接不上 MySQL、Redis,代码报错需要开发自己处理,运维人员协助。

5)提供域名访问服务(Ingress)

  • 创建 Ingress 提供服务
  • 配置 Ingress,处理跨域、重写规则

6)日常维护变更

项目中日常出现问题,需要及时排查。如,服务不可访问、服务启动失败、镜像拉取不到、流水线构建失败、项目迁移变更、项目对象存储修改、项目对接ELK日志等。


以上,就是大概的情况了,希望对你有一点帮助。

END

这篇文章有用吗?

点击星号为它评分!

平均评分 0 / 5. 投票数: 0

到目前为止还没有投票!成为第一位评论此文章。

很抱歉,这篇文章对您没有用!

让我们改善这篇文章!

告诉我们我们如何改善这篇文章?

- THE END -

真成运维

7月26日17:26

最后修改:2025年7月26日
0

非特殊说明,本博所有文章均为博主原创。

共有 0 条评论