7.1 运维常用工具清单
本清单结合《运维规范文档汇总清单》编号体系,按各领域主流高效工具归类,便于团队选型与查阅。
1.1 基础设施命名规范
- 无专用工具,推荐结合 CMDB/自动化平台统一命名策略。
1.2 主机与资产管理规范
- CMDBuild:开源资产管理
- Snipe-IT:IT 资产管理
- Ralph:数据中心和资产管理
1.3 账号与权限管理规范
- FreeIPA:统一身份认证与权限管理
- Keycloak:开源身份与访问管理
- LDAP:目录服务
- Jumpserver:堡垒机
1.4 文档与知识管理规范
- Confluence:团队知识库
- DokuWiki:轻量级 Wiki
- MediaWiki:开源 Wiki
2.1 变更与发布管理规范
- Jenkins:CI/CD 自动化发布
- GitLab CI / GitHub Actions:集成式流水线
- ArgoCD / Tekton:K8s 持续交付
- Rundeck:自动化运维与发布编排
2.2 自动化运维与脚本规范
- Ansible:自动化运维
- SaltStack:分布式远程执行
- Fabric:Python 远程执行
- Puppet / Chef:自动化配置管理
2.3 自动化测试与演练规范
- Chaos Mesh / ChaosBlade:混沌工程测试
- pytest / Robot Framework:自动化测试
- Selenium:自动化 UI 测试
3.1 监控与告警规范
- Prometheus:指标监控
- Zabbix:企业级监控
- Nagios:经典监控
- Alertmanager:告警管理
- Grafana:可视化仪表盘
3.2 日志与可观测性规范
- ELK Stack(Elasticsearch + Logstash + Kibana):日志采集与分析
- Loki:日志聚合
- Fluentd / Fluent Bit:日志收集
- Jaeger / Zipkin:分布式追踪
3.3 运维质量与效能度量规范
- Grafana:KPI/指标可视化
- Prometheus:数据采集与度量
- 自定义报表平台:如 PowerBI、Tableau
4.1 安全合规与审计规范
- Wazuh:安全监控与合规
- OSSEC:主机入侵检测
- Auditd:Linux 审计
- OpenSCAP:合规扫描
4.2 数据安全与隐私保护规范
- HashiCorp Vault:密钥与机密管理
- GnuPG:数据加密
- Let’s Encrypt:SSL 证书
4.3 运维安全应急演练规范
- Jumpserver:操作审计与应急
- 自建应急演练脚本/平台
5.1 容器与云原生运维规范
- Docker:容器引擎
- Kubernetes:容器编排
- Helm / Kustomize:K8s 应用包管理
- Harbor:镜像仓库
5.2 CI_CD流水线与自动化规范
- Jenkins:CI/CD
- GitLab CI / GitHub Actions
- Tekton / ArgoCD
5.3 基础设施即代码(IaC)规范
- Terraform:多云 IaC
- Ansible:配置即代码
- Pulumi:现代 IaC
- CloudFormation:AWS IaC
5.4 多云与混合云管理规范
- Rancher:多云 K8s 管理
- OpenStack:私有云平台
- Cloudify:多云编排
5.5 AIOps与智能运维规范
- Prometheus + AI 插件:智能告警
- ELK + ML:日志异常检测
- 自研/商用 AIOps 平台
6.1 备份与恢复规范
- Velero:K8s 备份恢复
- Restic / BorgBackup / Duplicity:高效备份
6.2 供应商与外包管理规范
- 自建供应商管理系统
- Snipe-IT:资产与供应商管理
6.3 绿色运维与可持续发展规范
- Grafana:能耗可视化
- 自研/商用能耗监控平台