7.1 运维常用工具清单

本清单结合《运维规范文档汇总清单》编号体系,按各领域主流高效工具归类,便于团队选型与查阅。


1.1 基础设施命名规范

  • 无专用工具,推荐结合 CMDB/自动化平台统一命名策略。

1.2 主机与资产管理规范

  • CMDBuild:开源资产管理
  • Snipe-IT:IT 资产管理
  • Ralph:数据中心和资产管理

1.3 账号与权限管理规范

  • FreeIPA:统一身份认证与权限管理
  • Keycloak:开源身份与访问管理
  • LDAP:目录服务
  • Jumpserver:堡垒机

1.4 文档与知识管理规范

  • Confluence:团队知识库
  • DokuWiki:轻量级 Wiki
  • MediaWiki:开源 Wiki

2.1 变更与发布管理规范

  • Jenkins:CI/CD 自动化发布
  • GitLab CI / GitHub Actions:集成式流水线
  • ArgoCD / Tekton:K8s 持续交付
  • Rundeck:自动化运维与发布编排

2.2 自动化运维与脚本规范

  • Ansible:自动化运维
  • SaltStack:分布式远程执行
  • Fabric:Python 远程执行
  • Puppet / Chef:自动化配置管理

2.3 自动化测试与演练规范

  • Chaos Mesh / ChaosBlade:混沌工程测试
  • pytest / Robot Framework:自动化测试
  • Selenium:自动化 UI 测试

3.1 监控与告警规范

  • Prometheus:指标监控
  • Zabbix:企业级监控
  • Nagios:经典监控
  • Alertmanager:告警管理
  • Grafana:可视化仪表盘

3.2 日志与可观测性规范

  • ELK Stack(Elasticsearch + Logstash + Kibana):日志采集与分析
  • Loki:日志聚合
  • Fluentd / Fluent Bit:日志收集
  • Jaeger / Zipkin:分布式追踪

3.3 运维质量与效能度量规范

  • Grafana:KPI/指标可视化
  • Prometheus:数据采集与度量
  • 自定义报表平台:如 PowerBI、Tableau

4.1 安全合规与审计规范

  • Wazuh:安全监控与合规
  • OSSEC:主机入侵检测
  • Auditd:Linux 审计
  • OpenSCAP:合规扫描

4.2 数据安全与隐私保护规范

  • HashiCorp Vault:密钥与机密管理
  • GnuPG:数据加密
  • Let’s Encrypt:SSL 证书

4.3 运维安全应急演练规范

  • Jumpserver:操作审计与应急
  • 自建应急演练脚本/平台

5.1 容器与云原生运维规范

  • Docker:容器引擎
  • Kubernetes:容器编排
  • Helm / Kustomize:K8s 应用包管理
  • Harbor:镜像仓库

5.2 CI_CD流水线与自动化规范

  • Jenkins:CI/CD
  • GitLab CI / GitHub Actions
  • Tekton / ArgoCD

5.3 基础设施即代码(IaC)规范

  • Terraform:多云 IaC
  • Ansible:配置即代码
  • Pulumi:现代 IaC
  • CloudFormation:AWS IaC

5.4 多云与混合云管理规范

  • Rancher:多云 K8s 管理
  • OpenStack:私有云平台
  • Cloudify:多云编排

5.5 AIOps与智能运维规范

  • Prometheus + AI 插件:智能告警
  • ELK + ML:日志异常检测
  • 自研/商用 AIOps 平台

6.1 备份与恢复规范

  • Velero:K8s 备份恢复
  • Restic / BorgBackup / Duplicity:高效备份

6.2 供应商与外包管理规范

  • 自建供应商管理系统
  • Snipe-IT:资产与供应商管理

6.3 绿色运维与可持续发展规范

  • Grafana:能耗可视化
  • 自研/商用能耗监控平台