云运营(CloudOps) 是管理在云环境中运行的工作负载和 IT 服务的交付、调整、优化和性能的实践,包括多云、混合、数据中心和边缘。CloudOps 为基于云的操作流程编写程序和最佳实践,就像DevOps为应用程序开发和交付流程编写相同的程序一样。
云运营严重依赖分析来增强云环境元素的可见性,提供控制资源和有效运行服务所需的洞察力。对于一些组织来说,随着 IT 运营从本地转移到基于云的基础架构,CloudOps 已经取代了网络运营中心 (NOC)。正如 NOC 监控和管理数据中心一样,CloudOps 监控、检测和管理在云中运行的虚拟机、容器和工作负载。开发人员、IT 运营和安全都使用 CloudOps 原则进行协作,以实现业务和技术目标。
云运营的好处
CloudOps 为组织提供了一长串好处,包括:
加速自动化。CloudOps 工具可以简化广泛的日常任务的自动化,包括配置服务器和存储、应用程序测试、监控和报告、应用程序构建和安全事件修复。
增强的安全性。主要的超大规模云提供商利用业界最佳的物理安全性并持续监控其基础设施,以帮助防止网络犯罪或数据泄露。几乎每个组织在迁移到云时都意识到了安全性改进,请记住,云安全对组织的影响与对云提供商的影响一样多。
改进的 RPO/RTO。备份和数据恢复是公共云的最初用例,并且继续成为云迁移的强大驱动力。备份和复制策略可以将恢复点目标 (RPO) 和恢复时间目标 (RTO) 降低到接近于零,有助于确保为日益全球化的用户和客户群提供全天候的可用性。
总体 IT 节省。由于云服务是现收现付的,因此无需购买服务合同并不断升级数据中心硬件以满足不断变化的用户需求,从而消除了大笔资本支出。此外,消除数据中心基础设施可以节省设施成本,例如电力、冷却甚至房地产。
按需可扩展性。季节性或增长需求可以通过即时容量增加来满足,通常是通过自助服务门户。配置新的虚拟机、物理服务器、存储,甚至网络带宽都可以通过按一下按钮来完成,使组织能够更加灵活并在出现需求时直接满足需求。
随时随地访问。组织可以随时随地使用几乎任何设备访问云应用程序和资源,只要有互联网连接即可。
无中断升级。基础设施和软件都可以无缝升级或更新,而不会中断服务,从而能够在正常业务运营继续进行的同时应用修复或添加新功能。
DevOps 和 CloudOps 有什么区别?
DevOps 和 CloudOps 都基于组织中不同组之间的协作关系。DevOps 实践持续改进流程,增强协作,从而提高整个软件交付生命周期 (SDLC) 的可见性,并有助于减少可能中断 IT 运营或影响开发计划的事件。
DevOps 改进可以在整个组织中冒泡,有助于更快地实现更可靠的软件应用程序,从而提高整个组织的性能。最终,DevOps 有助于改善员工和客户的用户体验。CloudOps 包含云平台工程原则,结合云架构、IT 运营、应用程序开发、安全性和法规遵从性等要素,使组织能够管理基于云的应用程序和服务。
这使组织能够:
- 确保云平台(包括混合和边缘组件)作为单一平台运行
- 无论访问设备如何,都可以为分散的员工优化应用程序性能
- 确保可靠性并满足 SLA
- 为灾难恢复和业务连续性维护备份
- 自动化重复服务和配置管理
- 确保数据和应用程序的端到端安全
云运营的最佳实践是什么?
希望建立 CloudOps 功能的组织应考虑以下做法:
制定迁移策略。每个工作负载都有自己的要求,采用容器化应用程序和微服务可能会对特定解决方案的架构方式施加额外的限制。例如,基于微服务的应用程序可能需要访问多个云上的服务,从而导致无论是否需要多云方法。其他工作负载可能会访问必须保留在私有云中以执行监管或治理任务的敏感数据,而其他应用程序可能需要使用特定的云提供商来维护特定地理位置的数据或利用特定提供商的功能.
包括所有利益相关者。云迁移是变化,许多组织和部门都厌恶变化。从用户到高级管理人员的每个利益相关者都应该参与迁移计划,以帮助确保关键业务流程在迁移过程中不会落空。灌输采用 CloudOps 方法的重要性,并强调它如何与现有的 DevOps 策略保持一致。
强调安全。虽然云提供了许多好处,但它也为网络犯罪分子和其他不良行为者提供了一个新的攻击面或多个攻击面,以试图渗透组织的防御。首先采用零信任的安全方法、端到端加密以及自动化安全监控和修复,以帮助确保小问题永远不会有机会成为代价高昂的数据泄露。
自动加速。采用敏捷的云工作流程和无中断的自动化工具,包括尽可能多的自助服务功能,包括配置和密码重置。请记住,云迁移不是一次性的交易。随着数周和数月的过去,CloudOps 将发现流程、基础架构和连接性方面的改进领域,这些领域可能对运营和每月云支出产生重大影响。
将培训纳入计划。云管理可能需要与本地数据中心截然不同的技能。物理设备维护的需求消失了,取而代之的是新的故障排除、配置和部署技能。在劳动力市场紧张的情况下,在迁移发生之前为现有团队成员提供培训可能是有益的,以帮助确保在需要时可以使用所有适当的技能。
从小处着手。找到一个要迁移的应用程序,它可以为运营和用户团队提供概念验证,并且可以向所有利益相关者展示大规模云迁移的可行性。
开发将配置数据(例如服务器定义)存储在基础架构中作为代码模型的做法,以帮助快速扩展和部署新实例,并根据需要按需扩展。确保迁移的第一个和每个应用程序都明确定义成功操作所需的工具、服务和数据,因为这将扩展为所有操作的依赖关系的操作图。
为什么云操作很重要?
组织正在稳步增加对公共云的使用,以获取不断增长的应用程序和服务列表。随着工作负载从数据中心迁移到云提供商,对 CloudOps 的需求将同步增长。DevOps 和 CloudOps 团队可以共存并共享最佳实践,因为它们都促进:
- 提高云资源的效率和利用率
- 云工作负载的敏捷工作环境的增长
- 自动化安全和可用性流程以支持 24/7 运营
- 改善客户的用户体验
- 降低交付云服务的总体成本
- 提高使用迁移应用程序的团队的工作效率