深度了解混合云监控

如今,监控非常重要。这是为什么?因为应用程序变得越来越复杂。但不仅是应用程序——基础设施也变得复杂。一些公司正在迁移到云端;其他人正在构建混合基础设施。如果某些基础设施在云中,而其他基础设施在本地,那么如何获得整个基础设施的概览就会更加模糊。在这篇文章中,您将学习如何很好地监控混合云基础架构。

深度了解混合云监控-南华中天

什么是混合云监控?

首先,让我们澄清一下混合云监控与传统监控的不同之处。最大的不同是我们有两个非常不同的基础设施需要监控。用于本地监控的传统工具在云环境中表现不佳,反之亦然。因此,要么您需要做出妥协并使用两种不同的监控解决方案,要么您需要找到一种同时适用于本地和云基础设施的解决方案。因此,让我们讨论一下您通常如何监控这两者,然后我们将了解如何创建良好的混合云监控。

监控本地基础设施

当您必须处理裸机服务器和您自己的网络设备时,您将专注于与在云中不同的事情。您必须查看所有低级指标,例如 CPU 温度、硬盘运行状况、负载平衡器饱和度等。即使您在裸机之上有一些抽象层(例如,虚拟化或容器编排) ),您仍然需要监控底层机器。您甚至可能需要监控冷却风扇速度和UPS状态等内容。

您的本地监控目标也将与您在云中进行的监控略有不同。扩展和容量规划在本地是不同的。因此,在监控本地机器的使用情况时,您会更经常地查看长期使用模式。由于扩展数据中心通常需要数周时间,因此您必须更早地预测增加容量的需求。

您通常用于本地监控的实际工具也不同于您用于监控云的工具。传统上,这些工具要求您在基础架构中的某处安装和管理监控服务器。这意味着您还需要关心诸如容量监控和工具本身升级之类的事情。

云监控

即使监控的总体思路保持不变,但如果您的应用程序在云中运行,您的监控重点将有所不同。对于初学者来说,您不会关心(甚至无法访问)温度和风扇速度之类的东西。通常,与本地不同,您只会监控机器上的一两层。例如,如果您的应用程序在虚拟机中运行,那么在云中,您只需担心该虚拟机的 CPU 和内存使用情况。但是,在本地,您不仅要监控该虚拟机,还要监控底层的裸机服务器。

深度了解混合云监控-南华中天

另一件事是云为您提供了很大的灵活性和快速扩展。这意味着您的监控需要对资源消耗的峰值做出快速反应,以便有效地使用自动缩放功能。说到自动缩放,在云中您肯定要监控的是成本。与您的成本是静态的本地部署不同,在云中,您(通常)按使用付费。因此,您不仅要监控整体增长的成本,还需要找到过度使用(甚至未使用)的资源,以便缩减(或关闭)资源以节省成本。

谈到工具,那些旨在监控云的工具通常以软件即服务 (SaaS) 的形式出现。您无需安装和管理实际的监控工具。您只需要将所有指标发送给它。

如何监控混合云基础设施

正如我们之前提到的,您有两个选择。一种解决方案是使用两种不同的工具(一种更适合本地,一种更适合云)。令人惊讶的是,这是一种非常常见的方法,但出于错误的原因。公司不会从头开始构建混合基础架构。当他们想要将本地部署缓慢迁移到云时,他们最终会使用混合基础架构。这意味着,通常,他们已经设计了一个本地监控系统,并且已经运行了很多年。这就是为什么当他们在云中迈出第一步时,他们通常会为云创建一个新的监控系统。这是因为通常会组建一个全新的团队来管理云环境。但是分别监控这两种环境会带来很多缺点。

在混合云中,系统的一部分在本地运行,一部分在云中。但归根结底,它是同一个系统。他们一起工作。因此,用一种工具监控其中的一部分,用另一种工具监控部分会使您处于“错过大局”的危险境地。一些公司意识到了这一点,那么他们会怎么做呢?他们将本地监控扩展到监控云的某些部分,并尝试使用云监控工具来监控部分本地。这部分解决了对整个系统进行概览的问题,但产生了一个新问题。现在您监视相同的系统两次。那效率不高。

统一监控

那么解决方案是什么?统一监控!不要将混合云视为两个独立的环境。将它们视为同一系统的两个部分,因为事实上它们是。使用可以很好地监控本地和云系统的工具。

深度了解混合云监控-南华中天

即使您有单独的团队管理双方,您仍然可以从统一监控中受益。您的本地团队将从监控工具本身的管理任务中解脱出来。同时,您的云团队将对基础架构的本地部分有很好的了解。在混合环境中,客户的请求通常需要访问本地和云中的一些系统才能完成请求并发送响应。

在这两个系统中没有可见性的情况下,云团队只能猜测“如果这些错误不是来自我们,那么它一定是本地端出了问题。” 同样的猜测也会发生在本地端。这会导致调试过程很长,这也意味着如果发生真正的灾难,您的恢复时间会更长。统一监控,无需猜测。

将来自所有来源的所有数据组合到一个监控系统中带来了另一个优势:能够关联来自不同来源的数据。云中 CPU 使用率的增加并不一定意味着云中发生了某些事情。这可能意味着本地系统对云请求的响应速度较慢;因此,云系统需要付出额外的努力来满足需求(更多的 CPU 用于缓存或更多的 CPU I/O 等待时间)。统一监控可帮助您轻松发现此类情况。

概括

监控混合云的总体思路很简单。您需要了解本地和云环境发生了什么。在实践中,这通常是通过拥有两个独立的监控解决方案来实现的。虽然这并非完全错误,但在这篇文章中,我们试图向您展示不同方法的好处。

使用一种监控工具监控您的混合云会更好。它不仅有助于减少本地和云团队的调试时间,还允许您关联来自系统不同部分的数据。最重要的是,如果您将应用程序监控添加到同一解决方案中,您会发现自己对系统的任何部分都有很好的可见性。