drvively
本站致力于IT相关技术的分享
基于 Event Sourcing 构建 containerd 运行时事件的可视化追踪架构 基于 Event Sourcing 构建 containerd 运行时事件的可视化追踪架构
定义一个棘手的问题:超越快照式监控传统的容器运行时监控,无论是 ctr task ls 还是 Prometheus 指标,本质上都是对系统在某个时间点的“状态快照”。我们看到的是 CPU 使用率、内存占用这些聚合后的结果,但却丢失了导致这些
构建异构请求合并网关 Tornado Micronaut 与 Ray 的协同实践 构建异构请求合并网关 Tornado Micronaut 与 Ray 的协同实践
问题的起点非常明确:一个外部系统以极高频率向我们推送小型计算任务,峰值可达每秒数万次。每个任务本身处理起来并不复杂,但其背后依赖一个CPU密集型的模拟模型。直接处理这些原子化请求会立刻摧毁后端系统,因为模型的初始化和单次运行的固定开销远大于
构建基于 Chef 部署、Azure Functions 处理与 Seaborn 动态可视化的分布式遥测数据管道 构建基于 Chef 部署、Azure Functions 处理与 Seaborn 动态可视化的分布式遥测数据管道
我们面临的第一个问题,并非技术选型,而是现实约束。团队维护着一个混合架构系统:一部分是运行在本地数据中心VM上的传统Java应用,另一部分是部署在云上的较新微服务。监控系统是分裂的,传统应用依赖于老旧的、基于文件的日志和有限的JMX指标,而
基于 Axum 与 NATS 构建运行于 GKE 的 Presto 数据管道动态密钥管理服务 基于 Axum 与 NATS 构建运行于 GKE 的 Presto 数据管道动态密钥管理服务
我们面临的核心挑战并非数据摄取本身,而是如何在数据流经我们系统的整个生命周期中,为其处理节点动态、安全地授予访问下游资源的权限。在我们的场景中,大量短暂的批处理或流处理作业需要访问 Google Cloud Storage (GCS) 上的
在GitHub上为Ktor微服务构建基于Scrum事件的DORA指标度量管道 在GitHub上为Ktor微服务构建基于Scrum事件的DORA指标度量管道
我们团队的看板上贴满了完成的卡片,Sprint评审会议上演示的功能也越来越复杂,每个人都“感觉”研发效能变高了。但这种感觉是脆弱的,无法量化,更无法指导我们进行精确的改进。当被问及“我们的部署频率是多少?”或者“一个需求从开始编码到上线平均
2023-10-27
利用 TDD 与 eBPF 为服务网格中的 Spring Boot 应用注入无侵入的应用层可观测性 利用 TDD 与 eBPF 为服务网格中的 Spring Boot 应用注入无侵入的应用层可观测性
我们团队的服务网格(Istio)已经运行得很稳定,它提供了出色的 L4/L7 层流量洞察、mTLS 加密和精细的流量控制。但一个持续存在的痛点是,当监控系统报警某个服务的 P99 延迟飙升时,我们能从网格层面得到的信息非常有限。例如,我们知
2023-10-27
3 / 5