Temporal 单机可靠性深度剖析:Server 宕机、网络抖动、回滚失败,它到底怎么兜底?
用 Temporal 写业务代码确实爽——“像写单机程序一样处理分布式事务”。但爽完之后,总有一个声音在脑后响起:它真的可靠吗? Server 挂了怎么办?网络断了呢?回滚本身失败了呢?这篇文章从底层机制入手,把这些问题一个个拆碎。
用 Temporal 写业务代码确实爽——“像写单机程序一样处理分布式事务”。但爽完之后,总有一个声音在脑后响起:它真的可靠吗? Server 挂了怎么办?网络断了呢?回滚本身失败了呢?这篇文章从底层机制入手,把这些问题一个个拆碎。
上一篇我们在 Kind 集群中手撸 Flannel,用 tcpdump 亲眼见证了 VXLAN 每个数据包 50 字节的封装开销。这一篇,我们把 Flannel 替换为 Cilium,利用 eBPF 技术彻底干掉这笔"网络税",并用 Hubble 实现网络流量的可视化观测。
周末,我在 Manjaro 上利用 kind 从零构建了一个“无网络”集群,手动排查了内核模块缺失、CNI 插件丢失等硬核故障,并最终通过 tcpdump 亲眼见证了 VXLAN 的封包过程。这篇文章记录了全过程。
K8s Controller 和 Temporal 都是"控制面"技术,但代表了两种截然不同的设计哲学。本文深度对比二者的核心差异,并探讨在 AI Infra 平台中如何结合运用。
在构建交易系统后台时,我使用 Temporal 解决了传统分布式事务的一致性难题。这篇文章深入解析 Temporal 的核心机制,并探讨其在 AI 任务调度场景的应用前景。
一个看似简单的并发 Map 访问,在高并发下性能骤降。pprof 显示 90% 的时间花在 sync.Mutex.Lock。这篇文章记录问题排查过程,以及不同锁策略的性能对比。