从崩溃到修复:生产环境 Zookeeper 集群脑裂排查实录
某天凌晨,Kafka 消息堆积告警。排查发现 Zookeeper 集群出现脑裂,两个节点都认为自己是 Leader。这篇文章记录了完整的排查和修复过程。
某天凌晨,Kafka 消息堆积告警。排查发现 Zookeeper 集群出现脑裂,两个节点都认为自己是 Leader。这篇文章记录了完整的排查和修复过程。
微服务不是把单体拆开就完了。这篇文章记录了在 Go 微服务项目中踩过的 5 个坑,以及如何避免这些问题。
学习文件系统最好的方式就是自己写一个。本文使用 FUSE + Go,实现一个支持基本读写操作的内存文件系统,过程中深入理解 inode、block 等核心概念。
教科书上的 LRU 用双向链表 + HashMap 实现。但 Redis 为什么用"近似 LRU"?这篇文章深入 Redis 源码,分析各种淘汰策略的工程权衡。
要成为一名合格的系统工程师,必须深入理解 Linux 的启动过程。只有知道"正常是什么样",才能在出问题时快速定位。这篇文章完整剖析从按下电源到出现登录界面的每一个阶段。
从最初的手动 hugo && scp 到现在的 Git Push 触发自动部署,这篇文章记录了 Hugo 博客 CI/CD 的演进过程,以及生产级 GitHub Actions 配置的最佳实践。