主题
褚成志的大数据笔记 · 覆盖 Hadoop / Spark / Flink / Kafka / ClickHouse 全栈体系
大数据技术栈演进历史、Lambda/Kappa 架构、技术选型指南,建立完整的知识体系框架
了解全景
HDFS 分布式文件系统、HBase 列式存储、Hive 数据仓库、Delta Lake 与 Iceberg 数据湖
深入存储
MapReduce 原理、Spark Core/SQL/Streaming/MLlib 全栈、Flink 流批一体与 Flink SQL
掌握计算
Kafka 高吞吐消息队列、Kafka Streams 流处理、Zookeeper 分布式协调服务底层原理
消息系统
ClickHouse 列式 OLAP、Apache Doris 实时分析、Presto/Trino 联邦查询引擎
分析引擎
YARN 资源调度与容量规划、Airflow 工作流编排、DAG 任务依赖管理
平台调度
集群部署、Prometheus + Grafana 监控体系、Spark/Flink 性能调优最佳实践
工程实践
从零基础到生产级大数据项目,系统规划学习路径,快速达到能做项目的水平
查看路线图