我们一个核心的多租户数据处理平台遇到了瓶颈。Apache Spark 作业的 Shuffle 阶段 I/O 开销巨大,尤其是在高峰期,多个大作业并发执行时,节点磁盘 I/O 竞争和网络拥塞导致作业执行时间变得不可预测,SLA 频繁告警。默认
2023-10-27