本文介绍了Flink的原理、实战和性能优化。作者深入浅出地解释了Flink的核心概念和运行机制,并分享了实战经验和性能优化技巧。通过本文的阅读,读者可以更深入地了解Flink的工作原理,提升应用实战能力,同时优化性能提升系统效率。
Flink原理、实战与性能优化读后感第一篇
说一下,首先这本书里面印刷错误真的很多,多到让人难以接受,我看了67页,已经碰到5个以上的印刷错误,难道出版的时候都不校正吗,其次,给的github代码库名字都改了,代码也没有按章节一节一节分好类,qq群一共就14个人,加了还没有通过。感觉这本书真的写的没有别人评价的那么高吧,最多给自己一个大致印象。
Flink原理、实战与性能优化读后感第二篇
大厂都在往Flink转,我也来学学看。
这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的资深专家,现就职于第四范式,曾就职于明略数据。
(1)作者是资深架构师和流式计算领域专家,第四范式AI项目架构师,曾就职于明略数据(2)从功能、原理、实战和调优4个维度循序渐进讲解利用Flink进行分布式流式应用开发,指导读者从零基础入门到进阶
Flink原理、实战与性能优化读后感第三篇
在目前能找到的关于 flink 的中文书中,确实是最好的 ...
可以当成一个 programming model 、api 和 example 的手册,重点还是讲 flink 的编程模型,说实话,确实漂亮
第一个亮点:分层 api 体系(SQL、Table API、DataStream/DataSet API 和 最底层的 stateful streaming processing API;
高层 API 负责提供抽象的计算算子(map、filter)等,便于表达业务逻辑;
底层的 API 负责提供丰富功能,以应对各种场景,包括:Waltermark、Time(Event time、Processing time、Ingestion time)、Window(滚动、滑动和 session)、Trigger(触发计算)、Evictors(数据剔除)等等;
当然,底层中最亮的,还是 state management,分为 key state 和 operator state;通过定时 checkpoint 进行外部持久化;
第二个亮点:流批合一 ,提供 DataStream 和 DataSet 计算模型,DataSet 中的增量迭代挺有趣(分为热点数据和冷数据,每次迭代热点数据);
第三个亮点嘛,是讲和 YARN 的适配;
不过说实话,技术细节实在太少了 ...