Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:
【资料图】
Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上,Flink在设计理念上没有刻意强调批处理和流处理,而更多的强调数据的有界和无界,这就意味着Flink能够满足企业业务需求,无需用两种甚至多种框架分别实现批处理和流处理,这大大降低了架构设计、开发、运维的复杂度,可以节省大量的人力成本。
Flink是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。像Apache Spark也只能兼顾高吞吐和高性能特性,主要因为在SparkStreaming流式计算中无
法做到低延迟保障;而流式计算框架Apache Storm只能支持低延迟和高性能特性,但是无法满足高吞吐的要求。而满足高吞吐、低延迟、高性能这三个目标对分布式流式计算框架来说是非常重要的。
在流式计算领域中,窗口计算的地位举足轻重,但目前大多数框架窗口计算采用的都是系统时间(Process Time),也是事件传输到计算框架处理时,系统主机的当前时间。Flink能够支持基于事件时间(Event Time)语义进行窗口计算,也就是使用事件产生的时间,这种基于事件驱动的机制使得事件即使乱序到达,流系统也能够计算出精确的结果,保持了事件原本产生时的时序性,尽可能避免网络传输或硬件系统的影响。
Flink在1.4版本中实现了状态管理,所谓状态就是在流式计算过程中将算子的中间结果数据保存在内存或者文件系统中,等下一个事件进入算子后可以从之前的状态中获取中间结果中计算当前的结果, 从而无须每次都基于全部的原始数据来统计结果,这种方式极大地提升了系统的性能,并降低了数据计算过程的资源消耗。对于数据量大且运算逻辑非常复杂的流式计算场景,有状态计算发挥了非常重要的作用。
在流处理应用中,数据是连续不断的,需要通过窗口的方式对流数据进行一定范围的聚合计算,例如统计在过去的1分钟内有多少用户点击某一网页,在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行再计算。Flink将窗口划分为基于Time、Count、Session,以及Data-driven等类型的窗口操作,窗口可以用灵活的触发条件定制化来达到对复杂的流传输模式的支持,用户可以定义不同的窗口触发机制来满足不同的需求。
Flink能够分布式运行在上千个节点上,将一个大型计算任务的流程拆解成小的计算过程,然后将task分布到并行节点上进行处理。在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的Checkpoints,将执行过程中的状态信息进行持久化存储,一旦任务出现异常停止,Flink就能够从Checkpoints中进行任务的自动恢复,以确保数据在处理过程中的一致性(Exactly-Once)。
内存管理是所有计算框架需要重点考虑的部分,尤其对于计算量比较大的计算场景,数据在内存中该如何进行管理显得至关重要。针对内存管理,Flink实现了自身管理内存的机制,尽可能减少JVM GC 对系统的影响。另外,Flink通过序列化/反序列化方法将所有的数据对象转换成二进制在内存中存储,降低数据存储的大小的同时,能够更加有效地对内存空间进行利用,降低GC带来的性能下降或任务异常的风险,因此Flink较其他分布式处理的框架会显得更加稳定,不会因为JVM GC等问题而影响整个应用的运行。
对于7*24小时运行的流式应用,数据源源不断地接入,在一段时间内应用的终止有可能导致数据的丢失或者计算结果的不准确,例如进行集群版本的升级、停机运维操作等操作。值得一提的是, Flink通过Save Points技术将任务执行的快照保存在存储介质上,当任务重启的时候可以直接从事先保存的Save Points恢复原有的计算状态,使得任务继续按照停机之前的状态运行,Save Points技术可以让用户更好地管理和运维实时流式应用。
Flink为用户提供了多个层级API,用户可以根据自身对于表达力和易用性的需求来选择,不同的API 层级可以混用以实现复杂的业务逻辑。
标签:
Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:
2023年3月20日万和电气融资净偿还106 73万元,融资余额6378 17万元
1、“一”的变调:“一”的本调是阴平yī。2、单用,在语句末尾,表序数,在一连串数字中,都念本调。3、例如:一、二、三,
天阳科技:关于持股5%以上股东股份减持计划的预披露公告
CFi CN讯:经中国证券监督管理委员会“证监许可[2023]45号”文核准,公司于2023年2月15日向不特定对象发行了980万张可转换债券,每张面值100元
【中国罐头在多国热销出口额创新高】2023年,一些国家的通货膨胀居高不下,本地食品价格大涨,我国出口的罐头食品在海外多国热销,出口量持续
同花顺金融研究中心3月20日讯,有投资者向陕鼓动力提问,董秘你好,公司是否有数据安全相关业务? 公司回答表示,尊敬的投资者您好,在数据
润邦股份(002483)03月20日在投资者关系平台上答复了投资者关心的问题。
从2019到2023,时隔四年,2023“G60”上海佘山半程马拉松将于2023年4月22日在上海市松江区重磅回归。本次赛事仅设置半程马拉松项目,赛事规模500
一、民调全球73%的人感觉幸福【环球时报综合报道】近日,民调机构益普索发布2023年全球幸福感调查,结果显示,全球73%
日前,云浮市工商联(总商会)助力高质量发展大会暨七届五次执委会议召开。会上,广东不锈钢制品龙头企业之
1、说到陈雪凝,相信大家都是比较熟悉的,而且这段时间,陈雪凝的最近一首歌《绿色》可以说是很火了。2、陈雪凝是一个创作型的
1、晋江市庆士丽贸易有限公司的主要产品有非洲纯手工木雕收藏品和浓缩清洁膏膏(非洲艾可力)、浓缩沐浴露、洗发露等一系列产品
分享视频意外走红 3月17日,“97村长小芳”的账号发布了该账号第二条视频,讲述了自己24岁回村后当选村长、建设家乡的故事。张桂芳在视...
1、DR是Ex—Right和Ex—Divident合在一起的缩写,意为既除权又除息。2、如果一只股票简称的前面冠有XR、
“抢票几点开始,几点结束”,上月底,周杰伦2023嘉年华世界巡回演唱会在多个城市预售,门票秒没,网友们表示,买票简直是一场手速加网速的...
1、妈妈的朋友也是你的长辈,应该尊敬,说明你妈妈人缘挺好的。2、能认识很多朋友。本文就为大家分享到这里,希望小伙伴们会喜
1、剧本杀中有一种剧本是非常稀有的,一座城市只有一家拥有,那么独家本具体是什么意思呢?现在为大家带来剧本杀独家本名词解释
近日,捷尼赛思品牌全新车型GV60(参数|询价)正式上市,新车共推出2款车型,豪华版车型售价为28 58万元起,旗舰版车
1、绝对没有。2、rain的女友是圈外的!。本文分享完毕,希望对大家有所帮助。
1、需要安装IPV6。2、具体上北邮人看看呗~。本文到此分享完毕,希望对大家有所帮助。
淀粉肠是目前很多人都爱吃的零食之一,而且路边小摊上必有淀粉肠,淀粉肠其实价格并不贵,因为是用淀粉做的,并不是肉,投入成本会低一些,价
本报北京3月17日讯 记者董凡超 记者今天从公安部获悉,全国公安机
1、软冰淇淋是现做现卖的一种冰淇淋,硬冰淇淋是做好以后再进行冷冻以后再卖的冰淇淋,硬冰淇淋用的是硬冰淇淋机。2、在刚做好
1、可能版权原因导致下架。2、看哔哩哔哩后续操作呗。3、如果版权谈妥了就能重新上架呗。本文到此分享完毕,希望对大家有所帮
1、竖版的明信片,虚线上面写地址,空白处写内容,留下邮票位置。2、纯白的明信片,空出邮票位置(右上角),请将收件地址和内
文化地标上新!四川名人馆项目开工,计划2025年开馆运营四川名人馆项目开工该项目以“蜀山·绿谷”为名,外立面以红砂色为主调,既展现项目...
空气炸锅和烤箱哪个更适合家用,空气炸锅和烤箱适合家用是哪个呢很多人还不知道,现在让我们一起来看看吧!解答:1、空气油炸锅比烤箱更适合家
今天小编肥嘟来为大家解答以上的问题。白吟霜梅花三弄之梅花烙,白吟霜相信很多小伙伴还不知道,现在让我们一起来看看吧!1、梅花烙白吟霜是王
1、主题曲《一念执着》2、《一念执着》是2011年电视剧《步步惊心》的主题曲。电视剧原唱由休和阿兰达瓦卓玛演唱,湖南卫视
Copyright © 2015-2022 南极服装网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com