实时化与 Serverless 是开源大数据 3.0 时代的必然选择

news/2024/5/20 9:50:53 标签: serverless, 开源, 大数据

近日在 2023 云栖大会上,阿里云开源大数据产品进行了年度发布:E-MapReduce、Elasticsearch 等开源大数据产品全面 Serverless 化;创新性推出 Flink 与 Paimon 搭档的新一代流式湖仓;拥抱 AI,推出 Milvus 全托管服务,升级智能运维工具 EMR Doctor 以及 Flink Advisor。

核心组件全面 Serverless 化

在大会上,阿里云开源大数据平台负责人王峰,回顾了阿里云开源大数据技术演进路线:自 2009 年起,经历了以大数据上云为代表的 1.0 时代,以数据湖和实时化为代表的 2.0 时代,如今阿里云开源大数据平台迈向了 3.0 时代,随着云原生架构的深入落地,已将开源大数据平台的核心计算组件 Flink、EMR Spark、StarRocks 和存储组件 OSS-HDFS 等全部实现 Serverless 化。

产品性价比飙升 2 倍

阿里云开源大数据产品总监陈守元表示, 阿里云开源大数据产品通过底层技术优化,包括集成倚天 710 芯片和自研引擎功能增强等,用户使用成本大幅降低 50%,引擎性能相比于开源版本提升 1~3 倍,综合性价比提升超 2 倍。

· 阿里云 E-MapReduce 全新上线 Serverless StarRocks 和 Serverless Spark,为用户提供全托管、免运维等服务。湖存储 OSS-HDFS 和一站式湖管理平台 DLF 全新升级,为企业构建现代开源开放的数据湖仓提供一站式服务。

· 阿里云实时计算 Flink 版推出企业级数据集成方案,配合 Flink 优秀的管道能力和丰富的上下游生态,可高效实现海量数据的实时集成。

· 阿里云检索分析服务 Elasticsearch 版推出兼容开源、按需使用的 Serverless 版本,平台会根据业务流量波动,自动调度决定资源的增加或缩减,秒级弹性扩缩,实现负载与资源动态匹配的按量付费。

黄金搭档 Flink + Paimon:新一代的流式湖仓

数据分析正从传统 Hive 模式向湖仓架构升级 ,阿里云从大量实践中推断,实时化是湖仓分析下一步的演进方向。在这种技术趋势下,阿里云基于黄金搭档 Flink+Paimon,打造出新一代的流式湖仓新方案,为用户提供一站式数据入湖、实时加工和探查分析能力,拓展数据湖场景的实时计算能力,Flink 批计算已在云上实现生产可用,支持湖上批量数据处理和作业调度。在 5 亿条数据入湖场景中,与开源 Hudi 方案相比,阿里云流式湖仓方案 Upsert 性能提升超过 4 倍,Scan 性能提升超过 10 倍。

更智能的开源大数据

当前 AI 全面爆发,阿里云开源大数据平台也将 AI 技术引入大数据平台体系中,升级了智能化运维工具 EMR Doctor、Flink Advisor,并已广泛应用于客户和阿里云内部平台运维,平均集群问题识别时间减少 30% ,集群资源有效利用率提升 75%,帮助阿里云开源大数据平台实现智能化运维和数据管理。同时,阿里云推出了 Milvus 全托管服务,为多模态数据提供向量检索能力,加速客户 AI 应用。


http://www.niftyadmin.cn/n/5277987.html

相关文章

2019QWB growpjs

第一次知道原来各种map也是申请的一段连续的内存空间来存储,所以必要的时候可以通过固定偏移来从一种map获取到另一种map。但是要注意这里的获取的时候要保证对象不被释放。 这也是做的第一道涉及优化器的题目,收货很多 class Memory{constructor(){th…

mysql:查询服务器当前打开的连接数量

使用命令show global status like Threads_connected;可以查询mysql服务器当前打开的连接数量。 例如,查询如下: 启动应用,连接数据库,占用了1个连接,再查询如下: 由输出可以看出,打开的连接…

冒泡排序和快速排序(分治递归算法)

冒泡排序&#xff1a; 冒泡排序时间复杂度为O&#xff08;N^2&#xff09; 直接插入排序比冒泡排序适应性更好&#xff0c;数据接近有序时比直接选择排序更好。 冒泡排序代码&#xff1a; void PrintArray(int* a, int n) {int i;for (i 0; i < n; i){printf("%d …

生信分析代谢通路可视化分析R工具包ggkegg的使用案例

可视化 DESeq2 中的数值属性 通过提供通常用于转录组分析的 DESeq2 软件包的结果&#xff0c;可以在图形的节点中反映数值结果。该函数可用于此目的。通过将要在图形中反映的数值&#xff08;例如&#xff0c;&#xff09;指定为参数&#xff0c;可以将该值分配给节点。如果命中…

如何入门 GPT 并快速跟上当前的大语言模型 LLM 进展?

入门GPT 首先说第一个问题&#xff1a;如何入门GPT模型&#xff1f; 最直接的方式当然是去阅读官方的论文。GPT模型从2018年的GPT-1到现在的GPT-4已经迭代了好几个版本&#xff0c;通过官方团队发表的论文是最能准确理清其发展脉络的途径&#xff0c;其中包括GPT模型本身和一…

一篇文章带你了解SpringBoot目录结构

前言 SpringBoot是整合Spring技术栈的一站式框架&#xff0c;是简化Spring技术栈的快速开发脚手架&#xff0c;是一个能够快速构建生产级别的Spring应用的工具。SpringBoot是目前流行的微服务框架&#xff0c;倡导“约定优于配置”&#xff0c;简化Spring项目搭建及开发过程。…

基于单片机的医院盒装药品自动分拣系统(论文+源码)

1. 系统设计 本系统供电部分采用5V供电&#xff0c;通过电机驱动模块驱动步进电机完成传送带的制作&#xff0c;在工作时由工作人员将盒装药品放置在传送带上&#xff0c;由传送带将盒装药品送至识别模块下端&#xff0c;利用射频识别模块识别贴在药盒上的射频标签&#xff0c…

electron 快速上手学习

一、安装快速应用程序 1、js版 git clone https://github.com/electron/electron-quick-start.git2、ts版 git clone https://github.com/electron/electron-quick-start-typescript.git二、打包工具 为了方便开发者将 Electron 应用程序打包成可执行文件&#xff0c;涌现了…