相关文章
自建大数据平台迁移腾讯云EMR最佳实践
2024-11-10 16:53

1890c133be7b33590a3eb83c85f2cba4.gif

自建大数据平台迁移腾讯云EMR最佳实践

自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。

弹性 MapReduce (EMR) 是基云原生技术和泛 Hadoop 生态开源技术的安全、低成本、高可靠的开源大数据平台,组件完全源于开源社区,您可以将现有 IDC 或云上自建的大数据集群无缝平滑迁移至腾讯云EMR上。

腾讯云 EMR 产品集成了社区中常见的热门组件,包括但不限于 Hadoop、Hive、Hbase、Spark、Presto、Impala、Flink、Sqoop、Hue、Iceberg、Starrocks 等,可以满足您对大数据在线业务、离线/在线数据仓库、云原生数据湖构建、实时流式计算等全方位场景的需求。

腾讯云弹性 EMR 核心产品能力如下图所示

2e768ac743681292bd117d85d06dc1a8.png

● EMR集成了30+开源大数据组件,提供Hadoop2/3的多版本组件集供用户选择,您可以根据场景按需选择使用的组件,一键分钟级拉起云上大数据平台。

● 云原生大数据平台支持存储计算分离架构,解决传统自建平台扩容滞后、资源利用率低的挑战。存算分离架构下可实现基于COS数据分层存储,计算资源弹性按需使用,提升资源利用率,降低闲置成本。

● 在您使用过程中,可以通过EMR控制台界面可视化管理集群,包括服务启停、配置管理、脚本下发等;并提供涵盖集群、节点、服务累计1000+丰富监控指标,支持多渠道配置告警;EMR也提供了Yarn作业查询、Impala查询分析、HDFS文件存储分析等高阶洞察功能,帮助您显著提升大数据集群及业务运维效率。

相比使用开源Hadoop发行版本自建大数据平台,腾讯云EMR有以下主要优势

1)  集群轻松构建、运维管理功能丰富易用,便于使用及维护

i. 基于开源Hadoop发行商软件构建大数据平台周期长,技术复杂度高,配套开发、运维、监控等工具不完善,且无法得到有效技术支持,需投入较大人力成本进行支撑及维护。

ii.腾讯云EMR可一键快速构建集群,发行版经过充分兼容性测试验证;控制台提供丰富运维、监控工具开箱即用,大幅降低使用及运维成本;除此之外腾讯提供的专业技术支持,也可以帮助客户快速定位并解决问题。

2)  计算资源按需弹性使用,数据可分层存储,资源利用率高

i. 自建大数据平台在服务器资源上一般需提前预估,并且针对业务峰值做一定的的预留,导致资源利用率低,面临计算需求的潮汐变化应对也非常不灵活。

ii. 腾讯云EMR支持灵活的弹性伸缩,资源按需使用,分钟级即可完成扩缩,并且可以根据业务变化的负载或者时间周期进行计算资源自动伸缩。初次之外,您的大数据服务也可以部署在容器服务上;存储方面也支持存算分离架构,可以对数据分层存储,为客户大幅降低存算资源成本。

3) 开源组件持续加固优化,稳定性及性能更有

i. 自建大数据平台一般采用开源社区版本组件,兼容性问题、组件缺陷需自行处理。性能也需自行优化,如需使用社区新版本组件或前沿技术栈搭建及测试成本高。

ii. 腾讯云EMR结合内部大规模实践经验,核心组件如 Hadoop、Hbase 等引入了天穹Oteam 版本,兼容开源并提供有效的稳定性加固。除此之外,新兴技术栈提供丰富优势特性,如 Iceberg 支持 Z-Order 优化可提升场景化性能10倍以上。在云产品敏捷迭代下,用户也可以便捷的基于社区最新稳定版组件构建集群,轻松使用 StarRocks、Iceberg 等新兴实时湖仓技术。

4)全栈安全防护策略,云上环境及数据更安全

i. 自建大数据平台从底层到服务层安全能力需自行构建,复杂度高,覆盖不完整,配套审计能力不完善,存在较多隐患及风险。

ii. 腾讯云 EMR 提供从硬件、网络、操作系统、大数据服务全栈易用的安全防护能力。提供 CVM 主机安全防护,异常告警;支持云硬盘加密,对象存储 COS 加密;网络层面支持 VPC 网络隔离管理,网络安全组设置;集群支持基于 Kerberos+LDAP 安全架构,身份认证确保集群访问安全,并提供基于 Ranger 的多种策略的数据权限管理。

5)无缝对接云生态服务,快速构建完整配套能力

i. 自建大数据平台如数据开发工具等配套能力需自行构建,成本高、周期长。

ii. 腾讯云 EMR 可轻松与 Wedata 数据开发平台、BI 商业智能分析产品无缝对接,帮助客户低门槛、快速构建数据集成、数据开发、数据可视化等服务。除此之外,EMR还支持云监控、云审计等周边服务,助力客户快速构建云上企业智能生态。

589e375b98058f0ee6fd2396f30d5270.png

三、  自建迁移上云最佳实践案例

案例一:某教育头部客户

【客户背景】

该客户是中国国内在线教育引领者,一直致力于用科技手段助力教育普惠,运用人工智能、大数据等前沿技术,为学生、老师、家长提供更高效的学习、教育解决方案,智能硬件产品等。

【核心痛点】

客户在使用腾讯云EMR服务前,主要采取CDH自建方式维护自身开源大数据集群。但随着业务爆发式增长,数据量暴涨,为了应对不同业务场景时效性需求,该客户曾尝试采用众多技术方案并且不断扩容离线集群的规模,还是无法完全满足业务需求,基于CDH自建hive体系的核心报表无法按时产出,严重影响数据分析工作及企业经营决策。

【解决方案】

针对客户海量数据离线数仓时效性以及上云后安全性等核心诉求,腾讯云弹性 MapReduce 提出两种解决方案

湖仓一体方案推动数据湖iceberg技术落地,于腾讯云EMR的Iceberg独有能力,帮助客户将基于hive的PB级报表体系迁移至iceberg数据湖,通过Z-Order优化后报表计算性能显著提升,改善核心报表效率,同时综合降低成本

权限统一方案主导存算分离权限统一方案,基于产品统一权限管控能力,增加扩展能力,该方案中将对象存储(cos)作为权限管控的一种资源,统一权限管理,解决权限管控不统一问题

【迁移效果】

场景化查询效率提升10倍通过腾讯云弹性 MapReduce 的Iceberg特性优化、缓存加速、存算分离智能分层等应用,提高场景化查询了近10倍性能。另外通过腾讯云EMR提供的Iceberg外部Matastore功能,降低了客户元数据改造成本,几乎零改造实现Iceberg元数据接入。

固定算力降低5000核通过EMR计算节点弹性扩缩、容器资源在离线调度等云原生能力,避免闲置资源浪费、降低综合成本。

案例二:某行业工具头部客户

【客户背景】

中国领军的企业云端商业及营销解决方案提供商,同时也是中国领军的精准营销服务提供商。为更好服务客户自身BI、搜索、营销、推荐等业务场景,需要一套稳定、高性能的大数据解决方案。

【核心痛点】

由于客户业务发展迅猛、数据量剧增,原来基于黑石物理机+CDH自建的大数据平台逐步出现了黑石节点扩容周期长、CDH组件版本老、不丰富、无法覆盖数据湖等新增业务场景的弊端。同时由于CDH集群组件较多、平均bug修复周期较长,客户不得不投入较多人力进行运维。综合而言为支持业务的快速发展,客户大数据团队不得不在自建集群的扩容、新业务场景支持、平台稳定性与运维等方面投入大量成本与人力。

【解决方案】

腾讯云EMR提供了一键构建集群能力,满足业务高峰时段分钟级别弹性扩缩容,对集群计算和存储组件的深度集成,满足客户多租户认真和表级别、字段级别颗粒度授权能力。

自动扩缩容能力能够基于时间和负载两种策略弹性伸缩计算节点,满足客户在离线和即席分析场景在不同时间段的资源需求。登录鉴权、索引在文档字段级别的权限管理能力,为集群安全访问提供了稳固的保障。集成对象存储COS功能让备份变得简单。多可用区能力为集群提供了在城市电力或网络异常情况下的容灾保障。

【迁移效果】

通过引入腾讯云EMR,客户集群的交付效率提升10倍。

集群分钟级弹性能力帮助客户轻松应对活动期间流量剧增的压力。

腾讯云EMR安全体系让业务的安全性、高可用性获得了更有利的保障。

四、  迁移方案与购买优惠

在决策上云之后,会将数据和分析任务迁移到腾讯云EMR,我们为您提供IDC自建迁移EMR方案实践与定制迁移 EMR 方案。

● 迁移方案实践

领取链接

https://drive.weixin.qq.com/s?k=AJEAIQdfAAod5vyDEGAFcADQaEACc#/preview?fileId=i.1970325010981265.1688850523229527_f.6789599412zz1

● 定制迁移方案

领取链接

https://cloud.tencent.com/apply/p/5tjcbikd2f7

目前购买 EMR 可享受 3年55折优惠。

选购链接https://buy.cloud.tencent.com/emr

    以上就是本篇文章【自建大数据平台迁移腾讯云EMR最佳实践】的全部内容了,欢迎阅览 ! 文章地址:http://sjzytwl.xhstdz.com/news/872.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://sjzytwl.xhstdz.com/mobile/ , 查看更多   
最新文章
5寸屏手机有哪些(5寸屏手机哪款性价比高)
  关于《5寸屏手机有哪些》的文章  随着科技的不断发展,智能手机已经成为了我们日常生活中不可或缺的一部分。而在众多手机
真心分享华为HUAWEI nova 7 Pro 5G和荣耀X20 SE哪款好一些?有何区别?优缺点曝光买什么手机比较好用「真心分享华为HUAWEI nova 7 Pro 5G和荣耀X20 SE哪款好一
华为HUAWEI nova 7 Pro 5G和荣耀X20 SE哪个更值得入手?区别有没有?两个华为HUAWEI nova 7 Pro 5G和荣耀X20 SE区别不大的哈,通
如何让手机连接电视手机电视「如何让手机连接电视」
在数字化日益普及的今天,将手机内容投射到电视屏幕上已成为许多用户的日常需求。无论是观看视频、分享照片,还是进行游戏互动,
0P手机多少钱(0p手机最新款多少钱)
  关于《OPPO手机多少钱》的文章  随着科技的飞速发展,智能手机已经成为我们日常生活中不可或缺的一部分。OPPO,作为一个全
在家里如何进行有效健身运动?
在家里如何进行有效健身运动? 随着生活节奏的加快和外出运动场所的限制,许多人开始在家里进行健身运动。但是,在家里进行有效的健身运动并不是一件容易的事情。下面我们就来为您介绍一些在家里进行健身运动的方法,帮助您达到最佳的健身
探索AI视频生成:如何让画面活起来
探索AI视频生成:如何让画面活起来 随着科技的不断发展,人工智能技术在各个领域都有所应用,其中AI视频生成技术正逐渐成为广告营销和影视制作领域的热门话题。借助人工智能技术,视频制作变得更加高效和便捷,同时也为创作者们带来了更多
海底捞节假日期间打折规则详解让你的用餐更省心省钱!
海底捞节假日期间打折规则详解 海底捞是一家以自助火锅为主打的知名餐饮品牌,凭借着精湛的技术和独特的服务理念,深受广大消费者的喜爱。在节假日期间,海底捞更是推出了一系列打折优惠,让顾客们在用餐的同时享受更多的实惠。接下来,让
打造精致高效的中小型企业网站优化设计
精致高效的中小型企业网站优化设计 中小型企业是当今经济发展的重要组成部分,而拥有一家精致高效的企业网站将成为企业发展的重要支柱之一。优化设计不仅可以提升企业形象,更能够吸引更多的潜在客户,提高用户体验,助力企业业务快速增长
张家界市著名旅游景点一览
张家界:自然与人文的完美结合 张家界,是万千游客心中的一片人间仙境。它以其独特的喀斯特地貌著称,奇峰林立、峡谷深邃,犹如画卷般令人向往。这里有浓厚的历史文化氛围,同时又具备无与伦比的自然风光,不仅吸引了无数游客前来游玩,更
打造成功社区团购:水果蔬菜生意的经营秘诀与实操技巧”
打造成功社区团购:水果蔬菜生意的经营秘诀与实操技巧 在当下社会发展的大环境下,社区团购已经成为一种新的经济模式,其中以水果蔬菜生意更是吸引了众多创业者的关注。如何打造成功的社区团购平台,成为了许多人关注的焦点。接下来,我们
相关文章