本项目依托 阿里云 Flink 流处理计算引擎Wednesday, February 28, 2024熟练职掌MySQL\SQL、Kettle以及BI东西利用,可能处置古板数仓交易开拓劳动。
谙习Linux操作体系,以及各样Linux号令,可能处置企业级大数据集群搭筑题目,为进阶大数据开拓奠定底子。
2.职掌大数据的主旨框架Hadoop以及其生态系统,完毕HDFS、MapReduce及Yarn机造基础解析与利用;可能搭筑Hadoop高可用HA集群;
·数仓筑模: 范式与维度筑模·五大主旨重心域开拓: 贩卖域、供应链域、会员域等
可能处置企业级常睹数据栈房搭筑,从项目标需求、技巧架构、交易架构、布置平台、ETL计划、功课调换等整套pipeline,完毕大数据系统下的企业级数据栈房构筑。
1.职掌泛电商行业离线数仓的分层与筑模,从需求、计划、研发、测试到落地上线.行业内首个深度讲明数仓筑模模子计划的主体项目;
·数据搜聚:sqoop·数据理会:Hive·分组完毕项目可处置的实际题目
Python高级语法·Python众劳动编程·Python汇集编程可处置的实际题目熟练职掌Python发言,树立编程头脑,使学员可能熟练利用Python技巧完毕轨范编写。
ETL项目架构计划·Python ETL实战可处置的实际题目职掌Python完毕数据ETL实战,可能处置中小型数据量数据解决相干劳动。
3. 基于ETL实战训练Python编程才智,包含(元数据料理、数据模子、项目设备、单位测试、东西形式抽取等);
FineReport报外初学·泛电商行业五大重心的实行可处置的实际题目职掌利用量最广BI报外开拓东西FineReport,可能基于FineReport完毕分别行业BI报外开拓及交易决议。
Spark案例实战可处置的实际题目职掌环球热门的Spark技巧栈,通过SparkCore和SparkSQL处置数据解决与统计理会事情,进阶高级大数据开拓工程师。
3. 职掌Structured Streaming整合无数据源完毕及时数据解决;
4. 具备Spark全栈开拓才智,餍足大数据行业众场景团结技巧栈的数据开拓,供应就业主旨逐鹿力。
用户画像标签构筑正派·用户画像正派类标签构筑·用户画像统计类标签构筑可处置的实际题目项目供应了全行业用户画像处置计划, 利用SparkSQL+ES+DS构筑企业级用户画像,通过SparkSQL+MySQL构筑通用行业用户画像标签系统。
可处置的实际题目基于Spark全栈技巧构筑企业级大数据开拓平台,学生分组独立完毕项目实战,可能胜任常睹大数据平台开拓事情,帮力企业实行数字化转型。
基于AI大模子的出行大数据平台数仓搭筑·基于AI大模子目标开拓可处置的实际题目职掌奈何利用AI大模子援救数据开拓和数据理会编程作用晋升,具备利用AI大模子处置题目的才智。
可处置的实际题目对研习的实质举办完全记忆,并理会经典口试题,教导简历,口试和疏通手段。
Flink功课开拓·阿里云Flink运维可处置的实际题目职掌当下热门的流批一体化分散式估量框架阿里云Flink及其生态,处置及时估量经典场景题目,顺应市集对阿里云Flink加倍增加的需求。
1.职掌基于阿里云Flink举办及时和离线.职掌基于阿里云Flink的众流并行解决技巧;
基于阿里云Flink + Kafka + Paimon 湖仓一体技巧架构,实而今线视频行业大领域流数据解决和及时理会。本项目依托 阿里云 Flink 流解决估量引擎, 通过 FlinkCDC 及时搜聚 RDS MySQL 数据库数据,实行数据搜聚的断点续传,利用Kafka 行为及时数仓,利用 Paimon 实行数据的经久化和Flink 批解决,实行估量的流批一体,数据存储的湖仓一体,采用StarRocks对接DataV完毕及时交易大屏映现。
转载请注明出处。