课程详情 学校简介 学校地址 网上报名
关键词:北京中培大数据平台搭建与高性能计算培训怎么样 北京中培大数据平台搭建与高性能计算培训怎么学 北京中培大数据平台搭建与高性能计算培训怎么报名
关于举办大数据平台搭建与高性能计算最佳实战
培训班的通知
培训地点 |
珠海 |
武汉 |
烟台 |
郑州 |
贵阳 |
培训时间 |
3月26-29 |
5月 17-20 |
7月 23-26 |
9月 17-20 |
11月 15-18 |
本课程全国常年开班,如部分地区课程已结束,请咨询最新培训信息!也可点击课程点播在线视频学习!此课程也可以供企业做内训,欢迎咨询!
一、 培训收益
通过此次课程培训,可使学习者获得如下收益:
1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;
2.了解业界市场需求和国内外最新的大数据技术潮流,洞察大数据的潜在价值;
3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;
4.掌握业界最流行的Hadoop与Spark大数据技术体系;
5.掌握大数据采集技术;
6.掌握大数据分布式存储技术;
7.掌握NoSQL与NewSQL分布式数据库技术;
8.掌握大数据仓库与统计机器学习技术;
9.掌握大数据分析挖掘与商业智能(BI)技术;
10.掌握大数据离线处理技术;
11.掌握Storm流式大数据处理技术;
12.掌握基于内存计算的大数据实时处理技术;
13.掌握大数据管理技术的原理知识和应用实战;
14.深入理解大数据平台技术架构和使用场景;
15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;
16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧。
二、 培训特色
1.课程培训业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。
2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。
3.本课程的授课师资都是有着多年在一线从事Hadoop与Spark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。
三、 日程安排
日程 |
培训模块 |
培训内容 |
第一天 上午 |
大数据技术基础 |
1. 大数据的产生背景与发展历程 2. 大数据的4V特征,以及与云计算的关系 3. 大数据应用需求以及潜在价值分析 4. 业界最新的大数据技术发展态势与应用趋势 5. 大数据思维的转变 6. 大数据项目的系统与技术选型,及落地实施的挑战 7. “互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍 |
业界主流的大数据技术方案 |
1. 大数据软硬件系统全栈与关键技术介绍 2. 大数据生态系统全景图 3. 主流的大数据解决方案介绍 4. Apache大数据平台方案剖析 5. CDH大数据平台方案剖析 6. HDP大数据平台方案剖析 7. 基于云的大数据平台方案剖析 8. 大数据解决方案与传统数据库方案比较 9. 国内外大数据平台方案与厂商对比 |
|
大数据计算模型(一)——批处理MapReduce |
1. MapReduce产生背景与适用场景 2. MapReduce计算模型的基本原理 3. MapReduce作业执行流程 4. MapReduce编程模型: Map处理和Reduce处理 5. MapReduce处理流程:数据读取collect、中间数据sort、中间数据spill、中间数据shuffle、聚合分析reduce 6. MapReduce开发高级应用:Combiner技术与应用场景、Partitioner技术与应用场景、多Reducers应用 7. MapReduce开发与应用实战:Hadoop平台搭建与运行;MapReduce安装与部署; 8. 应用案例:基于HDFS+MapReduce集成的服务器日志分析采集、存储与分析MapReduce程序实例开发与运行 9. MapReduce参数调优与性能优化技巧 |
|
第一天 下午 |
大数据存储系统与应用实践 |
1. 分布式文件系统HDFS产生背景与适用场景 2. HDFS master-slave系统架构与读写工作原理 3. HDFS核心组件技术讲解,NameNode与fsimage、editslog,DataNode与数据块 4. HDFS Federation机制,viewfs机制,使用场景讲解 5. HDFS高可用保证机制,SecondaryNameNode,NFS冷备份,基于zookeeper的HA方案 6. HDFS参数调优与性能优化 |
大数据实战练习一 |
1. Hadoop平台搭建、部署与应用实践,包含HDFS分布式文件系统,YARN资源管理软件,MapReduce计算框架软件 2. HDFS 文件、目录创建、上传、下载等命令操作,HDFS合并、归档操作,HDFS监控平台使用 3. MapReduce程序在YARN上运行,YARN监控平台使用 |
|
第二天 上午 |
Hadoop框架与生态发展,以及应用实践操作 |
1. Hadoop的发展历程 2. Hadoop 1.0的核心组件JobTracker,TaskTracker,以及适用范围 3. Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别 4. Hadoop关键机制:任务推测执行,任务容错,任务选择执行,心跳机制 5. Hadoop YARN的资源管理与作业调度机制:FIFO调度,Capacity调度器,Fair调度器 6. Hadoop 常用参数调优与性能优化技术 |
大数据计算模型(二)——实时处理/内存计算 Spark
|
1. MapReduce计算模型的瓶颈 2. Spark产生动机、基本概念与适用场景 3. Spark编程模型与RDD弹性分布式数据集的工作原理与机制 4. Spark实时处理平台运行架构与核心组件 5. Spark RDD主要Transformation:map, flatMap, filter, union, sample, join, reduceByKey, groupByKey 6. Spark RDD主要action:count,collect,reduce,saveAsTextFile 7. Spark宽、窄依赖关系与DAG图分析 8. Spark容错机制 9. Spark作业调度机制 10. Spark缓存机制:Cache操作,Persist操作与存储级别 11. Spark作业执行机制:执行DAG图、任务集、executor执行模型、 BlockManager管理 12. Spark standardalone,Spark on YARN运行模式 13. Scala开发介绍与Spark常用Transformation函数介绍 14. Spark调优:序列化机制、RDD复用、Broadcast机制、高性能算子、资源参数调优 |
|
第二天 下午 |
大数据仓库查询技术Hive、SparkSQL、Impala,以及应用实践 |
1. 基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景 2. Hive数据仓库的平台架构与核心技术剖析 3. Hive metastore的工作机制与应用 4. Hive内部表和外部表 5. Hive 分区、分桶机制 6. Hive行、列存储格式 7. 基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景 8. Spark SQL实时数据仓库的实现原理与工作机制 9. SparkSQL数据模型DataFrame 10. SparkSQL程序开发与 11. SparkSQL数据读取与结果保存:json,Hive table,Parquet file,RDD 12. SparkSQL和Hive的区别与联系 13. SparkSQL操作实战 14. 基于MPP的大型分布式数据仓库Impala基础知识与应用场景 15. Impala实时查询系统平台架构、关键技术介绍,以及与Hive,SparkSQL的对比 |
Hadoop集群运维监控工具 |
1. Hadoop运维管理监控系统Ambari工具介绍 2. 第三方运维系统与工具Ganglia, Nagios |
|
大数据实战练习二 |
1. 基于 Hadoop平台搭建、部署与配置Spark集群,Spark shell环境实践操作,Spark案例程序分析 2. 基于sbt的Spark程序编译、开发与提交运行 3. 应用案例一:基于Spark的服务器运行日志TopN分析、程序实例开发 4. 应用案例二: 基于Spark的搜索引擎日志热词与用户分析、程序实例开发 5. 基于MapReduce的Hive数据仓库实践,Hive集群安装部署,基于文件的Hive数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作 6. SparkSQL shell实践操作:数据表读取、查询与结果保存 |
|
第三天 上午 |
大数据计算模型(三)——流处理Storm, SparkStreaming
|
1. 流数据处理应用场景与流数据处理的特点 2. 流数据处理工具Storm的平台架构与集群工作原理 3. Storm关键技术与并发机制 4. Storm编程模型与基本开发模式 5. Storm数据流分组 6. Storm可靠性保证与Acker机制 7. Storm应用案例分析 8. 流数据处理工具Spark Streaming基本概念与数据模型 9. SparkStreaming工作机制 10. SparkStreaming程序开发介绍 11. SparkStreaming的全局统计和窗口函数 12. Storm与SparkStreaming的对比 13. SparkStreaming开发案例:基于文件流的SparkStreaming程序开发;基于socket消息的SparkStreaming程序开发 |
大数据与机器学习技术 |
1. 机器学习发展历程 2. 机器学习与大数据关联与区别 3. 数据挖掘经典算法 4. 预测算法:线性回归与应用场景,非线性回归与应用场景 5. 分类算法:逻辑回归与应用场景,决策树与应用场景,朴素贝叶斯算法与应用场景,支持向量机算法与应用场景 6. 聚类算法; k-means与应用场景 7. 基于Hadoop的大数据机器学习技术 8. 基于MapReduce的机器学习库Mahout 9. Mahout支持的数据挖掘算法 10. Mahout编程模型与发 11. 基于Spark的机器学习库Spark MLlib 12. Spark MLlib支持的数据挖掘算法 13. Spark MLlib编程模型与开发:基于Spark MLlib的文本分类,基于Spark MLlib的聚类 |
|
第三天 下午 |
大数据ETL操作工具,与大数据分布式采集系统 |
1. Hadoop与DBMS之间数据交互工具的应用 2. Sqoop导入导出数据的工作原理 3. Flume-NG数据采集系统的数据流模型与系统架构 4. Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式 |
面向OLTP型应用的NoSQL数据库及应用实践 |
1. 关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围 2. 列存储NoSQL数据库HBase简介与数据模型剖析 3. HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用 4. HBase表设计模式与primary key设计规范 5. 文档NoSQL数据库MongoDB简介与数据模型剖析 6. MongoDB集群模式、读写机制与常用API操作 8.键值型NoSQL数据库Redis简介与数据模型剖析 9.Redis多实例集群架构与关键技术 10.NewSQL数据库技术简介及其适用场景 |
|
大数据实战练习三 |
1.Sqoop安装、部署与配置,基于Sqoop、MySQL与Hive操作MySQL数据库与Hive数据仓库数据导入导出 2.Kafka安装、部署与配置,基于Kafka创建和消费topic实践操作 3.Flume+HDFS+MapReduce/Spark大数据采集、存储与分析实践操作 |
|
大数据项目选型、实施、优化等问题交流讨论 |
大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论 |
|
第四天 |
学习考核与业内经验交流 |
四、 授课专家
蒋老师 清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。
赵老师 清华大学计算机双学士,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。15年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。
张老师 天津大学软件工程硕士,10多年的IT领域相关技术研究和项目开发工作,在长期软件领域工作过程中,对软件企业运作模式有深入研究,熟悉软件质量保障标准ISO9003和软件过程改进模型CMM/CMMI,在具体项目实施过程中总结经验,有深刻认识。通晓多种软件设计和开发工具。对软件开发整个流程非常熟悉,能根据项目特点定制具体软件过程,并进行项目管理和监控,有很强的软件项目组织管理能力。对C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大数据、云计算有比较深入的理解和应用,具有较强的移动互联网应用需求分析和系统设计能力,熟悉Android框架、IOS框架等技术,了解各种设计模式,能在具体项目中灵活运用。
五、 培训费用
培训费5800元/人(含培训费、场地费、资料费、学习期间午餐),食宿可统一安排,费用自理。请学员带身份证复印件一张。
本课程由中国信息化培训中心颁发《大数据平台搭建与高性能计算高级工程师》证书,证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
六、 报名回执【大数据平台搭建与高性能计算最佳实战】
单位名称 (开发票名称) |
|
|||||
快递地址 |
|
邮编 |
|
|||
联 系 人 |
|
职位 |
|
电话 |
|
|
|
|
传真 |
|
|||
学员姓名 |
身份证号 (做证书使用) |
邮箱 |
联系电话 |
培训地点 |
是否住宿 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
点击学校名称进入学校详细网页【北京中培教育】
课程安排时间:
白班、晚班、业余制班、周末班、一对一定制课程(详情请咨询顾问)
白 班:8:30-16:30 (周一至周五白天时间段选择)
全日制:8:30-11:30/13:40-16:30 (周一至周五全天上课)
晚上班:18:00-21:00
周 末:8:30-16:30(每周六或周日全天)
具体上课时间学员根据自身时间安排选择报班。
课程周期:
课程周期长短以学员实际所报班级为准,一对一课程和培训老师沟通安排。
课程收费:
因学员自身基础和所要学习达到的程度、报班时间长短等客观因素不等,我们开设有不同的班级,费用有所区别,费用以学员所报班级为准,学员根据自身要求选择报班,如有疑问请咨询报名老师。
不同时间校区有不同的优惠活动,详细优惠以当时参加的优惠活动为准。
预约试听体验课程:
学员如需参加体验课程,至少需提前一周和顾问预约体验课程,提供给顾问参加学员姓名+电话+课程+所在地区,顾问会及时登记预约就近校区体验课程,预约成功后顾问会通过电话或短信及时通知学员。
报名须知:
1、外地学员,需代办食宿,提前和老师预约沟通。
2、学费不包含食宿费用。(全日制住宿课程除外)
3、校区顾问会不定期回访学员,了解基础情况,请学员配合顾问回访。
4、课程调换或改期,需到校区和课程老师沟通。
5、课程退班退费,学员需到校区办理。(实际情况以校区规定为准)
6、报名完成后保留好报名票据,以及课程老师联系电话,以便后期和老师跟进。
7、优惠活动请和报名老师咨询了解。
我们竭诚为您服务,如需帮助或了解优惠活动,请在线联系顾问,顾问会及时安排课程老师电话和您沟通介绍!
一、 公司简介
北京中培伟业管理咨询有限公司(以下简称“中培”)成立于2006年,其主营业务为企业培训,企业信息技术方面的培训。
(1)从服务形式上分为
有面授公开课,企业内训。远程网络课,IT认证(面授与远程都可以)。
(2)从内容上分为
涉及信息技术的方方面面。比如,软件研发,项目管理,信息安全,数据库,大数据,区块链,IT运维,顶层设计,等等。
中培已经为众多的世界500强企业、国有大中型集团化企业、国际知名互联网企业提供过高质量的信息化战略规划、组织架构规划、科技人才管理、信息技术架构规划、信息系统开发和运维管理、信息化能力评测的相关培训与咨询服务。与此同时,中培以“为国家培养高阶信息化管理人才”的价值观为使命,以“专业、诚信、执着、创新”的服务理念为指引,不断朝着促进中国企业的信息化综合竞争力与国际影响力提升的目标而前行。
中培伟业管理咨询有限公司的企业发展愿景为:通过融合创新让IT成为企业核心生产力!
依托于高阶的IT服务领域定位和核心的知识资源系统,中培专注于成长为中国信息化领域最专业的面授培训服务、互联网教育服务、咨询服务的综合性服务解决方案提供商,努力打造中国IT咨询与培训服务的第一品牌。目前,中培已经是中国本土最大的企业信息化架构规划咨询和解决方案提供商。
中培培训业务开展十余年以来,主要定位授课人群为大中型央企的IT分管副总、CIO、中高级技术管理者和中高级技术骨干人群,常规通过企业内训和公开课方式开展,迄今为止已经为千余家中大型企业、几万余名IT业内人士开展信息化培训服务。
通过近十年信息化服务经历,中培形成了具有国际视野、中国深度的企业架构咨询专业服务能力。中培于2012年成立咨询事业部,专门为大型国有化集团性企业提供高阶IT服务咨询,现已经完成大型央企信息化咨询项目12项,积累了丰富的信息化战略和架构规划经验。截止目前,中培已连续五年荣获国际开放群组OPENGROUP黄金会员,在咨询领域获得企业架构咨询服务授权,能进行企业信息化架构设计与成熟度鉴定。
中培的互联网业务顺应于近年来互联网教育领域的发展趋势,通过打造平台化的运营模式,一方面打破地域性约束将全球企业的信息化实践和需求进行整合,一方面将IT领域的高效人士的 “碎片化”时间和信息服务需求进行整合,积极构建开放式平台化的信息服务共享环境,呈现“全球广度、中国深度”!
自2015年开始,中培依托于传统业务的企业和个人客户群体资源优势,逐步开展了以互联网服务涵盖在线点播和直播课程、信息技术实战演练、在线技能测评为基础三种互联网业务。目前在线企业会员已达百余家企业,在线个人会员已经累计达到近千人。
中培公司成立之初,立志于打造中国最权威的IT高端信息化服务品牌,为中国的中大型企业培养IT高端人才并塑造企业核心信息化竞争力。早在8年前,其信息化领域的培训和咨询服务就以OPENGROUP组织的Togaf高阶方法体系和国际知名咨询服务厂商的企业架构规划最佳实践为基础,结合与众多优秀企业的高级技术管理人才的合作开展各项业务,为中培积累了深厚的行业解决方案和优质的客户资源。可以说,其初始的大型国企IT高管服务定位确立了其在行业中的领先地位,也为后来者带来了专业领域较为高阶的入行门槛。迄今为止,国内本土企业开展同类型服务的企业屈指可数,中培已经发展成为本土咨询公司中的佼佼者。
|
中培迄今为止已经为千余家中大型企业开展高阶信息化内训服务,客户资源分布如下图所示,依托业内良好的培训口碑,中培除了保证稳定增长的传统培训服务业务,其新兴的咨询和互联网业务也在近年来保持快速稳步增长。
中培在2016年已经达成与国家电网控股公司国网信通埃森哲公司,以及与国内知名的SOA服务平台厂商普元信息技术股份有限公司,达成长期战略合作意向并签署框架协议,甲乙双方将共同建立高层互访交流机制和协调机制,在战略业务拓展、目标客户推荐、联合市场营销以及服务方案开发等领域实现合作机制,共同促进业务的健康良性发展。
中培创始人为中国最早一批的IT高端教育领域职业经理人,拥有丰富的商业化运营和资本运营经验,其核心管理层资源为国内外知名学府的硕士、博士学历背景,同时具备埃森哲、中国惠普、德勤、用友软件、东软国际等国际知名企业的产品和解决方案运营管理经验。在中国经济高速发展10年间,紧随趋势,稳步发展,已将中培经营成为业内首屈一指的高端信息化服务平台型企业。
中培咨询拥有一支高素质、专业化的咨询服务实施团队,顾问团队拥有北京大学、中国人民大学、中央财经大学、北京航空航天大学、西安交通大学等国际知名学府的博士、硕士教育背景。中培咨询的核心顾问团队管理人员具备埃森哲公司、中国惠普、IBM、德勤、SAP等世界500强企业的10年以上咨询方案设计实施经验,累计大客户企业架构、IT战略管控类咨询实施案例超过10家。曾参与过平安重庆、国家电网、华为技术、宝马中国、中国铁建、河北建投集团、中央结算公司、人民银行、中国移动集团、中国联通集团等30多家国内外知名企业的大型架构规划类服务项目,中培的顾问资源累计实施超过300场大中型企业的信息化高级内训服务。顾问团队也在不断总结和吸纳现行国家“互联网+”、“两化融合”、“中国制造2025”、“信息化自主掌控”、“科技风险管理”的战略和政策要求,与之相关,沉淀和积累了大量复合国家战略的专业领域咨询服务方案。
从卓越到超越,中培一直是坚持积累资质的机构,截止目前已经拥有国内外多项核心企业资质。主要包括国际OPENGROUP组织黄金会员、国际OPENGROUP组织TOGAF课件鉴定成员;国际PEOPLECERT组织ITIL Foundation国际及ITIL Expert国际认证培训与咨询机构;国际APMG组织ISO27001认证及COBIT认证培训与咨询机构;国际EXIN 国际信息科学考试学会CDCP认证培训与咨询机构;中国信息安全测评中心CISP注册信息安全专业人员认证课程授权;美国Cisco网络设备培训合作伙伴;美国项目管理协会PMP授权培训中心;工业和信息化部人才交流中心培训整体授权;国家3AAA信用资质企业;中国工商总局互联网商业服务许可资质;企业一般纳税人财务资质。经营业绩年收入1000万-2000万。
图4.中培国内外资质认证(部分)
中培互联网IT教育的优势在于专注信息化领域高端课程,所涉及的课程体系,既包括了国家及国际上的热点课程认证,也涵盖了我国信息化主流课程。中培拥有自主研发团队、自主师资团队、自主咨询团队。能够为在线业务体系的不断完善进行规划设计、课程开发、服务改进提供坚实的支持支撑。提供业界最完善的客户服务体系、坚持不断持续创新、立足全球国际化IT方法积累与转化、深入结合中国实际需求。
l IT、通信、电子、互联网
学校名称:北京中培教育
固定电话:400-6169-615
授课地址:北京市丰台区育芳园东里3号楼B座 预约参观