大数据数据分析课程

讲师介绍

侯圣文

Oracle ACE总监,恩墨学院院长,OCM联盟创始人,ACOUG核心专家,DATAGURU专家团成员,Blogger,ITPUB Oracle专题深入讨论版版主曾任职于海关总署数据中心,负责运维国家级海量数据库;国际航空运输协会(IATA)任高级数据架构师,负责国际化高可用海量数据库系统架构设计、实施及运维。现任云和恩墨培训业务中心总经理一职,致力推广Oracle技术。为多家大中型企业提供过Oracle相关课程培训,培训经验丰富,讲课富有激情和感染力,善于理论联系实践,擅长以通俗易懂、诙谐幽默的语言讲解枯燥深奥的数据库理论,并凭借丰富的实践经验,教导学员学以致用、融会贯通,使学员受教于课堂之上,受益于工作之中。作为OCM认证金牌讲师,目前培养OCM大师百余人,培训DBA千余人。个人Blog:http://www.secooler.me。

拥有证书:Cloudera大数据管理员证书,HBase技术实战认证讲师


李美静

李美静,恩墨学院高级讲师,从事Oracle管理工作多年,曾就职于政府、保险、能源等多家单位,负责维护核心数据库,熟悉Oracle体系结构,擅长Oracle高可用架构与灾备等技术,培训学员覆盖银行、政府、金融等多个行业。诙谐、幽默、细心的授课方式,得到学员的一致好评。拥有证书:Oracle 11g/12c  OCM认证Oracle 11g/12c  OCP认证


大数据数据分析课程大纲

查询数据与分析:Hive

HDFS 存储特点

Apache Hive 介绍

Hive 与 HDFS 的关系

Hive 的表结构与数据存储

对比 Hive 与传统关系型数据库

实践:Hive 的安装与部署

Hive 基本数据分析:Hive 数据库和表

基本 HiveQL 语法

数据类型和内建功能

数据查询与分析:Hive 进阶

Hive 的数据格式

创建数据库并由 Hive 管理表

Hive 查询简化:视图

Hive 数据访问控制

实践:Hive 数据管理

Hive 的文本处理

Hive 正则表达式

情绪分析(Sentiment Analysis)以及 N-Grams 模型

实践:通过数据的情绪分析获取价值

Hive 优化与扩展

理解 Hive 查询性能

控制 Hive 任务语句执行计划

Hive 表分区,Bucketing 以及索引数据

SerDes,UDF 以及并行查询

实践:Hive 的数据类型转换

查询数据与分析:Impala

什么是 Impala

什么是面向 ad-hoc 的查询

Impala 与 Hadoop 组件的关系

对比 Impala 与传统关系型数据库

Impala 的局限与未来发展

实践:使用 Impala Shell

Impala 基本语法与数据类型

数据查询与分析:Impala 进阶

过滤、排序与结果集限定

实践:实现自定义 Partitioner

Impala 的性能提升

如何选择工具 MapReduce Hive Impala

实践:使用 Impala 做交互式数据分析

查询数据与分析:Pig

Pig 简介与使用场景

Pig 的语法

查询数据与分析:Pig 进阶与扩展

复杂数据类型

理解 Pig 执行计划

提高 Pig 性能的关键因素

UDF 用户自定义函数

实战:用 Pig 执行 ETL 流程

恩墨学院大数据数据分析课程

联系我们

  • 全国统一咨询热线:400-660-8755
  • QQ咨询:点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
  • QQ群咨询:279589917
  • 邮箱:training@enmotech.com
  • 联系人:黄老师