大数据数据索引与流式计算

讲师介绍

侯圣文

Oracle ACE总监,恩墨学院院长,OCM联盟创始人,ACOUG核心专家,DATAGURU专家团成员,Blogger,ITPUB Oracle专题深入讨论版版主曾任职于海关总署数据中心,负责运维国家级海量数据库;国际航空运输协会(IATA)任高级数据架构师,负责国际化高可用海量数据库系统架构设计、实施及运维。现任云和恩墨培训业务中心总经理一职,致力推广Oracle技术。为多家大中型企业提供过Oracle相关课程培训,培训经验丰富,讲课富有激情和感染力,善于理论联系实践,擅长以通俗易懂、诙谐幽默的语言讲解枯燥深奥的数据库理论,并凭借丰富的实践经验,教导学员学以致用、融会贯通,使学员受教于课堂之上,受益于工作之中。作为OCM认证金牌讲师,目前培养OCM大师百余人,培训DBA千余人。个人Blog:http://www.secooler.me。

拥有证书:Cloudera大数据管理员证书,HBase技术实战认证讲师


李美静

李美静,恩墨学院高级讲师,从事Oracle管理工作多年,曾就职于政府、保险、能源等多家单位,负责维护核心数据库,熟悉Oracle体系结构,擅长Oracle高可用架构与灾备等技术,培训学员覆盖银行、政府、金融等多个行业。诙谐、幽默、细心的授课方式,得到学员的一致好评。拥有证书:Oracle 11g/12c  OCM认证Oracle 11g/12c  OCP认证


大数据索引与流式计算大纲

索引数据基础

    索引数据

    Apache Solr 介绍

    深入了解 Flume 组件

实践:Flume 组件的高级功能:自定义 agent

    Apache kafka 组件介绍

深入理解索引

    理解 Morphlines

    自定义 Morphlines 配置文件

    Schema 设计

    集合管理

Apache Solr 实践

    利用 Mapreduce 对静态数据数据 (HDFS) 添加索引

    利用 Flume 对数据进行实时索引

    利用 lily HBase  数据进添加索引

    其它索引形式介绍

实践:利用 Apache Tika 侦测提取元数据和结构化内容

    提高索引性能:索引性能优化及故障诊断

    索引用户接口

    Cloudera Search 介绍

实战:不同索引形式的综合练习和故障诊断

流动的数据

    实时数据分析概述

    实时数据抽取与预处理:FlumeKafka

    深入了解 Flume 拦截器

实践:Flume 自定义拦截器与 Avro 对象

Kafka 介绍

    Message,Topic Partitions 的概念

    Producers 和 Consumers

    消息顺序保证

    与 Flume 组件的集成

    案例分析

实践:部署 kafka 组件的注意事项

流式计算进阶:流式计算框架

    Spark Streaming 介绍

    Spark 分布式内存结构 RDD

    RDD 的流式表示结构:DStreams

    Streaming state 操作

    滑动窗口操作

实践:利用 Spark steamming 实现实时词频统计

    其它流式计算框架介绍

恩墨学院大数据数据索引与流式计算

联系我们

  • 全国统一咨询热线:400-660-8755
  • QQ咨询:点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
  • QQ群咨询:279589917
  • 邮箱:training@enmotech.com
  • 联系人:黄老师