课程概览

在大数据时代,数据质量问题成为影响数据分析和利用效能的“最后一公里”问题,是困扰许多 大数据公司和企业在拓展其大数据战略不可回避的问题。目前在数据治理领域,ETL、数据分析、数据集成、数据可视化等领域已经都取得飞跃的进展,但数据质量问题及其引发的数据质量衡量、数据质量的检验、数据质量监控、数据质量提升等技术实现手段正日益被业界所关注并逐步加大投入以获得革命性的改进,以提升数据质量管理的效率,降低数据质量优化的成本。

本课程重点围绕数据质量相关命题,引入以国际知名数据质量管理工具软件-Trillium Software 的数据质量管理理念及方法,结合业界的最佳实践及讲师本人的从业经验,面向企业数据战略制定者、数据治理管理者、数据质量处理人员定制化准备的专业数据质量管理课程,本课程中数据处理理论、工具实例演示、业界实际案例分享、具体技术实操相结合,使学员从宏观理论到微观技术实操建立完整的数据质量管理体验。

入门基础课程

第一天

上午: 数据治理全生命周期及数据质量管理概述

数据治理全生命周期介绍
数据质量构架
企业实施数据质量管理的战略
数据质量评测方法
业界最佳方法介绍--业界领先数据质量管理工具-Trillium Software介绍

下午: 数据剖析(探究)在大数据应用中的作用

数据基本属性介绍
数据剖析 方法与原理
数据剖析中的业务规则介绍(ABR\EBR)
数据剖析在大数据应用中的作用
案例及演示-Trillium Software软件系统的数据属性构成及介绍

第二天

上午: 数据剖析

数据剖析的基本流程
数据集成
ABR与EBR的建立及使用
如何通过ABR、EBR的使用进行数据剖析
数据剖析结果报告介绍
案例及演示--利用Trillium Software 软件系统进行数据剖析演示

下午: 数据质量诊断

数据质量诊断的目标
数据质量诊断的原理和方法
数据诊断流程
数据质量诊断项目执行流程
数据质量诊断报告及解读
案例及演示--利用Trillium Software 软件系统进行数据质量诊断演示

第三天

上午: 数据优化

如何通过数据诊断报告制定数据优化策略
数据优化流程与步骤
业务规则在数据优化中的使用
案例及演示--利用Trillium Software 软件进行数据优化演示及相关案例分享

下午: 数据质量评分卡管理及应用

数据质量评分卡体系介绍
数据质量阀值定义与设计
如何利用数据质量评分卡体系进行数据质量趋势分析
如何利用评分卡体系进行企业数据质量监控
案例及演示--利用Trillium Software 软件系统数据质量评分卡体系实操介绍

第四天

上午: 如何通过业务规则进行数据质量管理

数据治理中的业务规则定义及使用介绍
常见业务规则种类介绍
构建业务规则的语法及兼容性、适应性处理
数据质量诊断中如何按需调用业务规则
案例及演示--利用Trillium Software 软件撰写业务规则及使用演示

下午:企业数据处理业务规则库建立与管理

数据处理规则库定义及介绍
规则库的建立在大数据处理及职能分离、历史承接的作用和意义
规则库建立及使用
业务规则库在数据质量管理的定位及调用
案例及演示--利用Trillium Software 软件业务规则库使用演示

第五天

上午:如何建立企业级数据质量管理平台

数据质量管理平台基本功能及构架
企业数据质量管理平台使用费角色及职责权限设计
数据质量管理平台在不同的商业应用场景的定位及部署
案例及演示--利用Trillium Software 软件构造企业级数据质量管理平台

下午:数据质量工具与ETL、数据分析工具的集成

数据质量管理工具与ETL、数据分析工具的区别与交互作用
三者之间的交互与集成
企业典型数据处理中数据质量管理及ETL、数据分析使 用案例介绍

第六天

上午: 案例分享

国内大型上市公司企业集团数据质量诊断案例介绍
国际大型跨国公司如何利 用数据质量优化提升其精准推送效果
大型大数据公司数据库记录查重及匹配实施介绍
Trillium Software 案例全功能演示

应用提高课程

1.如何利用Trillium Software 实现企业数据剖析

数据剖析技术是大数据应用的其中一项关键技术,用于快速发现异常的、不一致的、缺失的、重复的、有违业务规则的数据记录。 而如何利用trillium software 来实现自动化的数据剖析是本课程的重点。

课程周期

2天

数据及环境准备要求

不同系统,不同时间段、不同质量、不同业务的数据记录
用于校对的业务规则
trillium software 软件

相关的数据处理技术

数据集成
数据优化及结构化
数据库查重及记录合并

掌握trillium software 的知识点

数据格式转换及数据结构化技术
ABR(字段级规则使用)
EBR( 表级规则使用)
业务规则及规则库使用
关联分析
表间数据分析及集成匹配(或不匹配)的数据记录
依赖关系分析

2.如何利用Trillium Software 实现企业员工(用户)画像

课程周期

2天

数据及环境准备要求

不同系统,不同时间段、不同质量的涉及员工(或用户)的数据记录
企业相关业务数据
Trillium software

相关的数据处理技术

数据集成
数据数据质量诊断
数据优化及结构化
数据库查重及记录合并
画像纬度设计及结果分析
画像数字化展现

掌握trillium software 的知识点

数据格式转换及数据结构化技术
异常数据发现技巧
数据剖析及诊断报告
trillium 记录匹配设计技巧
记录查重及匹配
建立业务规则及规则库使用

统一视图技术是当前大数据应用的一个重要领域,本课程通过对trillium software 软件技术的使用,引导学员建立如何收集数据、数据质量诊断,记录查重及优化,最后根据需要制定一套完整的数据处理流程达至生成企业员工(或用户)的画像。

3.如何利用Trillium Software 进行电话号码辨别及优化

电话号码是个人及机构一个重要的识别信息,如何在历史数据中,异构系统数据中辨别客 人(用户)的电话号码的真伪及历史真相,以及通过这些辨别找到优化的规则及处理解决方案, 更为重要的是使这些处理通过系统自动化处理,大大减少人工成本及提升处理效果。本课程使学员通过利用trillium software 软件学会如何剖析数据,如何通过trillium 某些特有的软件功能实现上述的目标。

课程周期

2天

数据及环境准备要求

不同系统,不同时间段、不同质量的涉及员工(或用户)含电话号码字段的数据记录
trillium software 软件

相关的数据处理技术

数据集成
数据数据质量诊断
数据优化及结构化
数据库查重及记录合并
ETL 相关技术

掌握trillium software 的知识点

数据格式转换及数据结构化技术
异常数据发现技巧
ABR及metadata 使用
数据剖析及诊断报告
字段间分析
表间分析
trillium 频率分布技术及功能使用
trillium 记录匹配设计技巧
记录查重及匹配
建立业务规则及规则库使用

联系我们

如果您对《数据分析师脱产就业班》课程感兴趣,欢迎填写您的相关信息或直接拨打下方培训热线与我们联系。

  • 广东省广州市体育东路122号羊城国际商贸中心西塔1010
  • 400-038-1778
  • contact@hjbis.com
  • 杨老师