选课指导

1 Clementine培训


1.1 Clementine基础培训

时间 2天
培训对象 数据分析人员
涉及产品 Clementine
培训内容 数据挖掘基本概念
Clementine 10.0介绍
CRISP-DM数据挖掘流程介绍
读取数据文件
数据质量评估
数据处理
寻找数据中的关系
Clementine中的数据建模技术
神经网络技术建模
决策树技术建模
模型比较与模型合并
Kohonen神经网络
关联规则
时序发现
模型的发布

1.2 Clementine的数据处理

时间 1天
课程描述 介绍Clementine的数据处理技术,学习如何合并和处理文件,样本数据,处理缺失值和时序数据
培训对象 完成第一课学习的学员
必要技能 第一课学习的技能
培训内容 合并多个数据源数据
抽取样本,选择和缓存数据
处理缺失数据
处理日期
处理时序数据
文件操作
数据聚合
附录 :通过ODBC读取数据
附录:Clementine的数据库连接


1.3 Clementine高级建模

时间 2天
课程描述 介绍Clementine的建模技术以及Meta Modeling技术
培训对象 完成第一、二课学习的学员
必要技能 第一、二课学习的技能
培训内容 数据准备
利用神经网络完成分群(Neural networks for classification)
高级规则归纳(Advanced rule induction)
聚类技术(clustering)
高级关联规则(Advanced association rules)
线性回归(Linear Regression)
逻辑回归(Logistic Regression)
浓缩数据:基本组件(Data Reduction: Principal Components)
从模型中获取数据(meta models,error modeling)

 




2 SPSS培训


2.1 1. SPSS 基础培训和统计基础

时间 2天
培训对象 业务分析师,考虑购买SPSS for Windows 的人员
必要技能 Windows操作技能
培训内容 1. SPSS软件及统计分析过程方法论简介
2. 统计分析过程方法论应用:一个调查研究的实例
3. SPSS for Windows简介
4. 数据输入与建立
数据文件获取:Execl,制表符分隔文件和其它各种ASCII文本文件,数据库数据等各种格式数据的读取
数据文件的建立:变量名、变量标签、值标签、变量类型、缺失值等的处理方式,收集数据时的错误和误差
一些节省时间的特性:数据模板、数据字典等
5. 数据管理与变换
数据分段
衍生变量
变量重新编码
6. SPSS统计图表和报表展示 饼图、直方图、三维直方图、散点图、条图、线图、茎叶图、箱线图、帕雷托图、Q-Q图、P-P图、控制图等
7. 交叉表分析过程及SPSS实现 交叉列表的分析对象、解决的问题,应用SPSS实现交叉列表分析
8. 多选题变量分析及SPSS实现
多选题变量的编码形式、分析指标;多选题变量的建立、频数分析、交叉列表分析;多选题变量的探索性分析
9. 打印与存储输出
增加变量与值标签
打开 Excel,DBase 和固定格式的ASCII文件
选择合适的统计学方法
饼图、直方图、散点图
培训目的及效果 培训人员能够使用SPSS进行简单的数据统计分析操作。

 


2.2 2. SPSS 中级培训

时间 2天
培训对象 经常使用SPSS,并希望了解软件使用的最有效的方式的用户
必要技能 经过SPSS 基础培训
培训内容 1. 高级数据修改
过滤和选择案例
Do if …Else if
字符串函数
处理日期变量
日期和字符串函数的结合使用
2. 文件管理
合并文件
数据聚合
拆分文件
3. SPSS编程:Syntax命令编程及Production Mode来自动化SPSS 包括语法规则、语法文件的构建、及运行方式
4. 一些实用特性举例
保存变量子集
Utilities(实用程序):定义和使用变量子集
标识重复个案
数据流程化校验
5. 枢轴表编辑器的用户化输出
6. 移动 SPSS 结果到其他软件
7. 运行SPSS的不同形式
培训目的及效果 培训人员能够有效地使用SPSS来进行较为复杂的数据处理。

时间序列分析

时间 2天
培训对象 更有效地使用SPSS预测功能的用户。
必要技能 初中级SPSS for Windows培训。 对回归分析的基本理解。
培训内容 时间序列介绍
预测基础
平滑时间序列数据
时间序列数据的离群值和误差
使用Expert Modeler自动预测
评估模型性能
时间序列数据的拟合曲线
时间序列数据的回归分析
指数光滑模型
ARIMA 模型
应用一个模型到新数据
季节性分解
季节性建模
干涉分析
ARIMA中的转移函数
培训目的及效果 培训人员能够使用SPSS Trends(时间序列分析)等来解决实际的预测问题。

 

 

 

 

 

 

2.3 SPSS高级培训 (一)

时间 3天
培训对象 想学习SPSS的统计功能,扩展适当统计过程的背景知识的用户
必要技能 初级、中级SPSS培训, 基本的统计学知识,包括基本统计分析、方差分析、因子分析、主成份、回归分析等
培训内容 1. 如何确定样本及样本大小影响
2. 数据描述
数据的图形描述方法
数据的描述的数值方法
异常值探查
描述分类数据:
分组比较: 分类数据
探索性数据分析: 区间尺度数据
3. 假设检验
假设检验的基本思想、概念、基本步骤
组间的均值差异:简单情况
方差齐性检验
单样本均值检验
独立样本均值比较
配对样本均值比较
4. 方差分析
单因数方差分析
方差分析中的多重比较
因素水平影响程度的对比设计及检验
多因素方差分析
协方差分析简介
5. 相关性分析
变量之间的关系
相关分析基本方法简介
Person相关系数的计算及检验
偏相关分析
6. 回归分析初阶
一元线性回归分析简介:回归方程的假定条件、分析步骤、常用指标
一元线性回归分析实例
回归诊断
7. 双变量画图和统计
8. 非参数检验
9. 相关性分析
相关分析基本方法简介
Person相关系数的计算及检验
偏相关分析
10. 方差分析:
组间的均值差异II: 单因数 ANOVA
组间的均值差异 III: 两因数 ANOVA
方差分析中的多重比较
因素水平影响程度的对比设计及检验
多因素方差分析
协方差分析简介
11. 回归分析简介
线性回归分析简介:回归方程的假定条件、分析步骤、常用指标 一元线性回归分析实例
回归诊断
12. 数据降维技术
主成份分析
因子分析
13. 检验数据分布的正态性
14. 多元均值的推断
培训目的及效果 培训人员能够使用SPSS进行基本数据分析和操作,能解释统计结果。

2.4 SPSS高级培训(二)

时间 3天
培训对象 有使用SPSS for Windows的经验, 坚实的统计学基础
必要技能 经过SPSS for Windows初中级及统计分析培训
培训内容

1. 多元线性回归
多元线性回归简介:回归方程及系数的检验、自变量筛选方法
多元线性回归:SPSS实现
多重共线性问题
逐步回归分析
回归诊断
2. Logistic回归
Logistic 回归简介:应用背景、、回归模型、模型的评价指标等
Logistic回归:SPSS实现
回归系数的检验
回归系数的解释
累积Logistic回归简介
累积Logistic回归:SPSS实现
多项logistic回归简介
多项Logistic回归:SPSS实现
3. 聚类分析
聚类分析简介:基本目标、应用领域、基本思想、主要方法
系统聚类方法简介
系统聚类分析实例
非系统聚类方法,Two-Step聚类、K均值聚类方法简介
非系统聚类方法分析实例
4. 判别分析
判别分析简介:基本目标、与聚类分析区别、常用方法
判别分析应用实例
5. 数据降维技术
因子分析:问题背景、目的、分析的原则、基本思想、因子分析模型
主成份分析简介:指导思想、目的、与因子分析区别
因子/主成份个数的确定
因子旋转
因子得分
注意事项及应用建议
因子/主成分分析应用实例
6. 生存分析
生存分析简介:问题背景、基本概念与有关的统计问题、常用分析方法
Kaplan- Meier及Life table方法原理
Kaplan-Meier分析实例
Cox回归原理
Cox回归分析实例
带着随时间变化协变量的Cox回归
7. 高级方差分析
MANOVA( 多变量方差分析):问题背景、原理、分析实例
重复测量方差分析:问题背景、原理、分析实例
8. 时间序列分析简介

培训目的及效果 培训人员能够使用SPSS回归技术分析、聚类分析、方差分析和时间序列分析等来解决实际问题。