当前位置:在线查询网 > 在线百科全书查询 > SAS数据挖掘与分析

SAS数据挖掘与分析_在线百科全书查询


请输入要查询的词条内容:

SAS数据挖掘与分析




版权信息


书 名: SAS数据挖掘与分析作 者:周爽 阮桂海

出版社: 清华大学出版社

出版时间: 2008

ISBN: 9787302169208

开本: 16

定价: 33.00 元

内容简介


《SAS数据挖掘与分析》囊括了SAS编程方面极为详尽的命令语句,是数据的科学挖掘和统计分析方面的一本不可多得的教科书。

《SAS数据挖掘与分析》的前8章介绍了数据挖掘和统计分析所用的各类命令语句,第9~17章着重介绍如何用命令语句及其对话框进行常用的初高级统计和专业统计,并对统计结果进行了科学准确的分析。

《SAS数据挖掘与分析》面向全国高校统计学、医学、心理学、市场营销学、人文社会学、信息管理学及财经学等专业的本科生和研究生,可作为这些专业及其他非计算机专业学生必选的统计教材,也是数据挖掘和信息分析方面的利器。

编辑推荐


《SAS数据挖掘与分析》是教据的科学挖掘和统计分析方面一本不可多得的教材,前半部分介绍了各种数据挖掘和统计分析所用的各类命令语句,后半部分着重介绍如何用命令语句及其对话框进行常用的初高级统计和专业统计,并对统计结果进行既科学又准确的分析,后半部分融会了作者在数据挖掘和信息分析领域教学和研究的经验与成果,是《SAS数据挖掘与分析》的精华所在。

目录


第1章SAS编程的语法知识

1.1SAS(StatisticalAnalysisSystem)概述

1.2观测值、变量常量

1.3SAS的操作符

1.4SAS数据挖掘常用的语句

习题

第2章数据挖掘的预备知识

2.1DATA语句

2.2INPUT语句

2.3LENGTH语句

2.4用LABEL语句指定变量标签

2.5用PROCFORMAT过程指定数据标签

2.6用MISSING语句宣告缺失值

2.7注释语句

2.8创建新变量

2.9缺失值不参与运算

2.10求和语句

2.11删除变量

2.12用INFILE语句读取外部文件的数据

习题

第3章数据挖掘时的跳转与循环

3.1IF语句

3.1.1IFTHEN语句

3.1.2IFTHEN/ELSE语句

3.2GOTO语句

3.3LINK语句

3.4RETURN语句

3.5删除部分个案

3.5.1删除数据集里暂时不用的个案

3.5.2用IF语句挖掘部分数字型的个案

3.6循环语句

3.7数组

3.7.1下标变量的下标

3.7.2在DOEND循环中使用数组

3.7.3多维数组

习题

第4章建立数据仓库

4.1建立永久数据集

4.2数据的分组及分组标记

4.2.1分组控制

4.2.2数据的分组标记

4.3数据的排序

4.4数据集的连接

4.4.1变量相同时的连接

4.4.2变量不同时的连接

4.4.3变量值相同时的个案连接

4.5数据集“合二而一”

4.5.1按个案号配对合并变量

4.5.2用BY语句进行匹配合并

4.6用FILE语句控制输出文件

4.7OUTPUT语句

4.7.1OUTPUT语句格式

4.7.2一个个案的变量分几行输出

4.7.3一个DATA步创建多个数据集

4.8用DATASETS过程修改数据集

4.9查阅数据集的信息

习题

第5章数据挖掘的过程引论

5.1DATA语句

5.2INFILE语句

5.3INPUT语句

5.3.1用INPUT语句定义固定格式的变量

5.3.2用INPUT语句定义自由格式的变量

5.3.3用INPUT语句指定格式化的输入方式

5.3.4INPUT语句含有挖掘功能

5.4用LABEL语句定义变量标签

5.5用FORMAT及VALUE语句定义数值标签

5.5.1定义数值标签

5.5.2指定“格式化输入”

5.5.3用FORMAT语句指定变量值的格式

5.6用TITLE语句显示标题

5.7数据挖掘常用的统计过程

5.7.1用PROCFREQ过程做简单的频数分布

5.7.2用PROCCHART过程画图

5.7.3用PROCPLOT过程画散点图

5.7.4用PROCMEANS过程统计均值分布

5.7.5用PROCRANK过程统计秩和分布

5.7.6用PROCTABULATE制表

5.7.7用PROCUNIVARIATE过程做详尽的频数分布

5.7.8用PROCDBF过程调用dBASE数据库数据

5.7.9用PROCPRINT过程显示数据集的信息

5.7.10用PROCSORT过程对数据排序

5.7.11用PROCSTANDARD过程对变量标准化

5.5.12用TRANSPOSE过程转置数据

习题

第6章通过描述统计挖掘数据

6.1用FREQ过程做单双变量的频数统计

6.1.1FREQ过程命令

6.1.2FREQ过程与其他过程的连用

6.2单变量频数分布

6.3双变量交叉汇总和结合测量

6.3.1双变量频数统计的过程命令

6.3.2“定类-定类”双变量交叉汇总与结合测量

6.3.3“定比-定比”双变量交叉汇总与结合测量

6.3.4“定序-定序”双变量交叉汇总与结合测量

6.4再用UNIVARIATE过程详细描述单变量

6.4.1举例

6.4.2UNIVARIATE过程命令

6.4.3计算方法

6.5进一步用PROCCHART过程描述单变量

6.5.1PROCCHART过程命令

6.5.2CHART的选项

6.6用MEANS过程比较两个均值

6.6.1应用实例

6.6.2MEANS过程命令

6.7用PROCPLOT过程画散点图

6.8用RANK过程进行非参数检验

6.8.1什么是秩分

6.8.2RANK过程命令

6.8.3秩分计算

6.8.4运用举例

习题

第7章均值比较与T检验

7.1均值比较的方法

7.1.1配对样本的均值比较

7.1.2两个独立样本的均值差检验

7.2MEANS过程及其t统计量

7.3TTEST过程及其t检验

7.4非参数检验

7.4.1用NPAR1WAY过程做非参数检验

7.4.2举例

习题

第8章方差分析

8.1用ANOVA做均衡数据的方差分析

8.1.1ANOVA过程命令

8.1.2单因素方差分析

8.1.3双因素方差分析

8.1.4三因素方差分析

8.1.5R*C交互因素的方差分析

8.1.6多个实验组与对照组的均值比较

8.1.7用SNK的Q检验法比较组间均值

8.2用GLM进行非均衡数据方差分析

8.2.1GLM过程命令

8.2.2GLM过程的统计功能

8.2.3用GLM做单因素3水平方差分析

8.2.4用GLM做二因素方差分析

8.3协方差分析

8.3.1GLM过程命令

8.3.2用GLM做协方差分析

习题

第9章相关分析

9.1数据的4种测量水平

9.2皮尔逊积差相关

9.2.1皮尔逊相关系数CORR的计算公式

9.2.2皮尔逊相关系数的测量

9.2.3皮尔逊相关系数CORR的分析

9.3皮尔逊二分“点-距”相关

9.4肯氏(Kendall)等级相关τ?b

9.4.1计算肯氏等级相关系数的数据

9.4.2通过Analyst中的对话框计算肯氏相关系数τ?b

9.4.3肯氏相关系数τ?b结果分析

9.5计算次序-比率数据的肯氏相关系数

9.5.1次序-比率数据例子

9.5.2计算次序-比率数据的Eta系数

9.5.3肯氏相关系数τ?b结果分析

9.6斯皮尔曼等级相关

9.6.1斯皮尔曼等级相关系数的计算公式

9.6.2用“分析家”对话框测量等级相关

9.6.3Spearman相关系数的分析

9.7“标称-标称”型变量的相关测量

9.8Cronbach的Alpha系数与Spearman相关系数

9.9用PROCCORR过程编程计算相关系数

习题

第10章用GLM过程进行回归分析

10.1最小平方法的原理

10.1.1方差分析

10.1.2统计量F

10.1.3回归系数Β计算法

10.1.4判定系数R

10.1.5残差分析

10.1.6DW统计量D

10.2GLM中各语句的格式

10.3GLM程序各语句的使用说明

10.4调用GLM程序作一元线性回归

10.4.1数据与程序

10.4.2数据分析

10.4.3结果分析

10.5调用GLM程序进行多元线性回归分析

10.6调用GLM程序进行多项式回归

10.6.1多项式回归的一般模型

10.6.2多项式回归的实例

10.7虚拟变量的用法

习题

第11章采用REG过程进行多元线性回归分析

11.1用Analyst对话框做多元线性回归

11.2REG过程的语句格式

11.2.1REG程序中的语句及任选项

11.2.2REG程序中主要语句及关键词的注解

11.3REG程序进一步实例

11.4MAXR回归法和RSQUARE回归法

11.4.1MAXR回归法

11.4.2RSQUARE回归法

11.4.3实用程序及图例

习题

第12章路径分析

12.1路径分析所用的程序

12.2图形输出

12.3路径图的分析方法

习题

第13章生存分析

13.1名词引论

13.2用LIFEREG进行生存分析

13.2.1LIFEREG过程命令

13.2.2LIFEREG过程的应用实例

13.3用LIFETEST过程进行生存检验

习题

第14章非线性回归分析一:对数与多项式回归

14.1对数曲线回归

14.1.1对数曲线回归所要求的数据

14.1.2对数曲线回归的编程解法

14.2对数曲线回归分析

14.3拟合抛物线的多项式回归

14.3.1多项式回归分析的原始数据

14.3.2多项式回归的方程式

14.3.3多项式回归的SAS程序

14.4多项式回归的结果与分析

14.4.1多项式回归的输出结果

14.4.2改用“分析家”对话框法进行多项式回归

14.4.3拟合大学生生长发育的二次曲线模型

习题

第15章非线性回归二:Logistic回归与指数回归

15.1Logistic曲线回归

15.2从Logistic曲线模型解出初始值

15.3拟合Logistic曲线回归的分析

15.3.1参数估计

15.3.2参数近似的置信区间

15.3.3用Logistic曲线预测人口

15.4负指数生长曲线回归

15.5分析负指数生长曲线

15.6拟合指数曲线Y=AeBX回归

15.6.1建立指数曲线Y=AeBX的回归模型

15.6.2分析指数曲线Y=AeBX回归结果

15.6.3指数曲线的预测

习题

第16章用Logistic过程做逻辑斯蒂克回归

16.1逻辑斯蒂克回归模型

16.2Logistic回归过程对数据的要求

16.3用“分析家”对话框做Logistic回归

16.4用编程法做逻辑斯蒂克回归

16.5假设与检验

16.6解释回归系数

16.7概率预测

16.8多分变量的编码

习题

第17章2*2维LogisticRegression回归分析

17.12*2维LogisticRegression模型

17.22*2维LogisticRegression的变量及其数据

17.3用“分析家”对话框进行2*2维Logistic回归

17.42*2维Logistic回归分析

习题

……