SPSS统计
第二章 认识SPSS SPSS数据窗口 SPSS变量窗口
2010-11-19
SPSS统计
2.1 SPSS数据文件 2.1.1 SPSS数据文件的特点: SPSS是一个有别 于其他文件的特殊格式的文件,SPSS数据文件是 一种有结构的数据文件,它由数据结构和内容两 部分组成,其中的数据结构记录数据变量的名称、 类型、变量宽度、小数位数、变量名标签、变量 值标签、缺失值、显示宽度、对齐方式和度量尺 度等必要信息,数据的内容才是那些待分析的具 体数据。 基于上述特点,建立SPSS数据文件时应完成两项 任务,即描述数据的结构和录入编辑数据。2
SPSS统计
2.1.2 SPSS数据的组织方式 (1)原始数据的组织方式 数据编辑窗口中的一行称为一个个案或记 录(Case),所有个案组成SPSS数据文 件的内容。数据编辑窗口的一列称为一个 变量(Variable),每个变量都有一个名字, 称为变量名,它是访问和分析SPSS每个变 量的唯一标志。 SPSS数据文件的结构就是 对每个变量及相关特征的描述。3
SPSS统计
2.2 SPSS数据的结构和定义方法SPSS数据的结构是对SPSS每列变量及其 相关属性的描述,主要包括变量名、数据 类型、变量宽度、变量名标签、变量值标 签、显示宽度、缺失值、对齐方式、度量 尺度等信息。
SPSS统计
变量名(Variable name)变量名是变量访问和分析的唯一标志。在定义 变量名是变量访问和分析的唯一标志。在定义SPSS数据 数据 结构时应首先给出每列变量的变量名。变量的命名规则如下: 结构时应首先给出每列变量的变量名。变量的命名规则如下: 1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字 母或数字。下划线、圆点不能为变量名的最后一个字符。 SPSS允许用汉字作为变量名。 2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字, 如VAR00001,VAR00012等。变量名不能与SPSS内部特有的 具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR 等(输入)。 4.变量名最好与其代表的数据含义相对应,每个变量名必须具有 唯一性。(输入)5
SPSS统计
数据类型(Type)数据类型是指每个变量取值的类型。SPSS中 有三种基本数据类型:数值型、字符型和日期型。数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) 字符型( 字符型(String) ) 日期型( 日期型(Date) )6
SPSS统计
数值型数值型是SPSS最常用的数据类型,通常由 阿拉伯数字和其它特殊符号等组成。其中的标 准型(numeric)是SPSS默认的数据类型,默 认的显
示宽度为8位,包括正负符号位、小数 点和小数位在内,小数位默认为2位。如果数 据的实际宽度大于8位(1111.1111) ,SPSS将 自动按照科学计数法显示,数据的显示并不影 响数据的存储,也不影响数据的计算。7
SPSS统计
字符型(String)字符型也是SPSS较常用的数据类型, 由一个字符串组成。如职工号码、姓名、地 址等变量都可以定义为字符型数据。字符型 数据的默认显示宽度为8个字符,不能够进 行算术运算,并区分大小写字母。字符型数 据在SPSS命令处理过程中应用一对双引号 括起来,但在输入数据时不应输入双引号, 否则双引号将会作为字符型数据的一部分。8
SPSS统计
日期型(Data)日期型数据用来表示日期或者时间,如生 日、成立日期等变量可以定义为日期型数据。 显示格式:dd-mm-yyyy;mm/dd/yyyy。
SPSS统计
变量宽度(Width)、显示宽度(Columns) 每种类型的变量都有自己的变量宽度、小数 位和显示宽度,其中变量宽度是变量允许的 最大字符位数,列宽度是数据编辑窗口中显 示每列的字符位数。通常这两个宽度是一致 的。
SPSS统计
变量名标签(Variable label)变量名标签是对变量名含义的进一步解 释说明,它可以增强变量名的可视性和统计 分析结果的可读性。变量名标签可用中文, 总长度可达120个字符,但在统计分析结果 的显示中一般不能显示如此长的变量名标签 信息。
SPSS统计
变量值标签(Value label)变量值标签是对变量取值含义的解释说 明信息,对于品质型数据尤为重要,比如1 代表男性,2代表女性,它不但明确了数据 的含义,也增强了最后统计分析结果的可读 性,变量值标签可以用中文。 练习: 输入年级:大一—大四12
SPSS统计
缺失数据(Missing values)数据中存在明显错误或明显不合理的数据或漏 填数据项时统计学上称为不完全数据或缺失数据。 数据中如果存在缺失数据,分析时通常不能直接采 用,要进行说明。SPSS中说明缺失数据的方法是 指定用户缺失值。这样,SPSS在分析时,就能够 将这些缺失值与正常的数据区分开来,并依据用户 指定的缺失值处理策略对其进行处理或分析。 SPSS还有一类默认的缺失值,称为系统缺失值, 数值型变量用圆点表示,字符型用空格表示。13
SPSS统计
SPSS中说明缺失数据的基本方法是指 定用户缺失值。用户缺失值可以是:o对字符型或数值型变量,用户缺失值可以 是1至3个特定的离散值(Discrete missing values); o对一个数值型变量,用户缺失值可以在一 …… 此处隐藏:530字,全部文档内容请下载后查看。喜欢就下载吧 ……