第十一章 - 量化资料的整理与分析
发布时间:2020-09-17 08:19来源:未知
第十一章 量化资料的整理与分析
学习目的与要求
通过本章的学习,理解量化资料谷类整理的方法;理解量化资料的基本特征;理解量化资料相关因果分析的方法。
第一节 量化资料的归类与整理
一、统计表
这是表示数字资料的一种重要方式,在对数据进行统计分类之后,一般都用统计表的方式加以表达。对数据进行分类之后,所得到的各种数量结果称为统计指标,把统计指标和被说明的事物用表格的形式加以表示就构成统计表。统计表给人一目了然、简洁清晰的印象,是心理与教育科学研究报告和教育管理部门整理数据时普遍采用的方法。一般来说统计表的构造主要包括序号、名称、标目、数字、标注等项目。统计表目前比较流行的三线表。统计的类型可以分为简单表(只列调查名称、地点、时序或统计指标名称的统计表)、分组表(只列一个标目)、复合表(有两个或两个以上标目)等三种形式。
二、统计图
就是依据数字资料,应用点、线、面、体、色彩等的描绘制成整齐而又有规律,简明而又知其数量的图形。统计图在数据的整理中占有重要的地位。一图知万言,一张简单的图形就可以把一大推数据中有用信息概况地表现出来。
(一)统计图的构成
统计图一般采用直角坐标系,横坐标用来表示事物的组别或自变量X,纵坐标常用来表示事物出现的次数或因变量Y,除直角坐标外还有角度坐标(如圆形图)、地理坐标(如地形图)等。
统计图一般包括图号及标题、图目、图形、图注四个部分
(二)统计图的种类
统计图可按形状、数字性质、图的用途等标志分为多种类别。心理与教育科学研究中常用的统计图可按形状分为条形图(主要用于表示离散型数字资料,即计数资料)、线形图(主要用于表示连续性数字资料)、圆形图(主要表示间断型数字资料)、散点图(是以圆点的大小和相同大小圆点的多少或疏密表示统计资料数量的大小及变化趋势的统计图)、直方图(用于表示连续性资料的频数分配,是统计学上常用而又有特殊意义的一种统计图)等
第二节 量化资料的特征描述
一、集中量数
为了进一步发现和表达一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字,这些数据特征称为统计特征值。统计特征值主要包括三类:一类是表现数据集中性质或集中程度的;一类是表现数据分散性质或分散程度的;在一类是指一组数据的中心位置集中趋势的度量。其中集中量数又包括算术平均数、中数、众数、几何平均数、调和平均数、加权平均数。
其中算数平均数是应用最普遍的一种集中量数,它是真值逼近的最佳估计值。它有反应灵敏、确定严密、简明易解、计算简单、符合代数方法做进一步演算、较少受抽样变动影响等优点,同时也有易受极端数据影响,若出现模糊不清数据时,无法计算平均数、不同质数据不能计算平均数的缺点。
有些教育研究中所得数据,其各部分数据重要性不同,这时若要计算平均数,就不能用算数平均数,而应用加权平均数。
集合平均数是在计算时需取对数计算,故又称对数平均数。
调和平均数因在计算中各数据先取倒数平均,然后再取倒数,故又称倒数平均数。
中数是集中量数常见一种,又称中位数,是指位于一组数据中较大一半与较小一半中间位置那个数,这个数可能是一组数据中的某一个,也可能不是。
众数又叫范数、密集数,是指在数据中出现次数最多的那个数的数值,它也是一种集中量数,用来代表一组数据集中地趋势。
二、差异量数
教育研究中实验或调查所得到的数据,大多具有随机变量的性质。对这些随机变量的描述,只进行集中趋势的度量是不够的。集中量只描述数据的集中趋势,它还不能说明一组数据的全貌,还需要描述数据的变异性特点。对于数据变异性即离中趋势进行度量的一组统计指标,称作差异量数。常见的差异量数有标准差、全距、四分差、平均差等。
全距又称两极差,用符号R表示,它表示一组数据离散程度最简单、最易理解的一种差异量数它的计算是最大数-最小数。
四分差通常用Q表示,指在一个数据分布中,中间50%的数的全距一半,也就是第一四分点与第三四分点之差的一半,它可以反应中间数据的差异,不受极端数据的影响,与全距一样不能反映全部数据的差异,代表性较差。
方差又叫变异数、均方,作为统计量常用S²表示,作为总体参数常用Q²表示,它是每个数据与改组数据平均数之差平方和的均值,即离差平方和后的平均数。标准差即方差的平方根。
三、位置量数
在教育研究中通常需要确定某一数据在一组数据中所处的地位,表示数据所处位置的统计特征值就是位置量数。常见的位置量数有百分位数、百分等级分数、标准分数、T分数等
百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位等级数是指次数分布中低于这个原始分数的次数百分比,用Pn表示,百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在常模团体中的相对位置越低。
标准分数又叫Z分数,是以标准差为单位表示一个数值在团体中所处的相对位置量数。
T分数是表示标准测验分数常见的一种位置量数,其表达公式与标准分数相类同,可看作标准分数的线性转化。
第三节 量化资料相关与因果分析
一、相关分析
事物之间有可能存在三种关系即因果关系、共变关系和相关关系。相关关系是指事物之间存在关联,不存在因果关系,也不受第三事物的影响。相关分析就是对存在相关联系的事物数量关系所做的统计分析方法。相关有三种基本类型:一是正相关,指两种变量变动的方向相同;二是负相关,是指两种变量若有一种变量变动时,另一种变量随着前一种变量相反的方向变动;三是零相关,即两种变量之间无相关关系,一种变量变动,另一种变量作无规律变动。
相关系数的取值在-1.00~1.00之间,正负号表示相关的方向,系数为0称为0相关,为1表示完全正相关,为-1表示完全负相关。
(一)积差相关
又称积距相关,是英国统计学家皮尔逊于20世纪提出的一种计算相关的方法,因而也叫皮尔逊相关,它是秋直线相关的基本方法,在教育调查和教育测量中应用十分广泛,运用积差相关应满足两个条件:一是两列变量都是测量的数据,且两列变量各自总体的分布都是正态的,二是两列变量之间的关系应是直线性关系,如果非直线性双列变量则不能计算线性相关。
(二)等级相关
在教育研究中,有时收集到的数据不是等距或等比的测量数据,而是具有等级顺序的数据,既使收集到的数据时等距或等比的数据,但不满足求积差的相关的要求,在这种情况下,就要使用等级相关。由于这种相关方法对变量总体分布不作要求,故又称这种相关法为非参数的相关方法,常用的斯皮尔曼等级相关和肯德尔等级相关。
(三)质量相关
在相关分析中,若一列变量为等比或等距的测量数据,另一列变量是按性质划分的称名变量,求这样两列变量的相关,称之为质量相关。它主要包括点二列相关、二列相关和多系列相关。
(四)品质相关
是指两个变量分别按照其性质划分为性质不同的称名变量。品质相关的数据一般都是计数的数据,而非测量的数据。品质相关依二因素的性质及分类项目的不同,有不同的名称和计算方法,常见有四分相关和Ø相关。
二、回归分析
在许多教育研究中,常常需要确定变量间的因果关系,用一个数学模型来表达,并由已知变量预测未知变量的过程就叫回归分析,简称回归。回归分析应用非常广泛,不但适用于实验数据,还能分析未作实验控制的观测数据或历史资料。
(一)相关与回归的关系
回归与相关有区别也有联系。相关表示两个变量之间双方向的相互关系,而回归表示一个变量随另一个变量变化的单方向关系。
(二)回归线与回归方程式
变量间的相互关系可以用拟合的直线或曲线来表示,这就是回归线,确定回归线的方程式为回归方程。
学习目的与要求
通过本章的学习,理解量化资料谷类整理的方法;理解量化资料的基本特征;理解量化资料相关因果分析的方法。
第一节 量化资料的归类与整理
一、统计表
这是表示数字资料的一种重要方式,在对数据进行统计分类之后,一般都用统计表的方式加以表达。对数据进行分类之后,所得到的各种数量结果称为统计指标,把统计指标和被说明的事物用表格的形式加以表示就构成统计表。统计表给人一目了然、简洁清晰的印象,是心理与教育科学研究报告和教育管理部门整理数据时普遍采用的方法。一般来说统计表的构造主要包括序号、名称、标目、数字、标注等项目。统计表目前比较流行的三线表。统计的类型可以分为简单表(只列调查名称、地点、时序或统计指标名称的统计表)、分组表(只列一个标目)、复合表(有两个或两个以上标目)等三种形式。
二、统计图
就是依据数字资料,应用点、线、面、体、色彩等的描绘制成整齐而又有规律,简明而又知其数量的图形。统计图在数据的整理中占有重要的地位。一图知万言,一张简单的图形就可以把一大推数据中有用信息概况地表现出来。
(一)统计图的构成
统计图一般采用直角坐标系,横坐标用来表示事物的组别或自变量X,纵坐标常用来表示事物出现的次数或因变量Y,除直角坐标外还有角度坐标(如圆形图)、地理坐标(如地形图)等。
统计图一般包括图号及标题、图目、图形、图注四个部分
(二)统计图的种类
统计图可按形状、数字性质、图的用途等标志分为多种类别。心理与教育科学研究中常用的统计图可按形状分为条形图(主要用于表示离散型数字资料,即计数资料)、线形图(主要用于表示连续性数字资料)、圆形图(主要表示间断型数字资料)、散点图(是以圆点的大小和相同大小圆点的多少或疏密表示统计资料数量的大小及变化趋势的统计图)、直方图(用于表示连续性资料的频数分配,是统计学上常用而又有特殊意义的一种统计图)等
第二节 量化资料的特征描述
一、集中量数
为了进一步发现和表达一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字,这些数据特征称为统计特征值。统计特征值主要包括三类:一类是表现数据集中性质或集中程度的;一类是表现数据分散性质或分散程度的;在一类是指一组数据的中心位置集中趋势的度量。其中集中量数又包括算术平均数、中数、众数、几何平均数、调和平均数、加权平均数。
其中算数平均数是应用最普遍的一种集中量数,它是真值逼近的最佳估计值。它有反应灵敏、确定严密、简明易解、计算简单、符合代数方法做进一步演算、较少受抽样变动影响等优点,同时也有易受极端数据影响,若出现模糊不清数据时,无法计算平均数、不同质数据不能计算平均数的缺点。
有些教育研究中所得数据,其各部分数据重要性不同,这时若要计算平均数,就不能用算数平均数,而应用加权平均数。
集合平均数是在计算时需取对数计算,故又称对数平均数。
调和平均数因在计算中各数据先取倒数平均,然后再取倒数,故又称倒数平均数。
中数是集中量数常见一种,又称中位数,是指位于一组数据中较大一半与较小一半中间位置那个数,这个数可能是一组数据中的某一个,也可能不是。
众数又叫范数、密集数,是指在数据中出现次数最多的那个数的数值,它也是一种集中量数,用来代表一组数据集中地趋势。
二、差异量数
教育研究中实验或调查所得到的数据,大多具有随机变量的性质。对这些随机变量的描述,只进行集中趋势的度量是不够的。集中量只描述数据的集中趋势,它还不能说明一组数据的全貌,还需要描述数据的变异性特点。对于数据变异性即离中趋势进行度量的一组统计指标,称作差异量数。常见的差异量数有标准差、全距、四分差、平均差等。
全距又称两极差,用符号R表示,它表示一组数据离散程度最简单、最易理解的一种差异量数它的计算是最大数-最小数。
四分差通常用Q表示,指在一个数据分布中,中间50%的数的全距一半,也就是第一四分点与第三四分点之差的一半,它可以反应中间数据的差异,不受极端数据的影响,与全距一样不能反映全部数据的差异,代表性较差。
方差又叫变异数、均方,作为统计量常用S²表示,作为总体参数常用Q²表示,它是每个数据与改组数据平均数之差平方和的均值,即离差平方和后的平均数。标准差即方差的平方根。
三、位置量数
在教育研究中通常需要确定某一数据在一组数据中所处的地位,表示数据所处位置的统计特征值就是位置量数。常见的位置量数有百分位数、百分等级分数、标准分数、T分数等
百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位等级数是指次数分布中低于这个原始分数的次数百分比,用Pn表示,百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在常模团体中的相对位置越低。
标准分数又叫Z分数,是以标准差为单位表示一个数值在团体中所处的相对位置量数。
T分数是表示标准测验分数常见的一种位置量数,其表达公式与标准分数相类同,可看作标准分数的线性转化。
第三节 量化资料相关与因果分析
一、相关分析
事物之间有可能存在三种关系即因果关系、共变关系和相关关系。相关关系是指事物之间存在关联,不存在因果关系,也不受第三事物的影响。相关分析就是对存在相关联系的事物数量关系所做的统计分析方法。相关有三种基本类型:一是正相关,指两种变量变动的方向相同;二是负相关,是指两种变量若有一种变量变动时,另一种变量随着前一种变量相反的方向变动;三是零相关,即两种变量之间无相关关系,一种变量变动,另一种变量作无规律变动。
相关系数的取值在-1.00~1.00之间,正负号表示相关的方向,系数为0称为0相关,为1表示完全正相关,为-1表示完全负相关。
(一)积差相关
又称积距相关,是英国统计学家皮尔逊于20世纪提出的一种计算相关的方法,因而也叫皮尔逊相关,它是秋直线相关的基本方法,在教育调查和教育测量中应用十分广泛,运用积差相关应满足两个条件:一是两列变量都是测量的数据,且两列变量各自总体的分布都是正态的,二是两列变量之间的关系应是直线性关系,如果非直线性双列变量则不能计算线性相关。
(二)等级相关
在教育研究中,有时收集到的数据不是等距或等比的测量数据,而是具有等级顺序的数据,既使收集到的数据时等距或等比的数据,但不满足求积差的相关的要求,在这种情况下,就要使用等级相关。由于这种相关方法对变量总体分布不作要求,故又称这种相关法为非参数的相关方法,常用的斯皮尔曼等级相关和肯德尔等级相关。
(三)质量相关
在相关分析中,若一列变量为等比或等距的测量数据,另一列变量是按性质划分的称名变量,求这样两列变量的相关,称之为质量相关。它主要包括点二列相关、二列相关和多系列相关。
(四)品质相关
是指两个变量分别按照其性质划分为性质不同的称名变量。品质相关的数据一般都是计数的数据,而非测量的数据。品质相关依二因素的性质及分类项目的不同,有不同的名称和计算方法,常见有四分相关和Ø相关。
二、回归分析
在许多教育研究中,常常需要确定变量间的因果关系,用一个数学模型来表达,并由已知变量预测未知变量的过程就叫回归分析,简称回归。回归分析应用非常广泛,不但适用于实验数据,还能分析未作实验控制的观测数据或历史资料。
(一)相关与回归的关系
回归与相关有区别也有联系。相关表示两个变量之间双方向的相互关系,而回归表示一个变量随另一个变量变化的单方向关系。
(二)回归线与回归方程式
变量间的相互关系可以用拟合的直线或曲线来表示,这就是回归线,确定回归线的方程式为回归方程。