社会统计学

描述社会现象数量关系的工具性学科。既指与社会现象有关的实际数据的搜集,也指统计分析方法在社会研究中的运用。前者通常称作社会统计,后者称社会统计分析

简史

统计一词来源于拉丁语“status”,含有国家的意思。最初指的是用文字来描述国家,后来发展为专指用数字来反映国情。在中国,原始形态的统计可追溯到公元前2100年左右的大禹治水时代。在西方,原始形态的统计,可追溯到公元前3050年埃及建造金字塔时,对全国人口财产所进行的普查及罗马二世对埃及土地所进行的调查。这是最早的社会统计。直到17世纪,统计主要集中在对有关国家的政治、社会和经济状况的资料的搜集和对这些资料的文字与图表描述,未涉及统计理论,只表现为纯粹哲学形态的统计分析。17~18世纪,欧洲各国,其中主要是英国的政治算术派对生命统计、保险统计和经济统计所作的部分数学研究,使得统计研究具有浓厚的社会学色彩。19世纪概率论的思想被引入统计研究,形成了数理统计学派,使统计学发展成为一种可应用于任何科学的一般方法。19世纪末以来,概率理论获得极大发展,并成为现代统计的基础,使社会统计学从纯粹的数据搜集和现象描述,发展为一种分析性的科学。社会统计学也从社会统计发展为社会统计分析。

社会统计

它的范围很广,包括一切与社会状况、社会发展和研究有关的统计。不仅包括经济状况,如人口与劳动、生产力水平、国民财富等;亦包括意识与行为状况,如越轨行为、社会参与、闲暇时间的分配等。有对物质领域的直接计量,如自然资源、居民的收入与消费;也有对非物质领域的间接性计量,如预期寿命、死亡率等。

中国政府为了使社会统计工作规范化,国家统计局于1983年制定了《社会统计指标体系》(草案)。所列的社会统计指标按社会条件、社会结构、人民的物质生活和文化生活、社会主义民主与法制等方面,分13个大类:

(1)自然环境;

(2)人口与家庭;

(3)劳动;

(4)居民收入与消费;

(5)劳动保险与社会福利;

(6)住房与生活服务;

(7)教育与培训;

(8)科学研究;

(9)环境与生态保护;

(10)文化与体育;

(11)生活时间分配;

(12)社会秩序与安全;

(13)政治活动与社会活动参与情况。

社会统计工作的目的在于定期公布社会生活各方面数量规律的情报,供决策部门和研究部门使用。社会学工作者利用这些公布的资料,可以进行广泛的社会研究。例如,利用统计资料进行社会指标间的横剖研究和纵贯研究;利用社会指标的合成形成社会研究中更为有效的变量;社会统计指标还是进行其他社会研究的宏观背景材料;标准化的社会指标不仅可以进行地区之间的比较,还可进行跨国之间的比较,如有关家庭结构、宗教、道德、时间利用等方面的比较,可以得到许多一国、一地所不能得到的研究成果。社会统计工作常用的方法有大量统计观察法、分类法、平均数法、指数法、平衡法和图示法。

社会统计分析

有关社会资料搜集、整理、分析和推论的一整套科学方法。它渊源于概率论,是运用随机现象的规律性对社会进行经验性的研究,是数理统计学在社会研究领域中的应用。与医用统计学、教育统计学、体育统计学、卫生统计学等专门领域的统计学相比较,社会统计分析有如下特点:

(1)从社会资料特点来看,不仅有定距变量,而更多的是定类变量和定序变量。定类和定序变量的统计分析方法在社会统计分析中占有重要的地位。

(2)搜集社会资料所调查的对象往往是人,人是具有主观意识的,因此资料的真实性、问卷的信度和效度以及样本中问卷的回收率都是社会统计分析要注意的问题。

(3)对于统计结果的社会学分析难度较大,例如因子分析中所提取的公因子,有时很难找到恰当的实际意义。研究者的学术造诣和经验,对于做到清晰、自由地往返于经验层次和理论层次,赋予数理统计结果现实的、恰当的实际意义,有着很大的关系。

统计分析内容可根据资料的搜集方式、变量数目以及变量的层次来划分。如果资料搜集方式遍及研究现象的全体,则采用统计描述技术。统计描述对于单变量来说,在于精确描述所要研究的概念或变量的全貌,以及典型集中特征和分散特征。其中,通过分布来研究变量的全貌;通过众值、中位值和均值指出变量分布的典型集中特征;通过异众比率、四分位差、极差和标准差来描述变量分布的分散特征。对于两个变量以上的统计描述来说,还要研究变量与变量间关系的内容以及关系的密切程度。为了弄清变量间关系的内容,常用回归分析、路径分析、因素分析等技术,而变量间关系的密切程度则用相关系数测定。早期的测定法常因变量层次而异,现在社会学中多采用消减比例误差 (PRE)测定法,它适用于所有层次变量间相关系数的测定。公式为

公式 符号

式中E1为不知X值,预测y值时的全部误差;E2为知道X值后,预测y值时的误差。

PRE数值愈大,变量xy的关系愈强(见相关分析)。

使用统计推论技术,要注意以下几方面:

(1)抽样必须是概率抽样,否则不能使用统计推论技术。问卷回收率低的概率抽样,同样不能使用统计推论。

(2)任何统计推论方法都不是万能的,在使用时,不能忘记各种方法所要求的假定。例如同是定类一定距变量的研究,如果根据自变量所分类别,因变量不能满足正态分布时,则不能采用方差分析法,而需改用非参数检验法。误用统计技术,会把问题的研究引入歧途。

(3)各种统计技术都是针对一定的变量层次而言的,选择统计公式要根据变量的层次来定。

(4)如果对变量的研究,不限于变量本身,还要研究多个变量间的相互联系和因果关系,则须采用多元分析技术。多元分析中,变量间相关程度的测定,仍是研究的基本内容。

根据资料搜集方式、变量数目和变量层次,对社会统计分析的分类图式如下。

图
参考书目
  1. H.M.布莱洛克著,傅正元等译:《社会统计学》,中国社会科学出版社,北京,1988。(Hubert M. Blalock,Sociɑl Stɑtistics,McGran-Hill,New York,1979.)