当前位置: 首页 > 农村研究 > 相关学科

“元假设”:社会调查问卷的灵魂

作者:潘绥铭 黄盈盈 王 东  责任编辑:网络部  信息来源:《学术界》  发布时间:2017-09-10  浏览次数: 965

【内容提要】“元假设”是一切问卷设计的基础与灵魂,也是目前社会调查方法论中最缺乏论述、在问卷设计中最容易失误的方面。人类社会的一切现象其实都是“光谱式地”存在着,而我们所设计出来的任何一个问卷,都是在使用我们所创造的各种“界定”来裁剪社会。因此我们必须首先确定社会现象的“两极”,斟酌我们客观存在的“排除”,避免出现调查内容上的误导。

【关键词】社会调查;问卷设计;社会学研究;假设


关于问卷调查的分类,国内的教科书与学术著作有过很多探讨与成果,基本上是按照调查的操作形式来划分的,例如直接面访的问卷调查、电话调查、网上调查等等。也有些学者提出了另外一种问卷调查分类的标准,就是从调查的内容及其深入程度的角度来进行分类。可是在目前中国,最大的问题并不是人们不知道这些分类方法,而是还缺乏这样一种意识:社会学的、专业的或者学术的问卷调查与普通的、一般的问卷调查必须有一个清晰的分野,必须有不同的判定标准。否则,许多社会学的专业调查就会由于标准不清而跌落到非专业的甚至是业余的水平上去,从而拉低整个社会学专业调查的水平。反之,如果标准不清,社会学的专业人员也会对某些非专业的问卷调查过多挑剔,不利于非专业人员使用问卷调查这个有益的工具。

这个问题在目前的中国尤其重要。最近以来,各式各样的问卷调查在数量上迅猛增加。其中,非社会学专业的调查不但占到了大多数而且其中很多调查根本就不具有任何社会学的意义。可是,问题的症结并不在于操作层次的“调查质量”的高低,而在于我们没有提出,人家也就不可能知道,社会调查的内部还存在着不同的性质之分,因此也就无法在某个特定的界定之内来讨论“调查质量”这样的问题。面对这样的中国现状,现有的各种根据操作形式或者调查内容来分类的方法基本上还不能从性质上来区别专业与非专业的调查,结果也就缺乏了对于非专业调查提高质量的指导意义。在本文中,我们试图主要依据自己的调查经验与教学实践,从性质上来划分两种不同的问卷调查,以便不同的调查者在不同的界定之内来讨论问题。

一、调查一个现象就是提出一个“元假设”

1、现象需要定义

社会调查的教科书都会告诉我们:无论什么类型的问卷,在设计的时候都必须对自己所要调查的现象进行定义。这至少包括如下两个方面。

第一个方面,对现象本身进行定义。例如我们的性调查首先需要定义:什么现象属于“性”这个范畴。我们的定义并不表现为问卷中的某个具体的提问,却体现在所有提问汇合而成的总体中。也就是说,我们认为我们所询问的那些现象都是属于“性”的。

此外,在问卷中的许多问题上,还可以表现出我们对于“性”的定义的不同层次。例如我们之所以要分别地询问“异性全身按摩”、“接受三陪服务”、“网上看黄”等等情况,不仅仅是因为我们需要了解这些方面的实际情况,更是因为我们认为它们属于“性行为”的不同层次,所以不可以混同起来调查。反之,我们没有调查比接吻更加轻微的人际接触(例如勾肩搭背等等),这就表明我们至少在这个问卷里认为,接吻才是“性”的最初层次。

第二个方面,确定该现象的时空范围。在我们的问卷里,大多数提问都有一个很啰嗦的前提:“在XX个月之内”或者“只有XX情况下的才算”。这就是对于该现象的时空的限定。社会调查的教科书也告诉我们了,这是必不可少的,否则就很容易把仅仅存在于一定时空之内的现象误以为是永恒的与普适的。

2、定义就是“元假设”

这样说,有认识论上的依据。我们必须时刻牢记:人类的一切现象都是光谱式的存在,没有任何固有的边界或者分层,因此也就不可能具有任何天然存在的定义。我们的问卷调查其实就是试图去量化地测量这个光谱式的存在,因此我们不得不使用一些自己发明出来的测量工具,即问卷中的各种“定义”。它们是先于调查结果而出现的,在我们设置于问卷之中的时候无法判定其正确程度,因此它们都仅仅是一种假设,一种对于我们所要调查的现象的预先的界定。

元假设包含两个方面的意思。第一个方面是“对于真实性的元假设”,就是我们认为光谱式存在的该现象中应该存在着我们所设置的这种界定,我们仅仅是不知道它的分布状况而已。例如我们如果调查“同性恋者”而且不得不给出其定义是“只跟同性的人做爱的人”,那么就等于我们认为人类中不仅应该存在着这样的“同性恋者”,而且“同性恋者”就应该仅仅是这样。第二个方面是“对于适用性的元假设”,就是认为我们所设置的各种“定义”(测量工具)足以对我们所调查的光谱式存在的该现象进行足够精确的测量。例如我们既然设置了“同性恋者”的定义,那么就是说,使用“只跟同性的人做爱的人”这个定义进行测量的结果(无论是绝对数、百分比还是分布状况)都是准确的。

元假设的上述两个方面,在问卷设计的实践中往往可以合二为一地进行考虑。可问题的关键是,光谱式存在的该现象究竟是不是我们所描绘的这样呢?我们的测量工具究竟是不是足够合适呢?这些都不可能在调查结果出来之前知道;因此,我们的任何定义就都只能是假设,是猜想,是先入为主。只不过由于定义是问卷之根,所以我们也可以称之为“元假设”。可惜目前的文献对于问卷中所体现出来的这样的“元假设”进行论述的尚且不多;对其进行检验的研究成果就更少。其实我们是可以做到的。例如某个调查发现“同性恋者”的比例过于出乎人们的日常经验;那么除了其他因素之外,我们就完全可以怀疑它对于“同性恋”这个定义的元假设(包括针对真实性的与适用性的)都可能出现了偏差。

总而言之,即使是最简单的普通问卷调查,其实也是建立在“元假设”的基础之上,只不过指的是对于所要调查的现象进行的定义,而不是考虑问卷之内的各个提问之间的关系。

3、一个提问就是一个元假设

我们经常使用这样的提问方式:“您有过……情况吗?”这其实就是提出了这样一个假设:无论被调查者是什么样的人,都必定有可能出现这种情况。可是,许多情况对于许多人来说根本就是毫无可能的。结果,这样提问就有可能冒犯了被调查者的情感甚至是自尊心。如果我们去问一个云南山沟里的农民:“您去过北京吗?”他的心里会是什么感觉呢?反过来,我们在设计备选答案的时候,都知道必须涵盖一切可能性。可是,大千世界,无奇不有,我们“涵盖”之的把握究竟有多大呢?尤其是“观念调查”与“原因调查”,几乎没有涵盖的可能性。这就是我们反对进行这两种调查的主要原因。这不仅仅是“提问的设计没有考虑调查对象”的技术层面上的问题,而是由于我们还缺乏“元假设”这个清晰的概念与意识。

4、每一个字都是元假设

由于在问卷中,我们的任何一个“定义”都必须用文字表达出来,所以我们写在问卷里的每一个字,实际上都是一个元假设。整个问卷就是由不同层次的许多个元假设构建出来的。

还举上面的例子。在人们的日常语言中,“同性恋者”往往被简称为“同性恋”,没有那个“者”字,但是两者的区别非常大。“同性恋”既可以指称某种性行为,也可以指称某种性关系,还可以指称某类人。但是“同性恋者”却只能指称某类人。因此,在调查这种现象的时候,我们在问卷中究竟是写下“同性恋”还是“同性恋者”,这可就是牵一发而动全身的大事,会带来非常不同的调查结果。例如在我们2000年与2006年的全国成年总人口随机抽样调查中,有过某种“同性恋行为”的人,要远多于自认为是“同性恋者”的人。

在社会学界最常见的例子,就是收入调查中所遇到的麻烦。仅仅“收入”这两个字,我们就不得不花费数百个字来解释它的定义,尤其是它的外延。即便如此,同仁们经常会发现:争论得面红耳赤的双方,其实是因为对于“收入”的定义不同,而制定出一个多数人都能够接受的定义,又是难于上青天的事情。

不仅名词如此,动词也是如此。例如“工作”究竟说的是一种什么状况呢?老师们在寒暑假期间,究竟算不算还在该学校里“工作”呢?

我们在社会学方法课的教学实践中,经常采用这样的方法来培养学生对于“元假设”的充分意识:请解释清楚你在问卷中写下的每一个字,甚至包括标点符号。这就是提倡一种思维方式:且不论被调查者能不能明白、是不是适用;我们自己首先要知道自己在说什么、希望得到什么。

二、提出元假设,首先需要“确立两极”

意识到元假设的重要意义后,我们在问卷设计操作上就必须提出以下原则。

首先我们必须元假设出光谱的两极,就是在我们可能知道的情况下,我们认为某个现象的两个最极端的表现应该是什么样的。例如对于所谓的“同性恋”现象,早在1948年金西就提出了同性恋的光谱式的七级分类:一个极端是绝对同性恋,从来不跟异性有任何性意义上的接触,另外一个极端是绝对异性恋,从来不跟同性发生性接触。其他的种种现象都是处于这两个极端之间的某个位置上,至于研究者如何确定这个位置,这已经是第二步的问题了。也就是说,如果问卷设计者没有确立其中任何一个极端的话,那么这个问卷从一开始就已经失败了,勉强操作下去只能是劳民伤财。

这种“确立两极”的方法,必须体现在所设计的问卷中的任何一个提问所表述的任何一个概念、词汇与言外之意。因为无论我们设置了什么样的备选答案,被访者都必须根据我们的提问来回答。提问中的“两极”一变,我们所收集到的资料的含义也就跟着改变了。①所以说,无论是什么样的调查,我们必须对所要调查的现象有个大概的了解和认识,这都是在定性认识中得到的,或者在试调查中得到的。

常见的失误就是:我们对研究对象缺乏最起码的了解,在一无所知的情况下就设计问卷、进行调查。尤其是非专业工作者,往往误以为问卷就是去调查自己所不知道的情况,这是一个很初级的但是很常见的误解。

可惜,知道这一点的人还不够多。我们曾经遇到一些热情的研究者希望去调查“一夜情”、“交换性伴侣”、“虐恋”等等这些被认为是“最隐秘”的现象。可是仔细一谈却发现,他们根本不知道需要“确立两极”,因此也就假设不出来该现象的两个极端究竟是什么样。例如从“一夜情”参加者的双方关系来看,熟人甚至恋人之间的算不算?花钱买来的算不算?从持续的程度来看,时隔很久再次发生的第二次算不算?从活动的具体内容来看,除了插入之外什么都做过的算不算?这些问题都没有考虑过,怎么可能去调查这种现象呢?此外,他们也没有发现自己的逻辑矛盾:既然是“最隐秘”的现象,那么我们事先就提出一个很好的元假设的可能性究竟有多大呢?结果,我们只好劝告他们不要去调查。

三、元假设:写上一个就是排除许多

提出“元假设”这个概念的重要性还在于,它可以帮助我们树立这样一种意识:我们问卷中所写上的任何一个定义,都意味着除此之外的任何情况我们都不予调查,哪怕它再重要也罢。这就是排除,而且我们所排除掉的,一定比留下来的要多得多。也就是说,在问卷中我们每写下一个提问、选项、概念、词汇、标点符号,就意味着我们已经排除了或者舍弃了其他的许许多多的相似的或者相反的内容。那么我们究竟排除了什么呢?应该不应该排除呢?排除得合适不合适呢?这些我们都必须考虑,而且应该能够清楚地说出来。

例如我们在“性调查”中没有询问“主动强奸他人”的任何问题,这就表明我们认为,这不属于性的范畴之内。②表面上来看,这是为了使得我们所了解到的情况更加精确;其实它们渗透着另外一层意思,除此之外的任何情况我们都不去了解,因为它们不符合我们的定义。

例如在调查“农民工来源”的时候,如果问“你的家乡在哪里”,就等于假设他们都是来自家乡的,就排除了那些云游打工的、曾经迁移过的人,尤其是外嫁的女性。再如问卷中的“性别”这个提问往往仅列出“男”与“女”这两个选项。这就意味着问卷设计者不准备考察“变性人”、“跨性别者”等这些人的情况。

这样的设计不存在“对不对”的问题,而是这样的排除是不是适合于所要调查的现象,是否足以实现自己的调查目标。尤其是设计者自己是否考虑过这些问题。如果说“性别只问男女”很可能适用于大多数“非性的”问卷,但是“家乡”这个提问,如果设计者说不出自己究竟排除了什么,说不出排除它们的道理,那么问卷设计就是不合格的,哪怕其他方面设计得非常好也罢。

四、调查内容的元假设可能成为一种诱导

2007年11月15日截止,中国的各大门户网站都开展了“国家法定节假日调整草案网上调查”,大约155万网民参加了此项调查。其内容如下:

1.对于将国家法定节假日总天数由10天增加到11天,您的态度是:(支持、反对、无所谓;下同)

2.对于将“五一”国际劳动节调整出的2天和新增加的1天用于增加清明、端午、中秋三个传统节日为国家法定节假日,您的态度是:

3.对于保留“十一”国庆节和春节两个黄金周,您的态度是:

4.对于将春节放假的起始时间由农历年正月初一调整为除夕(大年三十),您的态度是:

5.对于调整前后周末形成元旦、清明、国际劳动节、端午、中秋5个连休三天的“小长假”,您的态度是:

6.对于国家全面推行职工带薪休假制度,您的态度是:

7.您的职业是:

国企员工外资企业员工私企员工公务员事业单位工作人员其他

但马上就有网友发帖子指出:这是给猴子吃桃子的那个“朝三暮四”的老把戏。在这个问卷里,问卷设计者仅仅把自己所设计出来的调整方案拿出来,一个一个地问大家是否同意;根本就没有设置任何其他可能性。如果我反对任何调整,或认为应该再增加一些法定节日,或认为应该彻底取消任何一个黄金周,或持有问卷之外的任何看法;那么我就根本无法在这个问卷中表达我的意见。也就是说,这个问卷的调查结果是事先就被预设好的,无论大家怎样回答,其统计结果一定是“几乎所有人都拥护进行调整”,差别仅在于拥护哪一种调整。即使我对每一个提问都表示反对,也并不能表达出我根本就“反对进行任何调整”这样一个态度。这就是该问卷在内容设计上的“元假设”,是一种“霸王条款”。

该网友正确地指出:“这是故意用问卷设计来蒙人,而且在帖子结尾机智地提出个课后习题:请设计一份黄世仁给杨白劳的调查问卷,要求通过问卷得出杨伯劳支持黄世仁每天强奸喜儿8次。”③这个课后习题非常好,足以写入社会学教科书,因为它深刻地揭示了“如何使用问卷设计来骗人”这样一个问题。我们可以这样设计:你赞成每天强奸9次吗?你赞成强奸7次吗?杨白劳必然是两个提问都反对,因此足以证明他赞成黄世仁每天强奸喜儿8次。其窍门在于:由于问卷根本不问“强奸行不行”这个问题,也不设置除了7次与9次之外的任何问题;所以无论杨白劳怎么回答,结果都是赞成喜儿每天被强奸8次。

上述的例子可能有些极端,但是这样的情况其实是非常普遍的。例如,绝大多数调查观念与看法的问卷,都是直接询问被调查者对于某种现象的看法,却都缺少这样的选项:“这个现象根本就不存在”或者“问卷对于这个现象的定义是错误的”。再例如,大多数调查个人收入的问卷,都没有设置“负值”,例如借钱过日子、赔本、遭难等等。这就等于设计者事先就不承认被调查者可能遇到这样的事情。结果,中国的贫穷问题的规模就被有意无意地缩小了。等而下之的某些商业调查,在询问顾客满意度的时候,居然干脆就没有“很不满意”这个选项。

这样的问卷设计与上述的例子是一样的,都是把调查内容的范围事先进行了界定。这虽然是必须的,但是如果没有在调查内容的范围这个层次上涵盖所有的可能性,那么问卷所提出的“元假设”就等于是预设了这个问卷的调查结果,因此不仅可能具有非常强烈的诱导性,而且可能成为弄虚作假,甚至可能变成明日张胆的欺骗。

五、光谱式理解是一切调查的基础

无论我们如何具体地定位一个我们所研究的现象,都必须把该现象置于我们所能确定的两个极端之中来思考与审视。这就提出了四个思考原则:首先,光谱是无限延伸的,它很可能根本就没有什么两极。只不过我们为了研究它,不得不事先就界定好这两个“两极”。否则,我们就不可能知道我们究竟要调查什么。其次,光谱是连绵不断地存在着的,本来是无法分割的。我们的一切所谓定位与分类,其实只不过是由于种种条件的限制,不得不人为地、生硬地截选了这个光谱式存在的某个区间,甚至仅仅是某些点。这绝对不等于该现象的全部,我们所截选的结果对于这个光谱也没有什么代表性。第三,无论我们如何截选光谱,我们所使用的截选标准,都是我们先入为主地人为创造出来的。无论它有多么雄厚的理论基础或者经验准备,都是一种元假设或者假设,而不是由于生活中真的存在这样的划分标准。第四,无论使用问卷调查还是定性访谈方法,我们的调查结果中的一切失误,往往都不是来自于这两种方法各自的优缺点,而是来自我们在上述的“认知光谱”与“截选区间”这两个方面的偏差。

最常见的例子就是:中国的城乡之间的人口流动是一个现象。它的两极是“根本不流动”与“根本不定居”。那么我们的研究意识到这样的两极的存在了吗?涵盖了其中的各种情况了吗?我们究竟是截选了其中的哪一个区间呢?有的社会学研究的对象,不仅在“流动人口”、“进城农民”与“农民工”这些不同的定义之间游离不定,而且从来也不解释自己为什么割舍了农村孩子上大学、市民下乡经商、农村人在城市间漂泊等等常见的现象。结果,无论得到什么样的调查结论,也只能是莫名其妙。

六、“元假设”概念的学术意义

元假设这个概念,在我国社会学界尚未明确地提出,但是它之所以重要,主要是由于以下三点:

(1)它强调了生活的第一性

我们在调查问卷中设计出来的任何一个提问,其实都是我们自己对于现实生活的先入为主的猜测与假设。因此哪怕是调查我们最熟悉的现象,我们也必须首先尽可能多地掌握现实情况及其变化,才能设计出更好的问卷与实施方案。这就是元假设这个概念的第一个重要意义。

在操作层次上,如果我们具有了元假设的意识,那么我们就不得不努力收集与消化各种可能得到的定性研究的文献资料,把他们融会贯通到问卷设计里面去;不得不百倍认真地进行甚至是多次的试调查(预调查)与修改问卷;不得不扬弃那种“从理论中找调查题目”的研究方法与调查方法;不得不走进生活而且从生活出发,而不是仅仅做书斋学者。

(2)它强调了问卷调查的“人为预设”这个根本的局限性

任何一种问卷,最主要的问题并不在于操作层次上适合于调查什么和不适合于什么;而在于认识论层次上的一个根本问题:我们的每一个提问其实都是人为地、预设地去剪裁生活。这就是问卷调查的最大局限性,也就是我们提出“元假设”的另一个重要意义。这并不是说就不应该进行问卷调查了,而是说,我们只有充分地认识到问卷调查的这个根本局限性,才能够更好地完善与发展之。

通俗地说,在我们设计出每一个提问的时候,都应该清醒地知道:现实生活其实并不是这样的,我们之所以要问这个问题以及要这样问,其实是因为我们在脑子里已经把生活给框定成某种我们所想象出来的样子了。从调查操作的角度来说,这是必不可少的,舍此就无法进行任何调查。但是从认识论的角度来说,这又是远远不够的。它不仅很可能给我们的认识带来偏差甚至是误解,而且很可能阻挡我们进一步认识所调查的现象。

因此,如果我们具有了“元假设”的意识,那么我们就更加可能全面地、历史地、动态地、情境地、互动地去看待我们自己的调查结果,就更加可能对我们的调查结果做出更加符合生活现实的解释。通俗地说,没有元假设这个工具,我们就无法设计问卷;没有元假设这种理论认识,我们就无法解释好我们的调查结果。

(3)它能够促进问卷设计者改善自己的思维方式

元假设这个概念的灵魂就是“生活是光谱式的存在,而一切界定都是我们的人为”。具有了这样的理论意识,研究者的思维方式就会更上一层楼。在我们试图考察任何一种现象的时候,首先进入我们脑海的就不再是“我对它的定义是什么”,而是“它的两极是什么”。这并不是说我们就一定要按照该现象的两极来设定我们的提问范围,而是说,一旦我们按照这个思路开始寻找某个现象的“两极”,我们就很容易发现,自己对于该现象的定义原来是多么局限与肤浅。这样,我们才能发现该现象的真实存在状态;才能衡量我们所设定的提问是否合适;才能据此做出最佳选择;才能避免在调查结果出来以后,被别人认为“其实不调查也知道”。

在我们的研究实践与教学实践中,元假设的这个灵魂屡屡使我们茅塞顿开,乃至于听到一个名词就会不由自主地想问人家“它包括最极端的情况吗”;都会去想“它的区间与截取标准是什么”。在现实生活中,这恐怕是“书呆子气大发作”,但是对于学术研究来说,这种思维习惯却获益匪浅。

 

注释:

①当然,有一种“认同提问”可以躲开“确立两极”这个问题。例如我们的性调查仅仅询问被访者是否认为自己属于“同性恋者”而没有列出“同性恋者”这个名词的定义。不过,这种“认同提问”的统计结果仅仅是“认同的比例”,绝不等于该现象的实际发生率。因此它的应用范围有特定的限制,研究者不仅必须事先精心设计好,而且必须在报告中明确指出。

②在国际上,强奸被视为暴力侵犯,而不是单纯的“性发泄”。

③来自《槽边往事》—比特海日志;网友weight加帖在“猫眼看人”【凯迪网络】,http://club2.cat898.com/newbbs/ dispbbs.asp?boardid= 1&id= 1948124.