大规模网络调查的规划与管理

摘要:该文主要着眼于大规模调查项目的规划、管理以及安全方面的议题。包括调查技术支持方式,以及网络调查项目的规划人员的协调。从基本的技术到调查管理系统,到对调查分组管理,再到调查现场的应急处置方案,最后是数据安全议题。

关键词:网络调查技术支持调查管理系统。

● 引言。

网络调查在社会科学研究中已经成为很重要的数据收集手段[1],但包括教育研究在内的社会科学领域,许多的研究人员还不太了解网络调查的具体情况,使得他们遗憾地错过了这种获取数据的有力手段。当然也有许多研究者,虽然愿意使用但由于无法获得合适的技术支持而不能使用这种手段。本文主要介绍如何规划和管理较大规模网络调查项目。笔者写作本文的初衷是总结本次调查活动中技术支持方面的经验和教训,以资其他相关机构、组织及个人参考使用。

无论以何种手段进行调查,其目的都是收集数据。考虑到调查手段的成本和效益,相比于其他调查手段,基于网络调查具有明显的优势,而且通过网络问卷收集的数据同样有效和可靠。[2]由于整个社会的发展进步,遍及全国的宽带网络的逐渐普及,各行各业信息化水平的不断提高[3],笔者开始认真考虑是否采用网络展开全国范围内的问卷调查,综合考虑成本与效益以及基础设施的保障,本次调查最终以网络为主要媒介传送、呈现和回收问卷

网络调查规划

调查规划与组织是课题组的职责,但技术支持方必须去了解这些并从技术的角度提出意见和建议供课题组考虑。大规模调查的事先规划是以后调查活动顺利开展的制度保障,事实证明,对调查手段的熟悉程度制约着规划的质量。

网络调查既得益于技术又受制于技术,因此在规划大规模网络调查时要认真考虑技术因素的这种矛盾性。规划要充分考虑:①技术手段的复杂性和脆弱性。②更多的工作在信息技术场景中进行。这里主要讨论技术支持方面的基本措施。

1.获取技术支持

对于网络调查,涉及的技术因素比较多,一些研究者要么由于对技术手段比较陌生而忽视了这样一个可选的手段,要么在使用时并不能充分了解这种手段的优势在哪里。还有更多的研究者注意到了这种手段,也了解它的优势,但又不知道如何获取这方面的支持。取得技术支持的方式大致有三种:①购买专业调查网站的服务。②与技术支持单位(或个人)合作。[4]③自主解决。这里最可行的是第一种和第二种,第三种显然可行性不高。如果一开始就决定要长期地和系列地搞调查;或者课题组想自己掌握所有数据,控制整个调查的过程(或者其他特殊的要求),则可以考虑要么长期给予技术支持,要么自主开发(或购买)这样的系统。

2.分解任务。

大规模调查活动必须要分解任务,否则无法实施。可按照地域、受访单或者受访者群体位等原则分解任务。

3.编制技术指南。

调查开始之前编制好一份“技术支持指南”,确保参与调查的相关人员有一份详细的技术指导书面资料。这份指南可以包含在课题组的工作手册中,也可单独提供。为便于课题组与合作单位用好网络调查手段,这份指南需要对一些基本要求和操作步骤加以说明。

4.使用操作代码。

使用操作代码(Token)会增加一些工作量,但其作用很显著,应根据调查的具体情况决定是否使用操作代码。全部的操作代码及其使用情况保存在服务器上。操作代码的两个主要作用是:①受访者只有通过他持有的操作代码才能参与调查,一个代码对应一份问卷。②使用操作代码可使受访者断续地完成一份问卷,如在不同的时间和地点完成一份冗长的问卷

5.人员协调与现场管理。

组织一次集中填答并不容易,课题组要与受访单位协调好时间、场地和调查对象,还要考虑技术支持等要素。一般有三方面的人员参与集中填答调查活动:现场的受访者、现场的组织与联络人员及远程技术支持人员,后两者的任务就是保障前者在预定的时间和地点顺利完成问卷填答技术支持人员应该在集中填答开始前登录调查系统进行检查,调查开始后要及时向现场反馈进展情况。课题组在现场的人员也要直接、即时地与技术支持人员联系,双方密切合作确保调查顺利完成。分散的受访者可以自主选择合适的时间和地点分散填答。对于他们,既无法巡视和督促,也难于在完成问卷后发放纪念品,因此需要采用一些其他的手段来辅助进行。

网络调查的管理。

1.网络问卷系统的管理。

调查管理系统是网络调查的信息枢纽,由它管理着调查数据收集,包括从问卷的设计发布直至所需数据全部收集完毕为止这个期间的各项核心信息。通过设定配额(Quotas),可以自动终止已获取了预期数量的问卷调查。时间窗口的作用是使得调查只在时间窗口内进行。通过这种简单的时效控制使调查自动地在指定的时间开始和结束,时间窗口未开放或者关闭后都不能再参与调查

设置操作码则使得只有那些知道操作代码(Token)的人才能参与调查(每份问卷都有一个唯一的代码,也就是不同的人持有不同的代码),也可通过操作代码获悉具体受访者完成问卷的情况。本次调查按照实际情况被分解为若干次互不影响的独立调查分组进行。为了不使所有的调查数据都混在一起,能够清楚地知道哪些数据来自哪一次调查,使调查者能独立管理每次调查,笔者对问卷进行了复制,复制的每一份问卷就是一个分组

2.分组管理调查对象。

将所有的受访人员按照实际情况和具体需要进行分组,是做好大规模网络调查的基本保障。假如不对大规模调查进行分组,就很难对调查过程施以控制,因而也很难对调查过程进行评价。不分组也使一个调查任务过于庞大而让人不知该从哪里开始。通过分组可将一次大的调查分解为若干次小的调查,这使调查者可以仔细研究和分析调查过程中出现的各种问题,给调查过程的管理和评价带来了很多方便。

3.应急处置方案。

这里讨论的应急方案针对的是集中填答问卷的情形。通过网络进行远程调查,对基础设施的要求比较高。而往往越先进复杂的手段越脆弱,计算机网络可能是最脆弱的基础设施之一。因此,进行远距离的网络调查时不可预知的因素很多,调查者无法解决基础设施故障这一类问题。但可以提前准备一套应急预案,笔者的具体措施是将便携式服务器带到调查现场,在网络有故障或者远程服务器不可访问时直接将便携服务器接入本地局域网,通知现场人员从新的网络地址进入。可以设想一种最坏的情况,如大面积停电或网络中断(虽然本次调查中没有遇到)。这时可拿出事先预备好的纸质问卷,仍然可以保证调查的完成。

4.与技术支持人员的沟通。

课题组不一定了解相关的技术,技术支持人员也不一定了解课题组的特定需求。显而易见,如果双方没有好的沟通就会使得调查既不能充分发挥网络和计算机在技术上的优势,也不能完全展现课题组的意图。为了避免此类情况发生,调查者首先应让技术人员尽早参与到课题组的讨论中,同时技术人员也应该积极发表意见和建议。在调查进行的过程中,技术支持人员要及时将服务器上的调查进展信息和发现的问题告知课题组课题组也要及时地了解调查进展和收集到的数据的状况。总的原则是双方都应主动向对方咨询或讲解相关信息。

数据安全。

网络调查系统的管理者有两项重要的职责:①保护数据的安全。数据来之不易,特别是对原始数据必须牢靠地加以保护。对每一次完成的调查,应及时地将其数据归档并备份保存。②保持数据的完整统一。电子信息来无踪去无影,面对一次庞大而复杂的调查,应避免因规划和管理不善而丢失数据或者造成混乱。

1.中途修改问卷

只要简单地在服务器上修改就能够很容易地更新问卷而不必重新印刷问卷,这是网络调查手段的一个优势。修改正在运行的问卷,必须注意到修改后的问卷结构或内容已发生了变化,特别是在结构上的变动。因此,调查者在修改前已经收集到的数据将不能够与修订后的问卷相匹配,会给数据的录入、统计带来麻烦。这些需要调查者在汇总数据时单独加以处理,应特别予以留意。

2.记录调查信息。

由于调查分组开展的,因此应建立调查信息表,严格记录调查分组情况和其他的所有重要信息(包括问卷的编号、问卷的类型、开始时间、结束时间、地点或单位名称、联络人、受访者人数、有效问卷的数量及未完成问卷的数量),这张表是保证调查数据完整统一的依据。另外,调查者还应将维护和管理调查系统的过程记录下来,同时也应把调查过程中的一些主要的进展信息定期地向课题组发布简报。

3.备份和集中存放数据

服务器上的数据库内存储着有关调查问卷的所有重要信息,其中最重要的是问卷本身和收集的数据。为了保险起见可对数据库进行备份。第一种备份方式是定时自动备份,如设置服务器每天凌晨自动备份数据库。第二种备份方式是手动备份,即不定时地手工操作备份。自动备份可使损失局限在一天以内,但是每天采集进来的数据量可能差异非常大。所以在完成一次集中填答后,就应该马上备份数据。如果使用了不止一台服务器,或者启用了应急方案,则回收的数据有可能分散在不同的服務器上。因此,调查者必须将分散于不同服务器上的同一次调查数据合并起来。

4.未完成的问卷

问卷填答过程中受访者若中途放弃就会形成未完成的问卷。即便是在所有受访者都完成问卷的时候还会产生未完成的问卷。必须注意的是有一些未完成问卷是由无关人员提交的,如课题组/技术支持人员做测试,或者完全是由一些偶然撞上的人出于好奇而随便填答,然后放弃而产生的。

● 结论与讨论。

调查的结果来看,由于问卷的设计发布与数据收集高度定制化,也由于组织协调得力,因而调查过程始终高度可控,所以问卷回收及数据汇总工作完成得比较好。课题组按照自己的调查方案将大规模调查分解为若干小的调查。这些小的分组调查可以逐个进行,也可几个同时进行,依课题组的人力和计划而定。这样的分组虽然会提高管理的灵活性但也会增加管理的复杂性。分组时还须考虑调查是有组织的集中填答或者是自主分散填答。这两种分组在管理上是不同的,一定程度上也增加了管理的复杂性。

服务器数据采集的中心节点,在服务器上采用什么样的调查系统,由什么样的人来维护和管理,决定着数据收集环节的成效。课题组在当地开展调查时要有应急方案。数据是宝贵的,对系统的各种操作应慎之又慎,多用户的系统要控制好权限。技术支持人员应该编制一份任务总表,记录各项任务的具体信息和状态,、课题组的各种要求等。操作代码唯一地对应着一份具体的问卷。如果是匿名调查,就要确保不能从问卷反查到那位受访者。

需要强调的是,本文采用的数据和经验基于一次大范围的有上万人参与的教育调查活动,讨论的内容主要局限在技术支持方面。从普遍意义上讲,笔者在本文讨论的这种技术支持模式比较适合大型(系列)的调查研究项目。

参考文献:

[1]V. Vehovar,K. Lozar Manfreda,Nigel Fielding,Raymound M. Lee, Grant Blank.The SAGE Handbook of Online Research Methods [M].London: SAGE,2008:177—194.

[2]Victoria Klug.Cooking Appliance Use in California Homes Data Collected From a Web—Based Survey[R].Lawrence Berkeley National Laboratory, 2012.

[3]宋周莺,刘卫东.中国信息化发展进程及其时空格局分析[J].地理科学.2013(03).

[4]Kristin Lovejoy, Susan L. Handy, Cliff Contreras. Results of the 2008—09 Campus Travel Survey[R].Institute of Transportation Studies, University of California, Davis, 2009.

1 次访问