WEB可用性测试的问题设计
三月 3rd, 2008 Ami Post in UCD探索
在可用性测试中,最主要的两个角色,一个是受测(Test Participant),另一个是测试员(Test Facilitator)。这回小兔来说说测试员(Test Facilitator)在可用性测试时应该做些什么、说些什么。
之前有翻译过Test Facilitator Guide(可用性测试开始前),那么开始之后该如何呢?这里有一篇文章,拿来作为例子说说,小兔也和自己的做法对照比较一下,好借鉴改善。
WAI Site Usability Testing Questions
原文:http://www.w3.org/WAI/EO/Drafts/UCD/questions.html
小兔翻译:http://www.amizhang.com/?p=59
文章包括了四个部分:
Pre-test Questions(测试前问题)、Participant Tasks(受测任务)、Post-test Interview(测试后访谈)和Post-test Survey(测试后问卷)。这是WAI(Web Accessibility Initiative)网站可用性测试,测试员 (Facilitator)在测试时提的问题和任务的设计。
Pre-test Questions(测试前问题)
测试前的问题是用来了解受测的,WAI的这个例子里,可以看到问题关于受测对于可及性(WAI的主要内容)的了解、平时访问的相关站点、阅读习惯、工作背景等,以及大概的心智模型。了解受测,才能在之后明白受测的行为,便于进一步分析产品的可用性问题。我们在招募受测时也会做一些甄选,但是都比较简单,而测试前提一些问题可以了解得更真实具体些。根据产品的特性,我们可以设计不同的问题。
另外,小兔把测试前的问题作为“暖场”,虽然准备问题提纲但并不严格照问。比如一次一个受测是QQ联系的,我就从他的六位QQ号聊起,询问他的网龄等等~有时甚至可以闲聊两句,让受测放松了,会表现得更自然,也比较容易Think Aloud
Participant Tasks(受测任务)
这当然是测试的主要部分。
WAI的这个例子里比较特殊的是Task1和Task2。Task1测的是网站的首页,类似的一些提问方法曾经在UPA也学到过。首页是网站给用户第一印象的关键之处,通过Task1的这几个问题可以了解到受测对于网站的大概认知;而基于WEB的浏览往往不一定居于特定的任务,所以Task2是给用户自由浏览的时间。应该说,大部分时候我们浏览网站可能也是没有什么目的的,小兔也曾愁过测试任务的问题,没想到和WAI一样的做法呢:)
之后的每个任务都设计了一个场景,让用户找寻相应的信息。意料之外的是之后的任务还有8个之多,我依然没有明白为何需要这样的数量,如果某个任务的场景和受测背景不符咋办呢?难道是8个任务里选做的?@_@
Post-test Interview(测试后访谈)
如果说测试的任务是观察受测行为的话,测试后的访谈就是了解用户的想法。经过对网站的一番体验之后,受测对网站也有了实际的了解,小兔也很喜欢在测试后问这些问题,尤其是在产品早期进行可用性测试、有较大改动空间的时候,不妨问一些开放式的问题,对于设计的改进有不错的参考作用。
Post-test Survey(测试后问卷)
这个问卷有些类似SUS,但我们可以看到不止是SUS的问题,除了评价网站的可用性之外,有一些可以用来验证是否达到我们的设计目标。比起访谈的好处是,这些的结果可以量化。不过对于小规模的可用性测试来说,这些数据缺乏科学性,仅用来参考。
发现已经写了不少关于可用性测试的文章了,放在一起可以做个“可用性测试指南”合集啦:
WEB可用性测试问题 http://www.amizhang.com/?p=59
简单经济的可用性测试 上手指南 http://www.amizhang.com/?p=48
可用性测试开始前 http://www.amizhang.com/?p=38
基于纸面原型的可用性测试 http://www.amizhang.com/?p=54

5key说:
2008年03月03日 星期一 18:02下次书友会可以增加这样一个环节。大家一起学习一下 :)
小镇说:
2008年03月03日 星期一 20:24又就着你的这两篇文章粗粗浏览了这个可用性测试的整体过程,其主要的目标用户是Web developers 找来的参与者貌似也都是和可及性相关的网络工作者 这些问题的筛选也是根据目标用户进行问题评级后的结果 所以应该不会出现“任务的场景和受测背景”不符的情况吧
对于Post-test Survey 好像看起来就是一个态度评级测验类似的东西 如果从统计学意义上来说 受个体差异影响较大 基本不具有意义 但如果从商用测验中来看 题目中多一些认知上的(以小见大,据有普适性的)少一些个人情感的如“网站使用的颜色吸引人”之类设计人员可以解决的 是不是会好一点
Ami说:
2008年03月04日 星期二 11:46@小镇
WAI的目标用户他们有个详细的例子,还是各种类型都有的呢,尤其还包括了残疾人。就算不是WAI,我们测试时候也可能遇到不同类型受测无法使用统一场景的情况吧?所以我觉得还是需要思考一下滴
至于post-test survey,同意你的观点,SUS比较科学
小镇说:
2008年03月04日 星期二 22:22这个。。。。呵呵 如果是这样的话 我们如果设置的场景或说任务 是针对在前侧中收集的基本信息 临时发挥有针对提问 这样收集到的各个task的信息是不均衡的 如果只有8个被试 那样的话 就惨了 也许很多问题都了解不到 或者不足 所以我觉得这个问题还是在测试前解决的 毕竟商业测试一次有经济的考虑在里面 所以测试的设计就是最重要的 在被试寻找和问题设置方面避免掉你说的这个问题应该是上策 而不是在测试过程中才发现某些问题不适合某些被试 而是在测试时尽量保证有问必答 这样考虑你觉如何
Ami说:
2008年03月05日 星期三 11:07恩,测试的任务设计是很关键的,根据具体情况具体分析吧
西贝说:
2008年04月12日 星期六 16:12西贝很想了解,测试在什么情况下开展呢,如何平衡测试时间呢?
奕雯说:
2008年07月29日 星期二 10:54M,你给的网址都无法链接呢,是怎么回事呢?
Ami说:
2008年07月29日 星期二 16:07@奕雯 谢谢提醒,改版之后原有的url都不对了,会陆续更新纠正