曾凡的专业课大多数都提前结业了,只要不去蹭课,他一个星期只需要上少数几节课,别的时间都可以自由支配。
别的同学没他这么变态,还是要按时去听课,这个时候项目办公室就只剩下他一个人,信息学院和艺术学院参与项目的人员在旁边的办公室。
当前主要的工作,就是在单机游戏的框架内,将各种测试题和测试小游戏融合进去,趣味性和科学性相结合,并且这些测试题和测试小游戏还要能按设定要求随机组合,不能千篇一律,完全一样的话,一个人多测几次就是截然不同的效果,那就成笑话了。
测试目的得有一定隐蔽性,降低测试者主观作假的可能,做到这一点很难,可是对曾凡来说也不是做不到,那就是几个维度测试混合,只要设计的够巧妙,一样可以识别出测试者的主观作假企图。
比如说感知力,记忆力和学习能力测试混合,主观上就很难作假,测试者不可能把每道题目都完整记忆下来,逻辑推理、表达能力、情绪稳定性混合测试也是如此,三项能力互相影响,想作假反而会造成适得其反的效果,暴露出测试者更真实的水平。
曾凡感应过很多人的思维,脑中有不同人群的思维模型,设计一个测试游戏或者测试题的时候,就会在脑中代入进行推演,确定实际效果往往八九不离十。
除了设计测试指标,测试题目以外,曾凡最主要的工作是设计多种算法模型,根据测试者的答案和游戏表现进行综合评分,这种模型的算法必须有普适性,还要有一定准确度。
刚开始测试数据很少,算法模型可能很粗糙,后续随着测试样本增加,可以不断调整完善,前提就是这个模型要设计的有前瞻性,后期如果需要很大改动,那就是失败的设计,他们前面设计的那些测评指标,测评题目可能都要推翻重来,那样浪费的时间就太多了。
这个算法模型完成,后续的样本统计分析,系统效度检验相对就容易许多了,不需要曾凡亲自主持,其他同学差不多都能做。
办公室里面只有曾凡自己,忙起来就忘了时间,直到听见外面脚步声,才发觉已经时间过了下午一点,他又错过了午饭。
他的身体比较特殊,少吃几顿也完全没有影响,忘了也就忘了,反正也没人会注意。
门声响动吕瑶拎着一个袋子走进来,将袋子放到曾凡电脑桌上,袋子里是一次性饭盒,还有一双筷子,几张餐巾纸,“又没吃午饭吧,给你带了份炒面!”
曾凡有点意外:“你怎么知道我没吃?”
“你经常不吃午饭吧,刚才碰到信息学院的刘斌,他刚从这离开去食堂,他是隔壁办公室待时间最长的,耗不过你呀,几点来你都在,对你佩服的五体投地,技术比不过你,这种拼劲也比不过你!”吕瑶笑着解释道。
“不踢球没什么体力消耗,下午多吃点就补回来了,以后不用给我带,多少钱我补给你!”曾凡掏出钱包。
“行了,一碗面而已,算我请客!”吕瑶的座位就在曾凡左手边,坐下后很快进入工作状态。
房间面积不是很大,几个人电脑桌面向墙壁摆成一排,身后就是门口和两侧的书架,书架上摆着一些经常用到的工具书,还有就是他们打印出来的设计文稿,图书馆复制的资料等等文件。
他们下午没有课,随后一个小时内,其他人也陆续的过来,办公室变得热闹起来。
原先曾凡没想过要办公室,林从云能安排免费去机房上机就行,现在不但有了办公室,每个人一台电脑,可以方便的免费上网,想偷懒都不好意思了。
现在有了初步的成果,测试平台搭建起来,林从云看了很满意他们的效率,据说正在跟学校申请增加经费,给他们项目组的同学发点补助。
测试平台需要大家共同努力一点点充实内容,设计不同的测试题、测试游戏,然后曾凡和信息学院、艺术学院的外援一起编程实现出来,每天充实一点点,按照进度再有两三个月才能对外开放测试,大规模收集数据,进一步评估和完善。
曾凡最后也没有答应姜红袖的合作邀请,据说元旦晚会上她还是放音乐表演的独舞,不过曾凡没有去看。
实际上去年的晚会他也没去看,他对大部分表演者都不熟悉,也不参与表演,学生的节目也不可能比电视上水平更高,电视节目他都不喜欢看,这种草台班子水平的表演当然更没兴趣了。
元旦过后不到半个月,就是期末考试,随后放寒假。
同学们纷纷离校,项目组只剩下曾凡一个人,他提前已经跟父母说了,今年不回家过年。
回家过年也没什么事情可做,在他看来也很没意思,家里有事他随时可以回去,与其过年回去,还不如端午前后回去帮父母收麦更实际一些。
整个寒假曾凡也没闲着,继续完善各方面项目进度,大年初一都没有闲着,只不过自己用电锅煮了一袋速冻饺子吃,走了一个最简单的过年形式。
年后开学,用了不到一个月时间,测试平台就达到了可以公开上线的标准。
曾凡申请了一个智明网的域名,作为测试平台的公开网站,名字取自道德经“知人者智,知己者明”两句话,也包含了这套认知测评系统的目标。
网站上线后,只在校园内网上面做了简单的宣传,刚开始不需要太多数据,担心服务器承载不了,很多模型还不太完善,几百人几千人的数据也够做一些初期分析了。
参与测试者,不需要注册账号,只需要选择性填写姓名、性别、年龄、职业、学历等基本信息,就可以开始测试。
整个测试都在浏览器页面进行,类似于网页游戏的模式,有随机出现的测试题,有各种小游戏,随机任务,测试认知能力,测试记忆力,测试逻辑推理,游戏难度从低到高,测试学习能力,自控力,情绪稳定能力等等。
测试的时间不固定,题目数量也不固定,根据测试者实际表现,可能几分钟结束,也可能要几十分钟,最长不会超过一个小时,最后会给出一个百分制下的认知水平分,以及更详细的综合评述。
他们项目组的人当然要最先进行测试体验,除了曾凡,每个人都只承担一部分设计,不可能了解全部的题目。
不过就算他们自己设计的题目,在什么时候出现,后面的评分机制也不是完全清楚,就算想提高自己的分数,也难以作弊。
曾凡只用十分钟就完成了测试,认知分数九十一,也并没有达到满分,他并没有控分的操作,这就是系统真实测评分。
第二个完成测试的是李海涛,只得到六十五分,刚刚及格的水平,他对自己的分数有点不满意:“卧槽,这系统太不懂人情事故了,一点面子也不给呀,评价我的感知力和自控力都不及格!”
“哈哈,我觉得系统的评述很准,我八十分!”一边的陈钢很满意自己的分数,曾凡才九十一,他的八十分也不错了,至少所有维度都在及格线上,和他的自我认知差不多。
按照曾凡的设计规则,测试完成的快慢与分数没有直接的正比或者反比关系,太快和太慢结束,分数都不会太高。
随后几个女生都陆续完成了测试,时间都在半个小时以内,最后对比之下,吕瑶得到了九十五分的最高分,其次是沈梦琳九十三分,曾凡只排在第三名。