第36章 科研,我们是认真的!(2 / 2)
其实,如果只是搜集人脑电波的信息波形,理论上来说,宋杰或丁小雅自己也能做。
但宋杰之所以提出要一个不识字的文盲作为实验对象,是为了避免识字的人在脑海中想着某个字的时候,脑电波会和不识字的人有误差。
“李大婶,你刚刚想的那句话是什么,现在可以说了……”
“莪想滴思……今天晚上次啥?”
听到李大婶浓重的山陕口音,宋杰和丁小雅一下子懵了!
他们虽然考虑到了识字的人和不识字在意识信息中的差异,但这个方言问题……还真是漏算了。
不过,冯蔚却笑了笑说道:“李大婶,那待会儿,你一个字一个字的重复想一下,每一次想一个字,做一个手势!”
按照他们之前设计的实验内容,是將一个人大脑意识中的一句完整的话用脑波记录下来,然后再对比单个字……
这个信息采集过程是一个非常繁杂的过程,而这也是之前她导师周凯荣教授和整个研究团队积累多年才完成的!
“冯老师,这个方言问题……”丁小雅有些犹豫地问道。
冯蔚摇了摇头说道:“方言不是问题,毕竟人类存在语言差异,但在意识上依然是一致的,至少使用同一语种的人是不存在太大差异的……”
凭着丰富的实验经验,冯蔚给出了自己的建议,听她这么一说,宋杰心中豁然开朗。
“我们只需要將脑电波完整记录下来,做几个比对实验就可以解决。待会儿小雅你按照李大婶做过的,再做一遍。我们几个多做几遍就能解决差异性问题了。”
虽说冯蔚之前曾说过,她这个指导老师之是“名义”上的,但从此刻起在宋杰心里,冯蔚这个指导老师实至名归!
信息的采集过程,尽管需要耗费很大的精力和时间,但实际上也并不需要像周荣凯教授的团队那样花上十几年的时间。
“整整一天,我们就搜集到了1000多个字的脑电波型,照这个效率,最多一个星期我们就能完成常用字库的信息采集工作了……”
忙了一天,冯蔚伸了个懒腰,看着一天的工作成果颇为欣喜地说道。
汉语常用字只有三千多个,囯家标准GB2312-80《信息交换用汉字编码字符集*基本集》就是根据每个字的使用频率制订的。
一级字库为常用字,3755个,二级字库为不常用字,3008个,一、二级字库共有汉字6763个。
在现代汉语材料中的每一万个汉字中,一级字库的字就会出现9970次以上,其余的所有汉字也不足30次,最常用的1000个汉字,使用频率在90%以上。
做完了最常用的1000字之后,第二天开始,丁小雅就承担起了全部的信息采集工作,宋杰和冯蔚则开始了下一步的词库构建和算法优化的工作……
而就在宋杰和丁小雅他们一门心思搞科研的时候,他们的生意却遇到了麻烦!
“侯成功!你给我老实交代,你卖的这玩意儿哪儿来的?两千块钱卖一首曲子……生意都做到学校来了!你要是再不说,我就打电话让你家长来问你!”
徐林今天在给9班上课的时候,发现有个学生带着耳机听音乐。
原本这也不过是一件小事,没收了那学生私自带来学校的手机就行了!
可让人想不到的是,那学生听说要没收手机,口口声声说听音乐是为了提高学习成绩?
一番追查之后,竟然被他查出了一个“诈骗”团伙!
↑返回顶部↑