关于大数据预测高考作文题的分析
语文专家:押中题未必能得高分
随着大数据时代的到来,用大数据预测今年的高考作文题成为不少信息供应商的噱头之一,其中以百度预测最为引人关注,尤其是其押中了今年高考作文上海卷的自由主题,让不少网友喜出望外,表示妈妈再也不用担心我的高考作文了!到底大数据压题靠不靠谱呢?
高考作文押中题一直是不少考生的梦想。进入云计算时代,用大数据来预测高考作文题成为今年不少信息技术公司的主攻对象,甚至有大数据库号称押中今年高考12道作文题。
大数据库提供六命题方向
今年高考前夕,百度预测推出了高考作文预测项目,记者登录百度预测网站,就可以打开高考作文预测页面,页面上出现一个类似蜂巢般的图表,分成六大色块,每一个色块都代表今年高考作文最有可能的命题方向,每个色块均有一个主题,并配有命中百分比数据的分析,包括时间的馈赠(28.61%)、生命的多彩(15.80%)、民族的变迁(14.99%)、教育的思辨(14.58%)、心灵的坚守(14.03%)和发展的困惑(11.99%)。根据这六大方向分别配有8~9个不同的`关键词,点击这些关键词就会出现3篇例文,再次点击例文,就会和百度搜索联系在一起,直接查看例文和相关素材。
根据这一预测,百度宣布这一预测项目成功押中今年全国18道高考作文题中的12道,如时间的馈赠,关键词为依旧和记忆,对应今年高考作文题中,江苏卷和广东卷的作文题目分别为什么是不朽、胶片与数码时代。而生命的多彩中,直接给出了关键词自由,几乎完全和今年上海作文题穿越沙漠的自由和不自由契合,而青春一词也在江苏卷中提到。
百度预测方面认为,这次预测充分展示了大数据的神奇之处,命中率之高令人难以想象。
挖掘8年海量数据做预测
据百度大数据专家介绍,此次预测高考作文题是百度挖掘了近八年各个省市的高考真题和模拟题,并且结合了近些年的搜索风云热点和新闻热点数据,根据当年社会思想的关注与潮流,现有数据和实时数据相结合组成百度作文预测的大数据库,并在它们与高考命题之间建立关联;而后,百度大脑将前面提到的大数据进行智能分析,通过概率主题模型算法模拟人脑思维,反向推导出作文主题及关联词汇,从而进行主题预测,提供关键词、几率以及范题和素材。
专家称,这种海量数据的分析对于一个每天需要响应几百亿次搜索的门户搜索网站来说,技术上并不算什么,主要是如何通过数据进行分析,所以表面上看,命题者的思路千变万化,毫无头绪,但是一旦放到海量数据下面进行分析,命题的个人意志一定会受到社会各种因素和信息的影响,大数据预测者就是要找到这个可能影响命题者思路的变量因素,而这中间的规律和轨迹又不是个体命题者能够体会和察觉的。
考生:上百范文等于没押题
今年参加高考的考生小利也告诉记者,实际上,所谓押题只能是把所有的希望押在几道题上,然后通过背诵文章、背诵结构和材料,确保写出高分作文,如果像大数据库这样提供了四五十个关键词,每个关键词又有3篇例文和大量素材,这样算下来就是100多道作文题,如果给你100多道作文题就不叫押题,直接叫复习而已,因为给出的可能性太多,其实可以忽略不计了,因为实际高三也会复习到大量作文题。
真正好的作文题不怕押中
陈庆雯老师坦言自己从不会让学生押题,以不变应万变才是最重要的,而且真正好的作文题并不怕人家押中。
华南师范大学文学院教授柯汉琳也表示,用大数据押题不但能让考生看到,也会让命题者看到,不排除命题者为了避免和大数据分析碰车特意另辟蹊径,而且就算是沾边押中了部分关键词,能不能得到高分仍是未知数,这些年作文题思辨性越来越强,几乎难有标准结论和答案,即便是范文可能也会因为缺乏新意而无法得到高分。
陈庆雯老师表示,押中完全一样的作文题的几率并不高,如果学生自己没有理解、分析能力,似是而非的去生搬硬套材料和范文,阅卷老师一般都能看出来,不但不会得到高分,甚至可能因为没有写出自己的真情实感而获得低分,不如扩大阅读面,储备更多的知识,这才是写好高考作文的制胜法宝。