• 大数据时代教育资源建设、应用与共享

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 大数据时代概述

    1. 定义

        大数据技术是数据分析的前沿技术,需要从各种各样类型的数据中,快速获得有价值信息的能力,是需要新处理模式才能实现更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    2. 大数据的特征

    (1) 数据体量( Volumes) 巨大。大型数据集,从TB 级别,跃升到PB 级别。

    (2) 数据类别( Variety) 繁多。数据来自多种数据源,数据种类和格式冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。

    (3) 价值( Value) 密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅一两秒钟。

    (4) 处理速度( Velocity ) 快。包含大量在线或实时数据分析处理的需求,1秒定律。

    3. 教育中的创新应用

    (1) 教育舆情监测与剖析 

    (2) 教育信息化与现代化发展水平评估 教育机构布局与教育经费调整 

    (3) 学生的发展性评价 

    (4) 基于大数据的科学研究 

    4. 大数据时代的特点

        大数据时代最显著的特点,表现为数字数据急剧增长,思维方式和工作方式发生重大变革。大数据时代的新特点,为信息化教学变革提供了条件。

    (1) 数字数据急剧增长

        谷歌公司每天要处理超过24PB数据,相当于104万8千多个GB,其数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍。Facebook公司每天更新照片超过1000万张,每天人们在网站上点击“喜欢”(Like)按钮或者写评论大约有30亿次。YouTube公司每月接待多达8亿的访客,平均每一秒钟就会有一段长度在一小时以上的视频上传。Twitter上的信息量几乎每年翻一番,截至2012年,每天都会发布超过4亿条微博。

        南加利福尼亚大学安嫩伯格通信学院的马丁·希尔伯特的研究表明,2007年,人类大约存储了超过300EB数据,相当于3000亿个GB,所有数据中只有7%存储在报纸、书籍、图片等媒介上。其余全部是数字数据。预计2013年全世界存储的数字数据将达到约1.2 ZB,相当于12288亿个GB,而非数字数据将不到2%。这些数字数据全部记载在书中的话,可以覆盖整个美国52次;存储在只读光盘上堆成5堆的话,每一堆都可以延伸到月球。这种极速发展表明,大数据时代不以人们意志为转移地到来了。

    (2) 思维方式和工作方式重大变革

    ①全数据模式:样本=总体

        在信息处理能力受限的时代,人们只能随机抽样采集数据开展研究。其目的在于,用最少的数据得到最多的信息。但是,这种“最多的信息”有着很大的局限性,它只能从采样数据中得出事先设计好的问题的结果,而不能适用于一切情况,尤其是不能适用于想了解更深层次的细分领域的情况。假如抽样对象为一个网络,那就根本找不到一个“最优抽样”的标准,更不可能奢望抽样得到的小网络能够反映总体的所有结构特性。
        到了大数据时代,获得海量数据已经非常容易。因此,小数据时代的随机抽样已经失去了原有的意义。谷歌公司之所以能比国家疾病控制和预防中心更早地准确预测H1N1流感趋势,不是依靠随机抽样分析,而是分析了整个美国几十亿条互联网检索记录,分析整个数据库,因而能够提高微观层面分析的准确性,推测出某个地区的流感状况,从而采取相应的防范措施。这样的分析不是小样本抽样所能胜任的。

    这种“样本=总体”的全数据模式,被称之为“让数据发声”。

    ②相关关系分析预测未来

        在大数据背景下,找到关联物,就能通过关联物之间的相关关系预测未来。相关关系的核心是量化两个数据之间的数理关系。

        2009年美国甲型H1N1流感爆发的几周前,谷歌公司的工程师们在《自然》杂志上发表预测冬季流感传播的论文,阐述谷歌通过观察人们在网上的搜索记录完成流感及其传播的预测。谷歌建立的系统并不依赖于流感的语义理解,而是关注特定检索词条的使用频率与流感在时间和空间上的传播之间的关系。为了测试这些检索词条,谷歌公司总共处理了4.5亿个不同的数学模型。他们把得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后发现了45条检索词条的组合,将它们用于一个特定的数学模型后,发现他们的预测与官方数据的相关性高达97%。他们能够判断出流感是从哪里传播出来的,而且判断速度远比美国疾控中心快得多。所以,2009年甲型H1N1流感爆发时,公共卫生机构的官员们通过谷歌及时获得了非常有价值的数据信息,在第一时间采取预防流感传播的措施。这一事件是大数据预测未来的最典型案例之一。

    (3) 数据的价值在于利用与创新

        在大数据时代,数据的价值是其所有可能用途的总和。因为数据与其他物质性的东西不同,其价值不会随着它的使用而减少,而是可以不断地被处理,从它最基本的用途转变为未来的潜在用途。这些似乎无限的潜在用途提供了多样化选择的可能性。所以,在大数据时代,数据就像是一个神奇的钻石矿,在其首要价值被发掘之后,仍然能不断产生价值,实现数据创新。例如,政府各个部门信息公开的数据实际上反映这些部门的工作情况,但是,当2008年1月,美国总统奥巴马命令联邦机构负责人公布尽可能多的数据,做到“面对怀疑,公开优先”的时候,政府各个部门的相关工作数据,却成了政府与选民沟通的管道。这个命令使相关数据的作用被无限次地利用与创新,无论用于研究还是提供决策依据,无论用于与大众沟通还是其他创意导致的数据创新应用。我国华南师范大学“教育信息化研究热点与发展趋势的词频分析”“学科建设成效对比分析系统”,以及安阳师范学院“微博平台交互分析”等都是在大数据分析和发掘方面所做的有益尝试。

        大数据创新沿着“数据—大数据—分析和挖掘—发现和预测”的方向发展。数据是灵魂资产,分析和挖掘是手段,发现和预测是最终目标。在数据创新的发展过程中,大数据必然影响教育创新,为信息化教学创造无限可能性。

    • 大数据对教育的启示

    1.教育数据挖掘与学习分析

        美国联邦政府教育部技术办公室2012年4月10日发布《通过教育数据挖掘和学习分析改进教与学:问题简介》(以下简称《简介》),指出在教育中有两个特定的领域会用到大数据:教育数据挖掘和学习分析。教育数据挖掘应用统计学、机器学习和数据挖掘的技术和开发方法,对教学和学习过程中收集的数据进行分析,教育数据挖掘检验学习理论并引导教育实践。学习分析应用从信息科学、社会学、心理学、统计学、机器学习和数据挖掘的技术,来分析从教育管理和服务过程中收集的数据,学习分析创建的应用程序直接影响教育实践。

    (1)教育数据挖掘

        早期的教育数据挖掘主要是网站日志数据的挖掘,现在新的计算机技术支持的交互式学习方法和工具(智能辅导系统、仿真、游戏),为量化和收集学生行为数据带来了新的机会。特别是更加集成、更加模块化和更加复杂化的在线学习系统提供了更多类型的数据,其中包含了数据挖掘算法需要的许多变量。教育数据挖掘能发现这些数据中的模式和规律,探索建立预测模型,让我们重新发现和预测学生如何学习。例如,过去对在线课程的评价主要通过课程结束时的学生问卷来评价,Hung,J.L等(2012)开发了一种在线课程评价方法,通过分析一个学生K-12在线课程的学生学习日志,一共有7539名学生在883门注册课程中的23854527份学习日志,结合学生人口特征数据"课程结束时对学生开展的课程评价问卷调查,对学生进行分类,发现高危学生和高表现的特征,预测学生的成绩,并研究学生表现和对课程满意度的关系。

        教育数据挖掘最早也是最普遍的应用是预测学生表现(成绩),近年来,教育数据挖掘的应用已经越来越广泛了,《简介》将教育数据挖掘的目标概括为以下4 个方面:

    ① 通过创建把学生的知识、动机、元认知和态度结合在一起的学生模型来预测学生未来的学习行为。

    ② 发现或改进学科领域的模型,这些模型能够概括要学习的内容特点和优化的教学步骤。

    ③ 研究学习软件能够提供的对不同教学法支持的效果。

    ④ 通过建立综合了学生模型"领域模型和软件教学模型的计算模型,推进关于学习和学生的科学知识。

    (2)学习分析

        学习分析主要涉及学业分析、行为分析和预测分析的研究和应用。《简介》采纳了Johnson et al (2011) 对学习分析的定义,指的是对学生学习过程中产生的大量数据进行解释,目的是评估学业进步、预测未来表现、发现潜在问题!数据来自学生的显性行为,如完成作业和参加考试;还有学生的隐性行为,如在线社交,课外活动,论坛发帖,以及其他一些不直接作为学生教育进步评价的活动。学习分析模型处理和显示的数据帮助教师和学校更好地理解教与学。学习分析的目标是使教师和学校创造适合每个学生需要和能力的教育机会。

        学习分析技术对于学生、教师、管理人员、研究人员以及技术开发人员均具有重要价值。对于学生而言,可以从学习者行为角度了解学习过程的发生机制,并用来优化学习,以基于学习行为数据的分析为学习者推荐学习轨迹,开展适应性学习、自我导向学习。对于教师和管理人员而言,可以用来评估课程和机构,以改善现有的学校考核方式,并提供更为深入的教学分析,以便教师在数据分析基础上为学生提供更有针对性的教学干预。对于研究人员而言,可以作为研究学生个性化学习的工具和研究网络学习过程和效用的工具。对于技术开发人员而言,可以优化学习管理系统。

    2. 提供个性化的教与学

        传统以课堂为主的教学环境中,由于教育资源非常有限,导致开展个性化教学很难实现,但随着云计算的出现,不仅打破了传统教育资源的瓶颈,使得各种类型的资源不断的涌现,同时在质量上也有很大的提高,而且也打破了高校内”信息孤岛“的现象。然而大数据的出现更是让云计算的应用有了真正的用武之地,云服务端为大数据提供了海量的结构化、 半结构化和非结构的数据,同时大数据的数据分析和数据挖掘技术使得这些无特定结构的数据释放出更巨大的潜在价值,这样教师可以在基于大数据的教学环境下获取一切可获取的教学资源, 并充分利用云计算提供的软件、存储、安全等技术,支持教师的高效教学,为学生个性化学习提供便利。

    3.实现基于数据引导师生自我学习

        在教学过程中,学习主体之间的交互对于知识意义的建构起着关键性的作用。云计算的出现解决了信息存储这一大难题,使得各种零散的教育资源有了一个集中应用的平台,这让高校师生能在以云计算为中心的教学环境中随时、随地的参与互动讨论并及时回答相互之间所提出的问题,这样,教师和学生的思维与智慧就可以被整个群体所共享,而不仅仅是提升某个个体智慧,这从真正意义上实现了师生互动。然而大数据的出现更能引导师生自主学习,基于大数据的云教学环境不仅可以使教师通过大数据的技术对教师某一段时期内的教学行为和成果进行分析,并预测下一时期的教学情况以及时调整教学策略,而且也可以使学生通过大数据技术对自己的某一段时期内的学习情况,包括学习、爱好、业余活动等非结构化学习行为进行分析和预测,以便尽早通过这些预测做出最适合学生健康发展的决策,并且基于大数据的数据分析技术为学生推荐学习轨迹,开展适应性学习、自我导向学习。

    4. 大数据与云计算的结合,给高校教育资源的应用带来新机会

        云计算的出现打破了以前高校信息化建设中的“信息孤岛”现象,它成为了各种分散教育资源集中应用的平台,这使得各种教育资源得到充分的应用。大数据的出现更是让云计算的应用有了真正的用武之地,它们的有力结合将会释放出巨大的能量,它几乎会波及各行各业,对于教育领域而言,他们的结合也将会给高校的教育资源的应用带来更多的机会。

    (1) 给数字图书馆带来新变革

         对于图书馆行业来说,云计算的出现也改变了传统图书馆的服务模式,应用云计算的存储、管理等相关技术为读者提供网络化应用,这在很大程度上改变了传统图书馆的窗口服务模式,因此各省高校都纷纷以云为基础建立起高校图书馆联盟以更快、更好地发展图书馆行业,如江西省高校图书馆联盟平台应用云技术真正实现了资源共享一体化、服务一体化、管理一体化。然而在大数据时代下的图书馆行业更将面临新的变革:

       ①大数据可应用数据分析、挖掘等技术对存储在云服务端的各种分散的关系化、结构化和非结构化数据进行分析和挖掘,掌握读者的借阅行为、爱好、知识应用能力等以预测读者对知识服务的需求,使图书馆管理人员能根据预测进行决策;

       ②应用大数据技术对读者的科研创新合作过程及合作交互型知识服务过程将要发生什么进行分析和预测,从而应对图书馆未来所面对的生存危机;

       ③通过应用大数据的分析,预测以及智能决策等技术为图书馆建立科学及实用的风险评估模型,如数据图书馆馆藏信息安全评估模型。

    (2) 让数据更能引导用户学习

          对于教育界而言,大数据与云技术的结合使得教育资源的应用突破了原有意义上的应用格局。

        ①教师与学生不仅仅是能够共享存储在云服务端的教育资源,并且能够通过大数据的数据分析、数据挖掘等技术对各种类型多样的数据进行分析和挖掘,以得出隐藏在其背后的数据信息,并为师生提供最合理的策略和方案;

        ②教师可以通过大数据技术对学生学习行为、学习爱好等非结构化数据进行分析及挖掘,让教师做出预测并及时做出决策,更好地引导学生学习,同时也可应用大数据的分析技术对开设的课程进行效果评估,以及时调整培养方案;

        ③大数据技术也可对学生某一段时间以来的各种表现,如上网、业余学习等非结构化数据的进行分析,预测出下一个时期将会发生的事情,以便尽早通过这些预测做出最适合学生健康发展的决策,并且基于大数据的数据分析技术为学生推荐学习轨迹,开展适应性学习,自我导向学习。

    (3) 让高校教育决策者在掌握更多数据后做出更正确抉择

          在当今大数据时代,高校云存储中心为大数据的应用提供了更多关于师生客观而又真实的行为记录的数据基础。

        ①数据处理中心对这些零散而又无特定结构的数据应用大数据的数据分析、数据挖掘等技术处理后将会给决策者预示出做出某一决策后未来的发展趋势,使决策者在了解其发展趋势之后决定是否做出某一决策,这样,使得决策者能在低风险下做出正确的决策,真正实现基于数据进行决策;

        ②大数据技术也可帮助高校提高教学质量,促进教育公平。

        ③高校可从数据中心获取关于高校内正常教学活动所产生的各项教学数据并在信息部门的协同下应用大数据的数据分析、挖掘技术实现自上而下的开展教学管理优化,促使高校教学管理体变革。

    5.大数据助力智慧教育

        实现智慧教育的前提是应用新思维、新技术,重构传统的教育信息系统,推动教育数据的汇聚、存储与处理,形成教育大平台与大数据。

    (1) 国家教育信息化"两平台"与大数据汇聚

         国家教育资源公共服务平台、国家教育管理公共服务平台是目前国家在建的两个教育大平台,其目标是汇聚教育管理、教学支持领域的海量信息,形成有效支持教育教学过程、教育管理的教育大数据。其中,国家教育资源公共服务平台采用资源征集、资源汇聚、资源共建、资源捐赠几种方式实现教育教学资源数据的汇聚;国家教育管理公共服务平台采用学生和教师"一人一号"、学校"一校一码"的思路,全面准确地汇聚全国学生、教师和学校办学条件的动态数据。这些大数据成为我们观察、监测教育系统的"显微镜与仪表盘",成为智能化教育分析与决策的基石。

    (2) 云计算理念下的"智慧校园"建设

         传统的数字校园建设导致大量的信息孤岛与数字鸿沟,云计算为新时期的教育信息化建设带来了新思路。"集中力量办大事"、"集中建设、分散使用"的建设方式,将更有利于教育信息资源的收集、存储、共享与应用,有利于形成区域性的教育大数据。基于教育云的信息化系统建设,对传统的校园网络系统进行重新整合与优化,将促进学校教育系统的深刻变革。应用云计算技术开发的教育信息服务平台,有助于将越来越庞大、复杂的教育管理、教务教学、课改教研、教育资源、安全管理等应用,抽象为简单、个性化、智慧型、支持多终端且具有良好用户体验的应用,让每一个用户都可以通过个人电脑、移动终端、数字电视等设备访问所关注的教育服务,最终实现任何人在任何时间、任何地点,以任何方式开展的数字化学习。

    (3) 基于开放资源与网络自组织的社会化课程学习

         近年来大量涌现的网络自组织学习模式、MOOC社会化学习模式,以更大范围的开放、深度协作为基础,聚合了大量的非结构化教育数据,如开放教育课程资源、网络学习过程数据等等,突破了以学校传统课程体系为核心、以LMS为基础的网络课程模式。社会化深度协作的开放式教育平台,实现了人类有史以来最大范围的教育资源分享与教育合作,是大数据时代的课程教学大平台。

    • 参考文献

    [1]陈晖,邓赟. 大数据的启示与探讨[J]. 信息安全与通信保密,2013,07:48-49+52. 

    [2]陆璟. 大数据及其在教育中的应用[J]. 上海教育科研,2013,09:5-8+22. 

    [3]方兵,杨成. I-时代的高校信息化教学资源建设探析——以开放大学为例[J]. 远程教育杂志,2013,06:88-94. 

    [4]金陵. 大数据与信息化教学变革[J]. 中国电化教育,2013,10:8-13. 

    [5]张燕南,胡继岳. 关于大数据应用于教育的思考[J]. 中国电力教育,2013,32:5-7. 

    [6]刘中宇,刘海良. 基于大数据的云教学环境设计[J]. 中国教育信息化,2013,24:18-21. 

    [7]刘中宇,刘海良. 大数据时代高校云资源应用[J]. 现代教育技术,2013,07:59-62.

    • 标签:
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部