近年來,随著(zhe)大數據成(chéng)爲互聯網信息技術行業的流行詞彙,教育逐漸被(bèi)認爲是大數據可以大有作爲的一個重要應用領域,有人大膽地預測大數據將(jiāng)給教育帶來革命性的變化。大數據技術允許中小學(xué)和大學(xué)分析從學(xué)生的學(xué)習行爲、考試分數到職業規劃等所有重要的信息。許多這(zhè)樣(yàng)的數據已經(jīng)被(bèi)諸如美國(guó)國(guó)家教育統計中心之類的政府機構儲存起(qǐ)來用于統計和分析。盤點近年來大數據應用于教育行業的十大案例。
國(guó)内:
一、華中科技大學(xué)近兩(liǎng)年個性化大數據的實踐,通過(guò)數據理出學(xué)生在校期間生活和學(xué)習的主線,并放在一個故事(shì)化的場景裡(lǐ)來叙述,引起(qǐ)了衆多畢業生的共鳴。
6月8日,一封名叫(jiào)《光陰的故事(shì)一緻某某》的電子信件和截圖在華中科技大學(xué)畢業生的微信朋友圈廣爲流傳。每一位即將(jiāng)離校的學(xué)子隻要打開(kāi)鏈接,輸入自己的校園賬号就(jiù)能(néng)獲取在校期間的學(xué)習,讀書,餐飲等各方面(miàn)數據和收獲。
該校網絡與信息化辦公室副主任王士賢介紹,《畢業生大數據--光陰的故事(shì)》由華中科技大學(xué)網絡與信息 化中心在2015年第一次推出,今年在教務類數據的基礎上還(hái)增加了畢業生的借書、進(jìn)出圖書館,黨員組織 發(fā)展,校園卡刷卡,計算機等考等相關數據。
二、由廈大圖書館設計的一個名爲“圕(tuan)·時光”的網站, 收集整理了畢業生大學(xué)時代的閱讀記錄、進(jìn)館次數等, 被(bèi)畢業生視爲大學(xué)生涯的圖書館記憶。今年,這(zhè)個網站還(hái)特别增加了畢業生在食堂的消費記錄,如打了多少份免費米飯。也就(jiù)是說,這(zhè)是一份物質食糧和精神食糧的雙重記憶。
由于今年的“圕·時光”,新增了學(xué)生們在食堂的消費記錄,畢業生登錄後(hòu),不僅能(néng)看到自己最愛去的餐 廳、超市、消費的金額,還(hái)能(néng)看到自己在大學(xué)期間,打了多少份米飯。廈大圖書館表示,這(zhè)是根據學(xué)生一卡通的大數據統計出來的,隻提供給學(xué)生本人。
三、每個月在食堂吃飯超過(guò)60頓、一個月總消費不足420元的,被(bèi)列爲受資助對(duì)象。
據報道(dào),南京理工大學(xué)教育基金會(huì)通過(guò)數據分析,每個月在食堂吃飯超過(guò)60頓、一個月總消費不足420元 的,被(bèi)列爲受資助對(duì)象。南京理工大學(xué)還(hái)采取直接將(jiāng)補貼款打入學(xué)生飯卡的方式,學(xué)生無需填表申請,不用審核。
四、電子科大曾做過(guò)一個課題——尋找校園中最孤獨的人。 他們從3萬名在校生中,采集到了2億多條行爲數據,
數據來自學(xué)生選課記錄、進(jìn)出圖書館、寝室,以及食堂用餐、超市購物等數據。通過(guò)對(duì)不同的校園一卡通 前一後(hòu)刷卡”的記錄進(jìn)行分析,可以發(fā)現一個學(xué)生在學(xué)校有多少親密朋友,比如戀人、閨蜜。
最後(hòu),通過(guò)這(zhè)個課題找到了800多個校園中最孤獨的人,他們平均在校兩(liǎng)年半時間,一個知心朋友都(dōu)沒(méi)有。 這(zhè)些人中的17%可能(néng)産生心理疾病,剩下的則可能(néng)用意志力暫時戰勝了症狀,但需要學(xué)校和家長(cháng)重點予以關愛。
國(guó)外:
五、紐約州波基普西市瑪麗斯特學(xué)院(Marist College)與商業數據分析公司Pentaho合作發(fā)起(qǐ)開(kāi)源學(xué)術分析計劃 (The Open Academic Analytics Initiative),旨在一 門新課程開(kāi)始的兩(liǎng)周内預測哪些學(xué)生可能(néng)會(huì)無法順利完成(chéng)課程。
該計劃基于Pentaho的開(kāi)源商業分析平台(Business Analytics Platform)開(kāi)發(fā)了一個分析模型,通過(guò)收集分析學(xué)生的學(xué)習習慣——例如點擊線上閱讀材料、是否在網上論壇中發(fā)言、完成(chéng)作業的時長(cháng)——來預測學(xué)生的學(xué)業情況、及時幹預幫助問題學(xué)生,從而提升畢業率。
六、KickUp是一個專注教師測評的标準化SaaS工具,測評數據來自教師的自查報告及學(xué)年内的各項教學(xué)結果的反饋,這(zhè)些數據可以縱向(xiàng)記錄教師的成(chéng)長(cháng)曆程,提出有待改善的地方。KickUp根據學(xué)生和老師的數量、 按地區進(jìn)行收費,目前全美有超過(guò)50個地區的學(xué)校在使用這(zhè)款測評工具。
七、以美國(guó)的著名高校卡内基梅隆大學(xué)和普渡大學(xué)爲例: 對(duì)這(zhè)兩(liǎng)所高校,領英都(dōu)收集了60000多名畢業生的職業生涯數據。數據量之龐大,足以在其中看出清晰的規律。輸入“MIT”,你很快就(jiù)會(huì)看到這(zhè)所高校的畢業生一般會(huì)在谷歌、IBM和甲骨文公司找到工作。輸入“普渡”,你會(huì)發(fā)現禮菜、康明斯和波音是畢業生的首選。
這(zhè)類信息對(duì)于中學(xué)的高年級生和低年級學(xué)生都(dōu)是一座金礦,因爲大多數中學(xué)生對(duì)將(jiāng)來的職業都(dōu)隻有模糊的想法。運用領英的這(zhè)個工具,對(duì)太陽能(néng)、編劇、或者醫療器械感興趣的學(xué)生,就(jiù)可以挑選那些畢業生最容易進(jìn)入相關領域的大學(xué)拫考了
八、據PBS報道(dào),伊薩卡學(xué)院(Ithaca College)自2007年開(kāi)始收集學(xué)生的社交網絡數據。該學(xué)院爲申請者設立了一個類似Facebook的網站IC PEERS,讓申請者得 以通過(guò)網站聯系學(xué)院教師和彼此。
伊薩卡使用舊M統計分析系統來收集IC PEERS上産生的數據,研究擁有怎樣(yàng)的網絡行爲的學(xué)生更有可能(néng)選擇就(jiù)讀伊薩卡。收集的數據包括申請者上傳了多少張賬戶照片、擁有多少名IC PEERS好(hǎo)友。研究人員認爲, 這(zhè)能(néng)反映出申請者對(duì)這(zhè)所學(xué)院有多感興趣。
九、“希維塔斯學(xué)習”是一家專門聚焦于運用預測性分析、 機器學(xué)習從而提高學(xué)生成(chéng)績的年輕公司。Civitas Learning提供了一套應用程序,學(xué)生和老師可以在其中規劃自己的課程和安排。“希維塔斯學(xué)習’’各種(zhǒng)基于雲的智能(néng)手機第三方應用程序(APP)都(dōu)是用戶友好(hǎo)型的,能(néng)夠根據高校的需要個性化。這(zhè)意味著(zhe)高校能(néng)聚焦于各自不同的對(duì)象,相互不同地用這(zhè)家公司的分析工具開(kāi)展大數據工作。
該公司在高等教育領域建立起(qǐ)最大的跨校學(xué)習數據庫。 通過(guò)這(zhè)些海量數據,能(néng)夠看到學(xué)生的分數、出勤率、 辍學(xué)率和保留率的主要趨勢。通過(guò)使用100多萬名學(xué)生的相關記錄和700萬個課程記錄,這(zhè)家公司的軟件能(néng)夠讓用戶探測性地知道(dào)導緻辍學(xué)和學(xué)習成(chéng)績表現不良的警告性信号。此外,還(hái)允許用戶發(fā)現那些導緻無謂消耗的特定課程,并且看出哪些資源和幹預是最成(chéng)功的。
十、一家名爲Knewton的大數據公司開(kāi)發(fā)了一個數字平台, 該平台分析了幾百萬學(xué)生(從幼兒園到大學(xué))的學(xué)習過(guò) 程,并基于這(zhè)一分析來設計更加合理的測試題目和更加個性化課程目标。該公司與Houghton Mifflin Harcourt建立了合作關系,開(kāi)發(fā)出了 K-12階段的個性化數學(xué)課程,同時還(hái)與法國(guó)創業公司Gutenberg Technology—道(dào),開(kāi)發(fā)了智能(néng)數字教科書。
簡單來說,這(zhè)些課程和教科書能(néng)夠适應每個學(xué)生的差異。學(xué)生可以按照自己的節奏來控制學(xué)習進(jìn)度,而不會(huì)受到周圍其他學(xué)生的行爲的影響。然後(hòu),系統會(huì)給教師一個反饋,告知哪個學(xué)生在哪個方面(miàn)有困難,同時給出全班學(xué)生的表現的整體分析數據。
在教育學(xué)習領域,大數據中提取價值的5種(zhǒng)主要的技術如下:
1.預測(Prediction)——覺知預料中的事(shì)實的可能(néng)性。例如,要具備知道(dào)一個學(xué)生在什麼(me)情況下盡管事(shì)實上有能(néng)力但卻有意回答錯誤的能(néng)力。
2.聚類(Clustering)——發(fā)現自然集中起(qǐ)來的數據點。這(zhè)對(duì)于把有相同學(xué)習興趣的學(xué)生分在一組很有用。
3.相關性挖掘(Relationship Mining)——發(fā)現各種(zhǒng)變量之間的關系,并對(duì)其進(jìn)行解碼以便今後(hòu)使用它們。這(zhè)對(duì)探知學(xué)生在尋求幫助後(hòu)是否能(néng)夠正确回答問題的可靠性很有幫助。
4.升華人的判斷(Distillation for human judgment)——建立可視的機器學(xué)習的模式。
5.用模式進(jìn)行發(fā)現(Discovery with models)——使用通過(guò)大數據分析開(kāi)發(fā)出的模式進(jìn)行“元學(xué)習”(meta-study)。一家名爲Knewton的大數據公司開(kāi)發(fā)了一個數字平台, 該平台分析了幾百萬學(xué)生(從幼兒園到大學(xué))的學(xué)習過(guò) 程,并基于這(zhè)一分析來設計更加合理的測試題目和更加個性化課程目标。該公司與Houghton Mifflin Harcourt建立了合作關系,開(kāi)發(fā)出了 K-12階段的個性化數學(xué)課程,同時還(hái)與法國(guó)創業公司Gutenberg Technology—道(dào),開(kāi)發(fā)了智能(néng)數字教科書。