殷寶媛1, 武法提2
(1.哈爾濱師範大學(xué) 教育科學(xué)學(xué)院, 黑龍江 哈爾濱 150080;
2.數字學(xué)習與教育公共服務教育部工程研究中心, 北京 100875)
[摘 要] 作業習慣與學(xué)習者的學(xué)業成(chéng)就(jiù)緊密相關,作業習慣的建模是智能(néng)學(xué)習系統設計中亟待解決的問題。本研究應用混合式研究方法,依據多層次作業模型,确定“學(xué)業拖延”和“學(xué)業勤奮”作爲兩(liǎng)個重要且可以測量的作業習慣的維度,分别表征作業時間和作業努力這(zhè)兩(liǎng)類核心的作業行爲。構建了包括做題拖延和提交拖延的學(xué)業拖延習慣子模型,應用聚類實現了對(duì)學(xué)業拖延習慣的診斷,定義了“無拖延習慣者”“嚴重拖延習慣者”“提交作業拖延者”“做作業拖延者”四類學(xué)習者。以時間投入—專注度模型爲理論框架,構建了包括時間投入和專注度的學(xué)業勤奮習慣子模型,應用人工神經(jīng)網絡實現對(duì)學(xué)業勤奮習慣進(jìn)行診斷,診斷出五種(zhǒng)勤奮度的級别,并驗證了模型的有效性。 [關鍵詞] 學(xué)習習慣; 作業習慣; 學(xué)業拖延; 學(xué)業勤奮; 智能(néng)學(xué)習系統; 建模
作業是連接教與學(xué)的重要環節,體現了教育的價值取向(xiàng)和課程改革的理念。作業在K-12教育中具有重要的地位[1],作業可以補充和鞏固學(xué)生在學(xué)校的學(xué)習,完善學(xué)生的知識和技能(néng)[2]。因此,培養學(xué)生良好(hǎo)的作業習慣,對(duì)于學(xué)生的學(xué)業表現具有重要的意義。随著(zhe)信息技術的發(fā)展,學(xué)生做作業的方式也從傳統的紙和筆作業發(fā)展到在線作業以及線上線下混合的作業形式,與傳統作業相比,在線作業可以使學(xué)生得到即時的反饋與輔導,能(néng)帶來更好(hǎo)的學(xué)習結果[3]。學(xué)生在線作業的過(guò)程會(huì)以數據的形式存儲在學(xué)習系統中,如何通過(guò)這(zhè)些海量的作業行爲數據,分析學(xué)生的作業習慣,爲學(xué)生的個性化學(xué)習提供支持和服務,是智能(néng)學(xué)習系統設計中亟待解決的問題。
智能(néng)學(xué)習系統中作業習慣的建模可以應用學(xué)習習慣的建模方法,可采用自上而下的理論經(jīng)驗法和自下而上的數據挖掘法相結合的混合式思路,重點解決學(xué)習習慣測量模型的維度和學(xué)習習慣模型的測量指标等問題[4]。
(一)智能(néng)學(xué)習系統中作業習慣模型維度的确定
在智能(néng)學(xué)習系統中,學(xué)生的作業習慣是通過(guò)其作業行爲表現出來的。關于學(xué)生作業行爲的研究, Flunger B認爲作業時間是作業行爲的一個重要特征[5];Dettmers認爲學(xué)生在作業中投入的努力程度可以表征其作業行爲[6];Trautwein U的研究表明,作業對(duì)學(xué)業成(chéng)就(jiù)的積極效果并不能(néng)僅由“作業時間”測量,還(hái)與作業的完成(chéng)質量(專注/效率、按時、正确)有關[7],并提出多層次作業模型,該模型認爲作業時間(即花費在作業上的時間)和作業努力(即學(xué)習者認真對(duì)待作業的程度)可以用來表征學(xué)生作業行爲的兩(liǎng)個中心方面(miàn)[8]。本研究以多層次作業模型爲基礎,探讨作業時間和作業努力這(zhè)兩(liǎng)類作業行爲與哪些教育領域常識性的學(xué)習習慣概念相對(duì)應,以确定作業習慣模型的維度。
1. 通過(guò)文獻分析提取模型維度的關鍵詞
作業模型維度關鍵詞篩選的原則有兩(liǎng)個,一是從價值性的角度出發(fā),選擇需要測量的作業習慣,即教育學(xué)領域認爲應該測量的作業習慣,對(duì)學(xué)習者的學(xué)習和發(fā)展會(huì)有重要影響的作業習慣;二是從實用性的角度出發(fā),選擇能(néng)夠測量的作業習慣,即當前技術手段等可以實現量化的作業習慣。通過(guò)收集和整理國(guó)内外關于學(xué)習習慣的文獻,分析、總結和提取作業學(xué)習習慣維度的關鍵詞。共提取出學(xué)習習慣維度的關鍵詞76個,其中在線教育維度關鍵詞23個,混合學(xué)習環境關鍵詞53個,篩選出與作業有關的關鍵詞48個。按照篩選的兩(liǎng)個原則(一是需要測量的;二是能(néng)夠測量的),對(duì)這(zhè)48個關鍵詞進(jìn)行篩選。得到學(xué)業拖延、時間管理、目标計劃、學(xué)習環境、主動學(xué)習、協作、學(xué)業勤奮、獨立思考等8個關鍵詞。
2. 通過(guò)專家訪談補充和修改模型維度的關鍵詞
訪談6位具有在線教學(xué)和研究經(jīng)驗的專家,了解在線學(xué)習環境下專家對(duì)作業習慣關注的要點,經(jīng)過(guò)速記轉錄與整理,形成(chéng)了訪談文本資料。使用NVivo軟件對(duì)訪談資料進(jìn)行編碼,提取出教師和專家關注的作業習慣關鍵詞6個(拖延、勤奮、努力、主動、投入、專注)。將(jiāng)文獻分析的8個關鍵詞與訪談挖掘的關鍵詞進(jìn)行整合,形成(chéng)德爾菲法調查問卷的關鍵詞集。
3. 通過(guò)德爾菲法确定模型維度
有16位專家(其中包括5位高校教師、5位研究人員和6位中學(xué)教師)參與了本研究的德爾菲調查。調查以問卷形式進(jìn)行,征詢專家對(duì)作業習慣模型維度的意見。根據兩(liǎng)輪意見征詢和修訂,确定將(jiāng)學(xué)業拖延、學(xué)業勤奮作爲兩(liǎng)個重要且可以測量的作業習慣的維度,分别表征作業時間、作業努力兩(liǎng)個方面(miàn)作業行爲的頻繁程度對(duì)學(xué)習的影響。
(二)維度1:學(xué)業拖延習慣的測量
作業模型中的學(xué)業拖延習慣是指當學(xué)生面(miàn)對(duì)與作業(學(xué)業任務)有關的事(shì)件刺激所呈現的延遲行爲。學(xué)業拖延習慣是一種(zhǒng)常見的不良學(xué)習習慣。研究發(fā)現,大約30%至60%的學(xué)習者報告了自己在準備考試、寫學(xué)期論文等學(xué)習任務時具有拖延習慣[9]。學(xué)業拖延習慣會(huì)影響學(xué)習者的學(xué)習表現,阻礙其學(xué)習進(jìn)步,增加其壓力,并降低生活的質量,對(duì)學(xué)習者的身心健康産生消極影響[10]。由于學(xué)業拖延習慣對(duì)學(xué)業成(chéng)就(jiù)的影響最爲直接,因此也是許多研究者和教師關注的問題。
1. 學(xué)業拖延習慣子模型構建
在學(xué)業拖延習慣的測量上,大多數采用調查問卷或量表,通過(guò)學(xué)習者自我報告的形式來測量拖延習慣,如Tuckman拖延傾向(xiàng)量表(TPS[11])、Solomon等學(xué)業拖延量表(PASS[12])等;此外,還(hái)有教師評定的方式(如出勤等)測量拖延習慣,如Miligram 等的學(xué)業拖延量表(APS[13])等。學(xué)業拖延習慣通常表現爲放棄和推遲完成(chéng)作業。用行爲數據來測量拖延,一般都(dōu)是判斷行爲是否在截止時間前完成(chéng),用在作業拖延的測量,通常都(dōu)是單一維度的判斷提交作業的截止時間[14]。然而拖延作爲從時間角度表征作業行爲頻率對(duì)學(xué)習影響的變量,不應該僅從“完成(chéng)的時間”進(jìn)行單一維度的判斷,還(hái)應該包括“做的時間”維度,做作業的時間長(cháng)短不僅是學(xué)習者知識能(néng)力的表現,更是專注力等方面(miàn)的外顯。因此,本研究構建了包括“做的時間”和“完成(chéng)的時間”兩(liǎng)個維度的學(xué)業拖延習慣模型,即做題拖延和提交拖延二維模型。
2. 學(xué)業拖延習慣測量的算法設計
研究假設:超出規定做作業時間的次數越多,拖延度越高;超出規定提交作業時間的次數越多,拖延度越高。拖延度表達爲:Pr=f(T,N)。其中,f()是函數關系,Pr表示作業的學(xué)業拖延度,T表示作業學(xué)習行爲中與時間相關的參數,N表示作業學(xué)習行爲中與拖延次數相關的參數。
(1)做作業時的拖延次數Nd的計算
設Tst表示開(kāi)始做作業的時間、Tsb表示提交作業的時間、Tlt表示規定的做作業的時長(cháng)、Nd表示做作業時的拖延次數。則第i次做作業的時長(cháng)Tdu(i)=Tsb(i)-Tst(i);第i次做作業拖延的時長(cháng)Tpd(i)=Tdu(i)-Tlt(i)。做作業時的拖延次數Nd的計算公式爲:Tpd(i)>0?Nd=Nd+1。其中i=1…n,n爲正整數。
(2)提交作業的拖延次數Ns的計算
設Tdl規定最晚提交作業的時間,則第i次提交作業拖延的時長(cháng)Tps(i)=Tsb(i)-Tdl(i)。提交作業的拖延次數Ns的計算公式爲:Tps(i)>0?Ns=Ns+1。其中i=1…n,n爲正整數。
(3)學(xué)業拖延度Pr的計算
研究的目的是診斷出具有不同拖延習慣的學(xué)習者,即把學(xué)業拖延度Pr的計算看成(chéng)一個分類問題。聚類分析是解決分類問題的有效方法,因此可以根據數據的特點,選用不同的聚類算法,對(duì)Pr進(jìn)行分類,實現對(duì)學(xué)業拖延度的計算。
(三)維度2:學(xué)業勤奮習慣模型的測量
學(xué)業勤奮習慣用于表征作業行爲中的努力行爲的頻繁程度。學(xué)業勤奮是指學(xué)習者自覺地卷入學(xué)習任務,并不懈地追求學(xué)習目标的惜時表現[15]。研究表明,學(xué)業勤奮習慣對(duì)于學(xué)業成(chéng)就(jiù)具有預測作用。在線學(xué)習環境下,學(xué)習者面(miàn)臨更多的誘惑,這(zhè)會(huì)導緻學(xué)習者的注意力分散,因此學(xué)習者保持學(xué)業勤奮習慣對(duì)其學(xué)業表現具有重要的作用。
1. 學(xué)業勤奮習慣子模型構建
關于學(xué)業勤奮習慣的測量,常采用問卷調查法,如Bernard 等編制的基礎教育勤奮調查問卷DI-HS和高等教育勤奮調查問卷DI-HE[16]等。但是問卷測量受到許多衆所周知的限制,尤其是自我報告式問卷,存在社會(huì)期望偏差和其他的限制,特别是當存在激勵因素時。有研究者認爲,用學(xué)習行爲測量學(xué)業勤奮可能(néng)比問卷更适合,因爲行爲不依賴于主觀判斷,直接對(duì)行爲進(jìn)行分析,可以消除參考偏倚、社會(huì)期望偏倚和造假相關的局限性[17]。
關于學(xué)業勤奮習慣維度的研究主要有兩(liǎng)種(zhǒng)取向(xiàng)。第一種(zhǒng)是學(xué)習時間(行爲)投入的取向(xiàng)。該取向(xiàng)主要從學(xué)習者投入學(xué)習中的時間或行爲的多少來考察學(xué)業勤奮度,認爲個體在學(xué)習中投入的時間或行爲越多,個體的學(xué)業勤奮水平就(jiù)越高[18]。第二種(zhǒng)是學(xué)習專注度的取向(xiàng)。該取向(xiàng)強調從認知和情感投入角度來探究學(xué)業勤奮度,偏重于從專注程度的視角來考察學(xué)業勤奮度[19]。但時間投入和專注度是不可分離的,專注度是通過(guò)學(xué)習時間投入表現出來的,學(xué)習時間投入是專注度的載體。因此,單維取向(xiàng)不能(néng)夠有效地對(duì)學(xué)習者的學(xué)業勤奮度水平進(jìn)行合理的評估。爲避免單維水平評估學(xué)習者的學(xué)業勤奮的不足,雷浩等綜合了時間投入和專注度兩(liǎng)種(zhǒng)取向(xiàng),提出了學(xué)業勤奮度的“時間投入—專注度雙維核心模型”,并檢驗了該模型應用的有效性[15]。但是該研究是通過(guò)自編的《中學(xué)生學(xué)業勤奮度問卷》來獲得的數據,仍然存在問卷調查法的弊端。因此,本研究以“時間投入—專注度雙維核心模型”爲理論框架,探索基于學(xué)生學(xué)習行爲的學(xué)業勤奮習慣測量模型。
2. 學(xué)業勤奮習慣測量的算法設計
學(xué)業勤奮習慣的測量假設是學(xué)業勤奮習慣與作業學(xué)習行爲是相關的。這(zhè)裡(lǐ)主要包括以下兩(liǎng)個問題:一是學(xué)業勤奮習慣水平與哪些在線作業行爲相關?二是在線作業行爲與學(xué)業勤奮習慣水平的關系是否可以描述爲數學(xué)模型?
由于不同學(xué)習平台開(kāi)發(fā)的目的不同,所提供的工具不同,會(huì)導緻學(xué)習行爲指标選擇的不同。因此,在确定兩(liǎng)個維度學(xué)習行爲的量化指标時,需要考慮學(xué)習平台本身的特點,以及數據采集的可行性。一般來說,學(xué)業勤奮習慣主要表現在做作業、觀看微視頻答題、作業互動、資源浏覽等多種(zhǒng)行爲,各種(zhǒng)行爲對(duì)學(xué)業勤奮習慣貢獻的程度也不同,這(zhè)就(jiù)導緻學(xué)業勤奮習慣的輸入和輸出是一種(zhǒng)複雜的非線性關系。因此,勤奮習慣的診斷是一個多層次、多目标的問題,難以建立合理、準确的數學(xué)公式。對(duì)于多指标的預測和分類問題,通常采用多元線性回歸、logistic回歸等回歸方法,但這(zhè)些方法是基于線性關系來進(jìn)行評價,無法對(duì)非線性問題進(jìn)行很好(hǎo)的逼近。人工神經(jīng)網絡的優勢恰好(hǎo)體現在處理非線性問題上,相對(duì)于其他非線性回歸方法,人工神經(jīng)網絡避免了選取何種(zhǒng)非線性函數的困擾,因此本研究根據數據之間的非線性特點,以及需要解決問題的性質,選擇人工神經(jīng)網絡方法對(duì)勤奮習慣進(jìn)行診斷。
本研究的輸入數據爲學(xué)習者歸一化後(hòu)的特征向(xiàng)量,輸出數據爲勤奮度(勤奮學(xué)習習慣的标度)數值,分爲1~5類(1類勤奮度最低,5類勤奮度最高)。具體建模步驟包括:第一步,根據“時間投入—專注度雙維核心模型”的理論框架,以及在線平台可收集到的學(xué)習行爲數據,設計學(xué)業勤奮習慣數字化表征的指标體系。第二步,根據學(xué)習行爲指标體系确定輸入層神經(jīng)元的個數,模型的輸出爲學(xué)業勤奮習慣評價的等級,确定模型的拓撲結構。第三步,歸一化處理各指标數據。第四步,采用神經(jīng)網絡對(duì)樣(yàng)本進(jìn)行訓練,建立學(xué)業勤奮習慣的測量模型。第五步,應用學(xué)業勤奮習慣測量模型對(duì)學(xué)習者進(jìn)行診斷,并輸出診斷結果,對(duì)模型性能(néng)進(jìn)行分析。
本研究的實驗平台爲“Cloudbag教育雲平台”,實驗數據來源爲L中學(xué)654名學(xué)習者使用智能(néng)學(xué)習系統進(jìn)行常态化學(xué)習的作業行爲數據。首先進(jìn)行數據清洗,過(guò)濾掉因轉學(xué)等各種(zhǒng)原因未參與的學(xué)習者數據,以及由于誤操作的多次提交行爲、多次做作業的行爲(一個作業在不同的時間做了多次)等數據,得到有效記錄。其次,處理缺失值和歸一化數據,應用極差變換對(duì)數據進(jìn)行預處理,將(jiāng)數據進(jìn)行歸一化,縮放到從0到1的閉區間。
(一)維度1:學(xué)業拖延習慣子模型實驗
根據智能(néng)學(xué)習系統中收集的學(xué)業拖延習慣數據特征選擇算法。由于數據是連續型數值數據,因此選用覆蓋型數值劃分聚類算法。K-Means聚類是比較成(chéng)熟的覆蓋型數值劃分聚類算法之一,本實驗應用K-Means聚類來實現學(xué)業拖延度Pr的分類。
1. 數據分析
本實驗聚類分析的因變量是學(xué)業拖延習慣診斷結果,自變量是做作業時的拖延次數Nd、提交作業的拖延次數Ns。當K爲4時,聚類效果具有最好(hǎo)的解釋力,因此聚類數量選擇爲4。實驗結果如圖1所示,四種(zhǒng)拖延類别具有明顯的分區,類别1在Nd和Ns上的數值均較小;類别2在Nd和Ns上的數值均較大;類别3在Nd上的數值較小,在Ns上的數值較大;類别4在Ns上的數值較小,在Nd上的數值較大。在所有統計量中,類别1有398個,占60.9%,Nd的中心點是0.49,Ns的中心點是0.69;類别2有45個,占6.9%,Nd的中心點是10.48,Ns的中心點是9.57;類别3有124個,占19.0%,Nd的中心點是2.69,Ns的中心點是8.41;類别4有87個,占13.3%,Nd的中心點是7.8,Ns的中心點是2.39。方差分析結果顯示,Nd、Ns兩(liǎng)個變量能(néng)很好(hǎo)地區分各類(Sig.=0.000),各類别間的差異較大。類别1占了整體的60.9%,說明大部分學(xué)習者在作業方面(miàn)沒(méi)有拖延習慣,這(zhè)與中國(guó)當前的中學(xué)教育現狀有關,在現有的中學(xué)教育中,因爲高考的指向(xiàng)性,教學(xué)模式以教師爲主導,對(duì)于教師安排的作業,大部分學(xué)習者都(dōu)能(néng)在提交時間前完成(chéng),随著(zhe)時間的臨近,數據量逐步增加,導緻類别1數值偏大。
圖1 四種(zhǒng)拖延類别在Nd和Ns上的聚類圖
聚類質量的評價采用輪廓測量和Silhouette指數。本研究的Silhouette指數達到0.8,聚類輪廓測量也達到了“好(hǎo)”的水平,說明本研究應用K-Means聚類分析對(duì)學(xué)業拖延習慣的分類具有較好(hǎo)的聚類質量。
2. 具有不同程度學(xué)業拖延習慣的學(xué)習者特征
從不同類型的學(xué)習者中選擇特定的受訪者,進(jìn)行訪談,并結合這(zhè)類受訪者在行爲數據中體現出來的行爲模式特點,分析學(xué)習者的特征。通過(guò)對(duì)四類不同學(xué)習者進(jìn)行訪談和觀察,發(fā)現四類學(xué)習者在學(xué)習上具有不同的特征。“無拖延習慣者”即類别爲1的學(xué)習者,統計數據上表現爲:Nd和Ns均較小。在學(xué)習行爲上表現爲:基本沒(méi)有做題拖延行爲和提交拖延行爲,能(néng)夠提前或按時完成(chéng)作業,做作業時注意力較爲集中,被(bèi)視爲無拖延學(xué)習習慣。“嚴重拖延習慣者”即類别爲2的學(xué)習者,統計數據上表現爲:Nd和Ns均較大。在學(xué)習行爲上表現爲:經(jīng)常出現做題拖延行爲和提交拖延行爲,通常表現爲學(xué)習時間安排不合理,經(jīng)常忘記做作業,喜歡把作業拖後(hòu)完成(chéng)或者不完成(chéng),而且做作業時注意力不集中,經(jīng)常被(bèi)其他事(shì)情打擾,導緻做作業的時間很長(cháng),效率較低。“提交作業拖延者”即類别爲3的學(xué)習者,統計數據上表現爲:Nd較小,Ns較大。在學(xué)習行爲上表現爲:經(jīng)常出現提交拖延行爲,但很少出現做題拖延行爲,這(zhè)類學(xué)習者通常表現爲經(jīng)常忘記做作業,喜歡把作業拖後(hòu)完成(chéng)或者不完成(chéng),學(xué)習時間安排不合理,但做作業時能(néng)夠集中注意力,效率較高。“做作業拖延者”即類别爲4的學(xué)習者,統計數據上表現爲:Ns較小,Nd較大;在學(xué)習行爲上表現爲:經(jīng)常出現做題拖延行爲,但很少出現提交拖延行爲,這(zhè)類學(xué)習者通常表現爲能(néng)夠按時完成(chéng)作業,看似在努力學(xué)習,但學(xué)習效率不高,在做作業時,經(jīng)常注意力分散、溜号,甚至迷航。以上四類學(xué)習者,“無拖延習慣者”是具有良好(hǎo)學(xué)習習慣的學(xué)習者,“嚴重拖延習慣者”“提交作業拖延者”“做作業拖延者”三類學(xué)習者都(dōu)是具有不良學(xué)習習慣的學(xué)習者,需要根據其習慣形成(chéng)的動力因素設計教學(xué)幹預,改善其不良的作業習慣[20]。
3. 模型診斷結果與人工診斷結果的對(duì)比
將(jiāng)模型診斷結果與人工診斷結果進(jìn)行對(duì)比,可以幫助完善模型,爲後(hòu)續研究做準備。随機抽取20位學(xué)習者,由兩(liǎng)位該班授課教師研究者背對(duì)背對(duì)20位學(xué)習者的拖延類型進(jìn)行診斷,對(duì)于不一緻的結果,與第三位教師商讨後(hòu)确定最終值,兩(liǎng)位教師評價的Cohen's Kappa一緻性檢驗結果爲0.821,具有一緻性。模型的診斷結果與教師診斷結果在類型1、類型2和類型3上具有較好(hǎo)的一緻性,而類型4的判斷上有一些不一緻,模型診斷出類型4的數量要少,說明模型的判斷标準比教師的判斷标準寬松,原因在于,在判定“規定的做作業的時長(cháng)”的時候,教師是按照班級大多數同學(xué)能(néng)夠做完的時長(cháng),但當對(duì)學(xué)習者個人進(jìn)行評價時,教師通常會(huì)從自己的經(jīng)驗和預期出發(fā),根據學(xué)習者個人的知識能(néng)力來進(jìn)行判斷。如在某次作業中,教師認爲大多數學(xué)習者45分鍾能(néng)夠完成(chéng),對(duì)于甲同學(xué)(學(xué)習基礎比較差),如果甲45分鍾寫完,教師認爲其沒(méi)有拖延,但對(duì)于乙同學(xué)(學(xué)習基礎比較好(hǎo)),如果也是45分鍾寫完,教師認爲其有拖延,原因是教師對(duì)他的預期應該是35分鍾之内。因此,模型的後(hòu)續完善可以考慮增加學(xué)習者的知識能(néng)力因素。
(二)維度2:學(xué)業勤奮習慣子模型實驗
1. 提煉學(xué)習行爲測量指标
通過(guò)對(duì)Cloudbag雲平台可收集到的作業學(xué)習行爲進(jìn)行分析,同時參考已有文獻的量化指标,提煉出基于Cloudbag教育雲平台的學(xué)業勤奮習慣的具體測量指标,共得到兩(liǎng)個維度下的8項行爲指标,15項量化指标,本研究的假設框架見表1。這(zhè)15項量化指标與輸出均有關系,但沒(méi)有直接的線性關系。基于此框架進(jìn)行數據收集和分析,并修訂形成(chéng)最終的學(xué)業勤奮習慣子模型。
表1 學(xué)業勤奮習慣子模型的假設框架
2. 構建專家樣(yàng)本
建模的目的是將(jiāng)教師經(jīng)驗中的學(xué)習習慣與學(xué)習者的學(xué)習行爲建立聯系。本實驗的因變量是學(xué)業勤奮習慣,其數據來自于各種(zhǒng)作業行爲;自變量是專家樣(yàng)本,來自于教師研究者的人工标注。人工标注勤奮度數值分爲1~5類(1類勤奮度最低,5類勤奮度最高);編碼的一緻性檢驗結果Cohen’s Kappa系數爲0.712,對(duì)于不一緻的編碼,加入第三個研究者,共同協商決定編碼的類别。
3. 模型實驗
随機選取60%作爲訓練集、20%作爲校驗集、20%作爲測試集。模型選擇BP神經(jīng)網絡的多層感知器MLP模型,使用訓練集對(duì)模型進(jìn)行訓練,網絡結構爲:輸入層爲15個神經(jīng)元(歸一化後(hòu)的15維的特征向(xiàng)量),輸出層5個神經(jīng)元作爲分類結果(1類勤奮度最低,5類勤奮度最高),隐藏層爲5層。如圖2,多層感知器MLP模型對(duì)于學(xué)業勤奮分類的精度,在類别1和5上均超過(guò)了98%,達到了較高的值,說明模型在1和5類型上具有較高的識别能(néng)力,即對(duì)于“特别勤奮”和“特别懶惰”的兩(liǎng)類極端學(xué)習者具有較好(hǎo)的診斷能(néng)力,這(zhè)符合後(hòu)續研究的需要,即對(duì)勤奮度不高學(xué)習者幹預的前提是對(duì)其精确的診斷,尤其是診斷爲“懶惰”的學(xué)習者是重點幹預對(duì)象。模型在類别2和4上的精度在85%左右,雖沒(méi)有達到特别高的值,但符合實際情況,對(duì)于介于“特别勤奮”和“一般勤奮”,“特别懶惰”和“有點懶惰”之間的學(xué)習者,實踐證明,人工标準也會(huì)出現±1級别的誤差(在人工标注時,需加入第三個研究者對(duì)于不一緻的編碼進(jìn)行協商的情況,也是大多出現在對(duì)第2類和第4類的辨别上)。
4. 基于不同算法的模型比較分析
對(duì)于不同的分類問題,高精度的算法具有更好(hǎo)的識别能(néng)力。下面(miàn),將(jiāng)本實驗應用的算法與機器學(xué)習的主流分類算法進(jìn)行比較。收益圖提供了一種(zhǒng)評估和比較多個預測模型并選擇最合适的預測模型的方法。如圖2所示,多層感知器MLP取得了最好(hǎo)的預測效果,支持向(xiàng)量機SVM和TAN貝葉斯網絡也取得較好(hǎo)的預測效果,決策樹DecisionTree次之,徑向(xiàng)基函數RBF最差,可見多層感知器MLP算法的評估指标是五種(zhǒng)模型中最高的,對(duì)勤奮度分類結果是最優的。因此,本文提出的基于多層感知器MLP的學(xué)業勤奮模型,通過(guò)輸入的15維特征向(xiàng)量能(néng)夠較爲準确地診斷出學(xué)習者的勤奮度級别。
圖 2 多層感知器MLP模型的混淆矩陣與多個預測模型的收益圖
對(duì)于診斷出學(xué)習者的勤奮度級别的教育意義說明:勤奮度級别(1、2、3、4、5)分别代表特别不同級别的勤奮習慣(懶惰、有點懶惰、一般、勤奮、特别勤奮)。本研究認爲被(bèi)診斷爲4級和5級的學(xué)習者是具有良好(hǎo)作業習慣的,而被(bèi)診斷爲1級和2級的學(xué)習者是具有不良作業習慣的,分别被(bèi)定義爲“勤奮嚴重不足者”和“勤奮不足者”類别,對(duì)于不良作業習慣的學(xué)習者要采取相應的教育幹預,幫助其改善作業習慣。
本研究提出了學(xué)業拖延習慣和學(xué)業勤奮習慣的二維作業習慣模型,分别表征作業時間、作業努力兩(liǎng)個方面(miàn)作業行爲的頻繁程度對(duì)學(xué)習的影響。以往學(xué)業拖延的測量,通常都(dōu)是單一維度的對(duì)作業提交的截止時間的判斷,缺乏對(duì)做作業拖延的描述。本研究構建了包括“做的時間”和“完成(chéng)的時間”兩(liǎng)個維度的學(xué)業拖延習慣子模型,使學(xué)業拖延習慣的研究更加深入。學(xué)業勤奮習慣對(duì)于學(xué)習者的學(xué)業成(chéng)就(jiù)具有很好(hǎo)預測作用,但學(xué)業勤奮與其他可以用學(xué)習行爲來測量的概念(如學(xué)習行爲投入)相比,研究成(chéng)果卻相當有限,學(xué)業勤奮的測量也僅是通過(guò)一些調查問卷法。本研究提出學(xué)業勤奮習慣子模型包括時間投入和專注度兩(liǎng)個維度,并根據數據的特點,選擇應用人工神經(jīng)網絡實現對(duì)勤奮習慣的表征,診斷出五個級别的勤奮度,從而實現了通過(guò)學(xué)習行爲來測量學(xué)業勤奮習慣,改進(jìn)了學(xué)業勤奮習慣的測量方法。
由于學(xué)習習慣具有多場景、多學(xué)段的特征,未來需要將(jiāng)本研究提出的作業習慣二維模型在不同應用場景、不同年齡段群體、不同類型的數據結構表現形式上,作進(jìn)一步的驗證,使作業習慣測量模型進(jìn)行多次叠代,不斷提高模型的效度。
本文發(fā)表于《電化教育研究》2021年第7期,轉載請與電化教育研究雜志社編輯部聯系(官方郵箱:dhjyyj@163.com)。 引用請注明參考文獻:殷寶媛, 武法提.智能(néng)學(xué)習系統中作業習慣建模研究[J].電化教育研究,2021,42(7):61-67.
責任編輯:甄 暾
校 對(duì):樊曉紅 審 核:郭 炯
【參考文獻】
[1] GILL B P, SCHLOSSMAN S L. Villain or Savior? The American discourse on homework, 1850-2003[J]. Theory into practice, 2004, 43(3):174-181.
[2] 凱洛夫.教育學(xué)(上)[M].北京:人民教育出版社,1951:151.
[3] SINGH R, SALEEM M, PRADHAN P, et al. Feedback during web-based homework: the role of hints[C]// International Conference on Artificial Intelligence in Education. Auckland:Springer-Verlag, 2011:328-336.
[4] 殷寶媛,武法提.智能(néng)學(xué)習系統中學(xué)習習慣建模的方法研究[J].電化教育研究,2020,41(4):55-61.
[5] FLUNGER B, TRAUTWEIN U, NAGENGAST B, et al. A person-centered approach to homework behavior:students' characteristics predict their homework learning type[J]. Contemporary educational psychology, 2017, 48(7):1-15.
[6] DETTMERS S, TRAUTWEIN U, , et al. Students' emotions during homework in mathematics:testing a theoretical model of antecedents and achievement outcomes[J]. Contemporary educational psychology, 2011, 36(1):25-35.
[7] TRAUTWEIN U. The homework–achievement relation reconsidered:differentiating homework time, homework frequency, and homework effort[J]. Learning & instruction, 2007,17(3):372-388.
[8] DETTMERS S, TRAUTWEIN U,, OLIVER, et al. Homework works if homework quality is high:using multilevel modeling to predict the development of achievement in mathematics [J]. Journal of educational psychology, 2010,102(2):467-482.
[9] RABIN L A, FOGEL J, NUTTER-UPHAM K E. Academic procrastination in college students:the role of self-reported executive function[J]. Journal of clinical & experimental neuropsychology, 2011, 33(3):344-357.
[10] STAINTON M, LAY C H, FLETT G L. Trait procrastinators and behavior/trait-specific cognitions[J]. Journal of social behavior & personality, 2000, 15(5):297-312.
[11] TUCKMAN B W. The Development and concurrent validity of the procrastination scale[J]. Educational & psychological measurement, 1991, 51(2):473-480.
[12] SOLOMON L J, ROTHBLUM E D. Academic procrastination:frequency and cognitive-behavioral correlates[J].Journal of counseling psychology,1984,31(4):503-509.
[13] MILGRAM N A, BATORI G, MOWRER D. Correlates of academic procrastination[J]. Journal of school psychology, 1993, 31(4):487-500.
[14] LEVY Y, RAMIM M M. A Study of online exams procrastination using data analytics techniques[J]. Interdisciplinary journal of e-Learning and learning objects, 2012, 8(1):97-113.
[15] 雷浩,劉衍玲,魏錦,田瀾,王鑫強.基于時間投入——專注度雙維核心模型的高中生學(xué)業勤奮度研究[J].心理發(fā)展與教育,2012,28(4):384-391.
[16] BERNARD H, SCHUTTENBERG E M. Development of the diligence inventory-higher education form[J]. Journal of research & development in education, 1995(28):91-100.
[17] GALLA B M, PLUMMER B D, WHITE R E, et al. The Academic Diligence Task (ADT):assessing individual differences in effort on tedious but important schoolwork[J]. Contemporary educational psychology, 2014, 39(4):314-325.
[18] LOVAT T, CLEMENT N, DALLY K, et al. The impact of values education on school ambience and academic diligence[J]. International journal of educational research, 2011, 50(3):166-170.
[19] JASINEVICIUS T R, BERNARD H, SCHUTTENBERG E M. Application of the diligence inventory in dental education[J]. Journal of dental education, 1998, 62(4):294-301.
[20] 殷寶媛,武法提.學(xué)習習慣在線幹預的原理與模型設計[J].電化教育研究,2019,40(12):72-79.
Study on Modeling of Homework Habits in Intelligent Learning System
YIN Baoyuan1, WU Fati2
(1.School of Educational Science, Harbin Normal University, Harbin Heilongjiang 150080;
2.Engineering Research Center of Digital Learning and Education Public Service Ministry of Education, Beijing 100875)
[Abstract] Homework habits are closely related to learners' academic achievement and the modeling of homework habits is an urgent problem in the design of intelligent learning system. Based on a multi-level homework model, this study adopts a hybrid research approach to identify "academic procrastination" and "academic diligence" as two important and measurable dimensions of homework habits, which represent the two core types of homework behaviors: homework time and homework effort. A sub-model of academic procrastination habits is constructed, including procrastination in doing and submitting. Clustering is applied to diagnose the habit of academic procrastination, and four types of learners are defined as "non-procrastinators", "severe procrastinators", "procrastinators in submitting" and " procrastinators in doing". Based on the theoretical framework of time investment and focus model, a sub-model of academic diligence habits including time investment and focus is constructed. The artificial neural network is used to diagnose the academic diligence habits, as a result, five levels of diligence are diagnosed, and the validity of the model is verified.
[Keywords] Studying Habit; Homework Habit; Academic Procrastination; Academic Diligence; Intelligent Learning System; Modeling
基金項目:教育部人文社會(huì)科學(xué)研究青年基金項目“互聯網+教育背景下學(xué)生學(xué)習習慣的測評模型研究”(項目編号:18YJC880109)
[作者簡介] 殷寶媛(1980—),女,黑龍江哈爾濱人。副教授,博士,主要從事(shì)智能(néng)教育、學(xué)習分析、數字化學(xué)習資源與學(xué)習環境設計研究。E-mail:ybyuan2000@163.com。武法提爲通訊作者,E-mail:wft@bnu.edu.cn。
複印報刊資料重要轉載來源期刊 《電化教育研究》創刊于1980年,是我國(guó)教育與電教界的學(xué)術理論園地和權威性刊物,素有“中國(guó)電化教育理論研究基地”之稱譽。主要研究現代教育前沿問題,服務全國(guó)教育教學(xué)改革;關注國(guó)内外信息化教育理論的創新。 《電化教育研究》開(kāi)設的欄目主要包括理論探讨、網絡教育、學(xué)習環境與資源、課程與教學(xué)、學(xué)科建設與教師發(fā)展、中小學(xué)電教、曆史與國(guó)際比較等。
CSSCI來源期刊
RCCSE中國(guó)權威學(xué)術期刊
AMI核心期刊