基于學(xué)習(xí)分析的在線學(xué)業(yè)成就影響因素研究
發(fā)布時間:2019-08-07 來源: 短文摘抄 點擊:
摘要:如何利用數(shù)據(jù)和模型來預(yù)測學(xué)業(yè)成功與失敗是學(xué)習(xí)分析領(lǐng)域的核心問題。該文通過對現(xiàn)有文獻檢索分析出目前研究中主要影響學(xué)業(yè)成就的要素,結(jié)合對原始數(shù)據(jù)的深度處理,得到和學(xué)習(xí)相關(guān)的高級行為指標(biāo),利用機器學(xué)習(xí)中神經(jīng)網(wǎng)絡(luò)、決策樹及線性回歸算法分別建模分析。研究發(fā)現(xiàn):學(xué)習(xí)態(tài)度、學(xué)習(xí)及時水平和投入水平是影響在線學(xué)業(yè)成就的主要因素,耐挫水平為次要因素,而互動水平、積極水平和階段成效對最終的學(xué)業(yè)成就無關(guān)。該文最后對研究結(jié)果進行了反思后認(rèn)為,課程選取對研究在線學(xué)業(yè)成就要素有非常大的影響。
關(guān)鍵詞:學(xué)習(xí)分析;在線課程;學(xué)業(yè)成就;機器學(xué)習(xí)
中圖分類號:G434 文獻標(biāo)識碼:A
一、引言
隨著大數(shù)據(jù)的應(yīng)用普及,很多行業(yè)(如金融、零售)都發(fā)生了巨大的變化。但一直以來,教育領(lǐng)域是在大數(shù)據(jù)中受益最少的領(lǐng)域之一,缺乏“數(shù)據(jù)驅(qū)動的思維(Data-driven Mind-set)”是教育領(lǐng)域當(dāng)今面臨的主要障礙。相對于流程清晰規(guī)范的金融系統(tǒng),教育是一個超級復(fù)雜的系統(tǒng),各類教育實踐活動產(chǎn)生了比金融行業(yè)要多得多的數(shù)據(jù)。因此,如何利用好教育數(shù)據(jù),并從中發(fā)掘其背后的教育規(guī)律成了研究者最近關(guān)注的重點。自2010年起,學(xué)習(xí)分析(Learning Analytics,簡稱LA)逐漸從分析領(lǐng)域獨立出來,吸納數(shù)據(jù)挖掘、社會網(wǎng)絡(luò)分析、統(tǒng)計分析等多種分析方法,形成了一個獨立的新興領(lǐng)域。從此,學(xué)習(xí)分析作為分析技術(shù)在教育領(lǐng)域中的應(yīng)用和發(fā)展,受到越來越多研究者的關(guān)注和重視。運用在教育領(lǐng)域的學(xué)習(xí)分析主要任務(wù)是通過對學(xué)習(xí)者產(chǎn)生和收集到的相關(guān)數(shù)據(jù)進行分析和闡釋,來評估學(xué)習(xí)者的學(xué)業(yè)成就、預(yù)測其學(xué)習(xí)表現(xiàn)并發(fā)現(xiàn)存在問題的過程。因此如何利用學(xué)習(xí)分析技術(shù)來預(yù)測學(xué)業(yè)成功與失敗是該領(lǐng)域核心問題。
二、文獻綜述
最近幾年,圍繞學(xué)業(yè)分析與學(xué)業(yè)成就這一話題,國內(nèi)外學(xué)者的研究主要聚焦在學(xué)業(yè)成就模型和指標(biāo)的研究上。Usamah通過對14個典型的學(xué)習(xí)分析系統(tǒng)和應(yīng)用進行研究后指出,學(xué)習(xí)分析中數(shù)據(jù)輸入應(yīng)該包含盡可能多的數(shù)據(jù),而不應(yīng)綁定在兩種或三種類型的數(shù)據(jù)中,并最終梳理出包含學(xué)習(xí)者往期學(xué)業(yè)表現(xiàn)、課程參與情況、學(xué)習(xí)者背景、社交表現(xiàn)等多個預(yù)測學(xué)業(yè)表現(xiàn)的重要指標(biāo)。Bukralia使用學(xué)業(yè)能力、經(jīng)濟水平、學(xué)業(yè)目標(biāo)、技術(shù)準(zhǔn)備、人口統(tǒng)計、課程動機與參與以及課程特征作為預(yù)測學(xué)業(yè)風(fēng)險或成就的指標(biāo)。G.Siemens等對學(xué)習(xí)者基本情況、學(xué)習(xí)目標(biāo)、動機水平、認(rèn)知風(fēng)格、學(xué)習(xí)需要的數(shù)據(jù)進行收集,并對在線學(xué)習(xí)影響因素進行分析,其成果為促進學(xué)生學(xué)業(yè)成功提供了有力支撐。武法提和牟智佳基于學(xué)習(xí)者行為分析提出了以教學(xué)目標(biāo)分類理論、個性化學(xué)習(xí)理論和社會認(rèn)知理論為指導(dǎo)的,以“目標(biāo)-過程-結(jié)果”為思想的學(xué)習(xí)結(jié)果分類預(yù)測框架,并以edX平臺上一門MOOC課程的學(xué)習(xí)行為數(shù)據(jù)為研究對象進行探索,通過將視頻學(xué)習(xí)次數(shù)、文本學(xué)習(xí)次數(shù)、評價參與時長、評價參與次數(shù)和論壇主題發(fā)起數(shù)作為行為指標(biāo)組合,發(fā)現(xiàn)學(xué)習(xí)次數(shù)的預(yù)測效果要好于學(xué)習(xí)時長,并與學(xué)習(xí)時長和學(xué)習(xí)次數(shù)結(jié)合后的預(yù)測效果接近。李爽等基于學(xué)習(xí)者在線學(xué)習(xí)行為投入歸納出參與、堅持、專注、交互、學(xué)術(shù)挑戰(zhàn)、學(xué)習(xí)自我監(jiān)控等六個在線學(xué)業(yè)成就評價指標(biāo)維度。陳子健等通過計算所有單個數(shù)據(jù)屬性和學(xué)業(yè)成績類別之間的相關(guān)系數(shù)及計算所有屬性的信息增益率兩種方法共同確定學(xué)業(yè)成績的影響因素。
通過對以上分析研究發(fā)現(xiàn),在研究內(nèi)容及數(shù)據(jù)的處理上,目前大部分研究主要以理論探討、框架分析為主,部分以數(shù)據(jù)為基礎(chǔ)的實證分析主要是使用了在線平臺基礎(chǔ)的原始數(shù)據(jù),如各類行為的時長、頻次等,對同一行為的多條數(shù)據(jù)的處理方法主要是取均值,如用所有練習(xí)的成績平均值來代表最終成績等。鑒于在線學(xué)習(xí)不同用戶的學(xué)習(xí)習(xí)慣不同、分配時間的方式不同、每個練習(xí)難度也不同,同一個學(xué)習(xí)者完成相似任務(wù)所需要的時間及次數(shù)差異都非常大,不同的學(xué)習(xí)者完成不同任務(wù)的次數(shù)和時間會相差更大,對原始數(shù)據(jù)簡單的均值處理顯然不太合理,因此需要對原始數(shù)據(jù)進行歸一化處理。如Grabe和Sigler通過研究對各類時間進行了估計,所有超過2分鐘的學(xué)習(xí)行為時間將被替換成2分鐘,選擇題答題時間最高設(shè)定為90秒,使用這種簡單規(guī)則,的確降低了數(shù)據(jù)的處理難度,在一定程度上對數(shù)據(jù)進行了歸一化處理,但同時也丟失了包含大量用戶特征的數(shù)據(jù)。在研究方法上,很多研究都通過理論分析指出了影響在線學(xué)習(xí)學(xué)業(yè)成就的因素,然后通過調(diào)查問卷或少量在線數(shù)據(jù)來建模驗證,數(shù)據(jù)處理的方式多用回歸分析或結(jié)構(gòu)方程模型,很少使用大數(shù)據(jù)研究所采用的機器學(xué)習(xí)算法來進行建模并對模型進行深入分析。
三、分析框架
本研究參照上述文獻中關(guān)于學(xué)業(yè)成就框架的研究結(jié)果,對基本的原始數(shù)據(jù)進行歸一化處理后,結(jié)合文獻中研究得出的影響學(xué)業(yè)成就指標(biāo),選取了及時水平、投入水平、互動水平、耐挫水平、積極水平、學(xué)習(xí)態(tài)度、階段成效等七個維度作為分析在線學(xué)業(yè)成績的指標(biāo),并選擇了對相關(guān)底層數(shù)據(jù)進行更深入挖掘后所形成的“高級數(shù)據(jù)”作為以上維度的指標(biāo)項,構(gòu)建了學(xué)業(yè)成績要素分析的框架,如表1所示。使用線下成績作為學(xué)業(yè)成就的標(biāo)簽數(shù)據(jù),利用機器學(xué)習(xí)算法構(gòu)建模型,分析哪些指標(biāo)是影響在線學(xué)習(xí)成就的主要指標(biāo)。
。ㄒ唬┑谝淮螌W(xué)習(xí)課程時間
考慮到課程的創(chuàng)建與發(fā)布時間不一定就是學(xué)習(xí)者可以學(xué)習(xí)的時間,因此本研究使用課程第一個學(xué)習(xí)者開始學(xué)習(xí)的時間為起始點,其他學(xué)習(xí)者第一次學(xué)習(xí)課程的時間與起始點之間的間隔,即為該學(xué)習(xí)者的第一次學(xué)習(xí)課程時間,該時間為相對時間,以天為單位。第一次學(xué)習(xí)課程的時間反映了學(xué)習(xí)者能否迅速開始學(xué)習(xí)活動。
。ǘ┢骄陀^題開始答題時間
客觀題開始答題時間:采用和第一次學(xué)習(xí)課程時間相同的研究方法,將從每個客觀題作業(yè)第—個學(xué)習(xí)者開始答題的時間開始,到其他學(xué)習(xí)者開始作答該客觀題作業(yè)時間結(jié)束,定義為該學(xué)習(xí)者該客觀題的開始答題時間,該時間為相對時間,以天為單位。
平均客觀題開始答題時間:某學(xué)習(xí)者某一門課程全部客觀題作業(yè)的客觀題開始答題時間的平均值定義為該學(xué)習(xí)者的平均客觀題開始答題時間。通過平均客觀題開始答題時間,可以反映出學(xué)習(xí)者開始學(xué)習(xí)課程新資源的主動性和及時性。
相關(guān)熱詞搜索:在線 學(xué)業(yè) 成就 因素 影響
熱點文章閱讀