近日,在“第三屆元宇宙教育前沿峰會”上,國家職業教育指導咨詢委員會委員、北京師范大學教育學部教授趙志群以《職業教育學習成果評價及其數字化展望》為主題發表演講。趙志群指出,合理的學習評價要體現黨和國家的教育方針,尊重和體現學生的個體差異,激發學生努力實現自身的價值。
(資料圖片僅供參考)
(以下根據嘉賓演講實錄編輯整理,全文有刪減)
學習成果評價也叫學業評價,是指以教育教學目標為依據,運用恰當有效的工具,系統收集學生在學習過程中認知行為變化的信息和證據,根據一定的標準對學生的知識、技能和能力水平做出客觀衡量和科學判定的過程。
合理的學習評價要體現黨和國家的教育方針,尊重和體現學生的個體差異,激發學生努力實現自身的價值。相較于普通教育,職業教育的學習成果評價更加復雜,不僅要向普通教育一樣滿足促進學生生涯發展的教育性要求,同時也要迎合勞動力市場的功利性需求。
教育部曾作過一個調查。我們一般認為技能大賽成績越好的學生技能和能力越好,將來發展也越好。但是跟蹤調查發現,某項技能大賽成績好的選手綜合素質反而低,而且這種劣勢在工作若干年后表現更為明顯。也就是說,一些技能大賽沒有反映企業的關鍵需求。這盡管不是普遍現象,但是反映出的問題卻很嚴重,即學習結果評價方式一定要關心評價技術和方法的科學性。
學習成果評價不是出一道試題那么簡單,正如上圖漫畫中老師出的題目:跳到樹枝上大象很發愁,但猴子很開心。但大象一定不如猴子嗎?那可不一定。要想找到一種方式把猴子和大象的優缺點都考查出來,需要科學的評價理念和評價方法。
職業教育學習成果評價主要是對學生職業素質、能力和技能進行評價,其方法有兩大類。一類是傳統的考試,考試的特點是有對錯之分;另一類是職業能力測評,它的特點是沒有對錯之分,只有水平高低之分。例如我們不能評價一位老師上課能力是對還是錯,只能說上課能力水平的高或低。
還有一個重要特點,考試反映的是某種標準的效度。如教學標準、技能標準或者課程標準;能力測評反映職業的效度。這兩種方式各有所長,互為補充,無法相互替代。
傳統的技能考試采用“知識+實踐技能”考試方式,知識考試通過筆試進行,實踐技能考試主要通過現場或模擬操作觀察進行評分。傳統技能考試有很大的技術局限性。例如奧運會跳臺跳水,10個裁判評分,去掉最高和最低分后采用平均分。也就是說,代表世界最高水平的裁判對標準動作的技能評分都是不一樣,為了公平只能取去掉最高和最低分后的平均分。大規模的職業技能考試能做到絕對公平嗎?這不太可能。因為如果要想實現高質量的技能評價,人員、時間等費用會高得讓人無法接受。
當前,人類工作活動的復雜程度越來越高,技能的內涵已經發生了深刻的變化,尤其是隨著心智技能的作用越來越凸顯,采用觀察法進行評價,其信度、效度和區分度無法得到保證,即傳統的技能考試無法保證評價的質量。
隨著社會的發展,對技術技能型人才的素質要求也發生了變化。根據“職教20條”的描述,現代社會的技能是一種綜合能力。未來對簡單重復性的操作技能需求會越來越少,因為機器會比人類做得又快又準確。未來人類要做機器不能做的事情,需要的技能越來越復雜、綜合,這就是綜合能力。
這種要求體現在世界技能大賽上,這可能是世界上水平最高的技能評價。按照世界技能大賽的理念,要想評價出一個參賽選手技能水平高低,僅憑一兩道簡單的封閉性題目是不可能的。選手需要兩至三天時間完成復雜的、開放的綜合性題目,由此評價選手解決問題的能力、學習能力和創新能力,因為這里有1/3的新知識和技能是要“現學現賣”的。這里的時間、設備和組織成本都很高。因此,所以我們必須尋找其他方式補充技能考試的不足,那就是職業能力測評。
職業能力測評和考試的區別在于,它不是評價背會了多少知識,有多少操作技能,而是評價應用知識和技能解決實際問題的能力。能力測評有兩種范式,一種是質性評價,一種是量化評價。
實踐中的職業能力測評更多采用量化和質性相結合的混合式方法,它評價學生在職業工作和生涯發展中所需要的知識和技能,而不是考背會了多少知識,關注考生在實際工作情境中是否能夠創造性地運用專業知識和技能解決問題的能力。能力測評不是現有考試或技能競賽的替代,而是補充。它對技術的要求較高,要想實現高質量的測評,需要精心控制整個評價過程。
職業教育界對大規模職業能力測評有強烈的訴求,因為:企業需要了解員工或求職者的職業能力;教育部門關心每個學校培養的學生水平如何;院校要監測學生的發展情況;一線老師需要科學的能力模型和能力工具,幫助分析教學設計和實施中的問題;國際比較研究需要大規模職業能力測評提供實證基礎。
開展科學的能力測評存在很多困難,比如各地區之間的差異很大,專業太多,技術更新太快等。要想進行科學的能力測評首先得建模,其能力模型必須符合現代職業教育理論,包括心理學、教育學、社會學等主流認知。在能力模型基礎上才能建立評價模型、確定指標、出題和開展評價。能力測評方案的開發一定要有扎實的理論基礎。
上圖這個三維模型是COMET職業能力模型。
圖中第一個維度是能力水平,即能力要求。能力最低水平為名義能力,意味著不及格;及格后首先要滿足崗位的要求,然后滿足整個企業運行的要求,最高要滿足社會和可持續發展需求,并實現個性解放,即有創新能力。
第二個維度是內容維度。按照能力發展邏輯,從初學者到專家,完成復雜程度不同的工作任務,要關注每一階段的任務特征、知識形態和職業活動特點。
第三個維度是行動維度。職業教育要關注學生學會工作,即行動。新職業教育法第三條明確指出:職業教育要培養學生的職業素質和行動能力。
所建立的測評模型和測評題目需要經過測量學驗證,即信度、效度、區分度要達到一定的要求,這樣的測評才有價值。測評題目是開放性的,因為職業的典型工作任務沒有標準答案。
職業能力測評題目特點是,它是來源于職業及企業工作實踐的真實問題,是職業的典型工作任務,有不同深度和廣度的答案,為被測學生留出較大的解決空間。它最大的特點是可以評價實踐性知識。測評結束后,每個學生會得到一個分數和能力特征輪廓圖,由此可以進行個體之間、班級或學校之間的比較。
要實現高質量的職業教育學習成果評價,第一要理解當代社會的職業技能,即“職教20條”中指出的綜合能力,或稱行動能力。行動能力是個人在特定職業、社會和私人情景中進行縝密而恰當的思考,并對個人和社會負責任行事的意愿和本領。行動能力的評價只能通過“真實性評價”,即在具體工作情景中才能實現,這需要科學的評價模型。職業教育評價關心的核心不是傳統的數理認知能力,而是“職業認知能力”或者“工作認知能力”,這與普通教育之間有著類型上從差別。
學習評價的目的是為了促進學習結果的改善,促進學習者的能力發展,即“以評促建”。數字化評價的目的與數字化學習方式有直接的聯系:傳統的學習是課程學習,數字化學習是綜合能力的提高;傳統的課程是有計劃、學生被動的學習,數字化學習是學生主動的,可根據需求設計自己的學習方式;傳統學習方式是教師精心設計教學過程和傳授知識,數字化學習是情境學習、具有虛擬的、共創和參與式特點;傳統學習的授課者是老師,數字化學習的老師還包括教練、同伴和實踐共同體;傳統學習評價主要通過考試鑒定,而有效的評價還需要實際應用、同行評議和職業能力測評。
當前,我們正在步入Web3.0時代,但目前數字化教學資源建設的主流思想還停留在Wed1.0時代,即把書本知識放在網上或云空間。現在的年輕人是在Web2.0、3.0中成長起來的,他們怎么會對用1.0理念開發的學習資源感興趣?數字化時代的職業學習評價,是數字化的綜合性學習與評價,職業院校與企業共享學習成果共同評價,這需要可促進行動學習、評價行動能力的輔助工具,如支持學習者做中學的人機對話系統和來自真實工作過程的豐富信息。