超越算法:淺談語文科中人工智能工具不能教育學生的關鍵領域

一. 引言

在人工智能的發展歷史中,它總能不斷滿足人類對它的幻想和需要,甚至在人類作為萬物之靈而引以自豪的一些領域,如下圍棋上戰勝人類——它的創造者。所以聊天生成預訓練轉換器(ChatGPT)一面世,又再次引發人們暢想,教人探討在教育領域的無限可能,特別是當它瞬間能產生大段看似通順的文字,生成文本、回答問題,甚至模仿特定寫作風格都能勝任,自然引起廣泛關注。事到今天,已經過了18個月,如果是科技硬件,已經足夠迭代(Iteration),但對於軟件工具,除了人們在應用方法上精益求精外,工具本身在語文科教與學中的效能和限制仍沒有怎樣改變過。本文正是從一個用了18個月,平均每日用幾次的用家前線語文教師角度討論現況和本質問題。

 

二. 語文的本質和應試的需要,如何局限了人工智能的發揮

生成式人工智能的機制是基於數據庫中資料的相關程度組合材料,產生通順的文段,但它們實際缺乏真正的語文理解能力。基礎應用上,語文本質是共時性,特定其中一項是最基本的上文下理的理解(Context in textual interpretation)。在這方面,人工智能表現的水平有時還不如一個10歲小孩。

至於語文中較微妙的修辭格,如借喻、委婉、象徵、通感、雙關,都不是它擅長的範圍。當中特別是雙關,背後既可能是象徵、比喻,也可能是語義演變下產生的一詞多義現象,這除了是語文的共時性,也是語文的歷時性。所以,人工智能除了對文學,對文言文的解讀也多問題。

在中學,無論閱讀,還是寫作,都避不開意念的提升、拓展和呼應等。這些體現了「文以載道」——借語文培養一個人素質的理念,可謂是高中語文學習的重中之重,在公開考試中避無可避。但這些都是已公開版本人工智能工具的空白處,限制了人工智能在高級語文分析和寫作指導方面的應用。

語文教育還涉及情感教育和價值觀的塑造。人工智能工具缺乏情感智能和道德判斷力,無法有效承擔上述教育功能。語文和文化、文學,關係密不可分,取法乎上的語文教材往往是優秀文學作品,所蘊含的深刻的人文精神和道德啟示,需要通過人與人之間的互動和討論來深入理解和內化。人工智能雖然可以在討論中讓學生知道和了解,但卻完全不能帶動(Move)學生實踐。

 

三. 生成式人工智能工具在語文教學中的應用現狀

語文教學中有施教、學習、評估等組成部分,包括有閱讀、寫作、聆聽、說話四個核心範疇,連繫着文學、文化、品德情意、自學能力、思維幾個延伸範疇。目前,就筆者所見,生成式人工智能工具在語文教學中的應用,可謂各師各法,不同學校都撥出資源,推動人工智能應用,從而改進施教、學習、評估,當中主要集中在核心範疇的幾種場景:

  1. 輔助閱讀理解和分析

按照祝新華教授,閱讀有六層次:撮取、理解、重整、伸展、評鑑、創意。最近的測試中,人工智能可以在以千萬,甚至上億的文字中迅速找到問題相關的關鍵訊息,整合為答案,但可以說它仍不能理解文意,對言外之意更沒有辦法。亦即是說,人工智能可以幫學生解答到小學程度基本閱讀理解問題,但教不了學生如何解答,遑言初中程度甚至更高級別的複雜題目。

在這方面,語文科教學暫時只用於問題引導式的任務型教學,讓人工智能和學生同樣拿着同一個作品文本,在教師設計和安排下讓人工智能示範如何完成基礎題目或者不同角度分析基礎文意。示範教學法是一向老師教學生操作閱讀理解題目,培養學生閱讀理解能力的方法,如果能理順流程,寫成一套標準,學生可以自行學習。

 2.  寫作建議和評改回饋

人工智能可通過學習足夠的示例或教學目標或能力框架,從而掌握到某特定體裁所需呈現的關鍵能力、某特定題目所需展示的基本內容,再檢驗學生作文在上述方面的有無和多寡,指出學生的遺漏。在小學而言,學生補漏後的作品已屬佳作,但在中學,這只足夠讓不及格的學生可以改善至及格或稍好一點的成績,要提供意念讓中等表現的學生寫出優秀作文還距離很遠。

在國家語委語言智能研究中心指導下,大陸有公司開發了網上「中文智能作文批改系統」平台,宣稱全國惟一以人工智能、大數據、語言和內容作評測,也是首個基於語義的評閱系統。分數和評語回饋準確與否,這裡未可判斷,但作參考就無不可。每秒都有幾個來自全國不同地方、不同級別的學生遞交作文,一半是得到回饋後,修改再交,系統能顯示每次修改令分數增加多少。這無疑是一種學生為本的學習,也是現時用人工智能幫助寫作的最好設計之一。

3. 自動生成文本或題目

讓人工智能工具按照規則、指示或問題,根據它受訓練的數據庫訊息,或者從網上蒐集資料,提供已組織的文本,以作回應。這是在小學低年級學生常見的應用場景,用來取代搜尋引擎。但生成式人工智能工具和搜尋引擎各有所長,最近不少小學會教學生作比較,分辨不同類型的任務要用甚麼工具。這正是人工智能暫時仍教不了學生,而必須要老師引導的高階思維——元認知(Metacognition)。

在短時間內大量生成作句或者段落寫作示例,如果能提供不同例子,效果始終會較好。用人工智能生成題目,也有不少人嘗試過。在小學階段,人工智能較能生成到接近完成品,只需一點修訂的題目,不論是語文運用、課文詞語、還是閱讀理解,都庶幾勝任,避免了只用出版社材料;在中學,就必須提供題庫為例子,之後人工智能才可生成出一大堆題目,從中會有一、兩成在修改後,水平接近出版社的材料,尚算可用。

4. 語言翻譯和口語練習

如果是第二語言學習,在字詞記認方面,自動生成配合其年級的字詞和母語的翻譯,或者提供文章,生成基本的雙語閱讀理解題目,如選擇題、簡答題和是非題等類別,反而較適用。人工智能可以迅速翻譯大量文本,雖然不一定準確,但對幫助學生快速理解外語材料,累積詞彙的效果,是無容置疑的。學生甚至可以通過比較人工智能不準確的翻譯和人類翻譯,準確地學習。

口語練習上,場景包括發音偵測和糾正、模擬對話情景、語音識別和紀錄供文法糾正。因為能根據學生的水平和需求,提供全天候個性化的口語練習內容,又避免找不到老師和不斷失敗的尷尬,所以這方面應用已有多年,不贅談了。

 

四. 學生能力發展的潛在問題

運用人工智能工具,無疑會減少學生思考的次數,好處是減去了思維負擔,但同時也減少了因為量變而發生的質變。在閱讀理論中,對未具抽象思維、框架意識的小朋友來說,反複閱讀同一本感興趣的書,比起多讀幾本內容不同,小朋友大腦難以串連關係的書,更能加深刺激,開發智力。同樣,如果學生只是「用」(Learn with)人工智能學習,往往不能「借」(Learn by)人工智能帶來成長,更不是「學」(Learn from)人工智能,很快會發現運用人工智能後學習表現甚至比自己平日表現好。當學生大量借助人工智能工具完成課業,教師將難以準確評估學生的真實語文能力。過度依賴應用人工智能,而不是借助人工智能來學習,學生減少了面對困難的機會,自然也減少了思考解難技巧的運用,不利培養思考、解難的能力和態度。

 

五. 其他實際問題

生成式人工智能基於數據庫中資料的相關程度,會錯誤將不符合事實或邏輯的材料和問題連繫,並自嘗試運用其論述功能自圓其說,其中一個典型例子就是生成式人工智能工具剛面世時計算99999+9,會答100000。這種被稱為「幻覺」的現象,本質是誤導學生——如果出現在人類教師身上,後果是因為教學「嚴重錯誤」、「欠缺擔任教師的能力」,被取消教師註冊,其科主任也可能因此收譴責信。因為人工智能本身無法有足夠判斷力,其糾錯機制一定不能避免這種問題,教師使用時必須花費額外時間檢查,某種程度上抵消了使用人工智能的效率優勢。

使用人工智能工具往往涉及學生課業資料或數據的收集和處理。人工智能在解答問題的需要下,會將這些資料重組和再現時,而沒有意識和判斷能力去保護敏感訊息和私隱。如果是學生為了方便而主動提供,其實不利資訊科技素養的培育;如果是教師提供,就會自處於侵害學生權益的不利位置上。

 

六. 結論

有人把遛狗的人和狗比喻作股票和實體經濟的關係,有時是前者帶動後者,有時是後者帶動前者;同樣生成式人工智能工具帶動了語文教育新的發展機遇,但同時,語言理解深度、應試訓練、情感培養、學生能力發展等方面諸多限制,又需要語文教育者追上來帶動人工智能工具的革新。

我們可以樂觀地相信,如何在語文教學中善用人工智能工具,仍會是未來一段時間流行的研究課題,教師和人工智能仍是合作關係。教師在利用工具提高教學效率的同時,將會更重視培養學生的文字鑑賞感受能力、慎思明辨的判斷力、元認知自學能力,用以補足人工智能難以教人類的核心能力。

 

 

 

此文曾刊載於《信報教育》,2024-07-08。於2024年9月13日修訂。