港生常被指語文根基薄弱,錯別字百出。中文大學工程學院開發全港首個「錯字和粵語檢測系統(ACT)」,只花數秒,便可識別文章中的常見錯字、倒裝詞、粵語口語等,並提供修正建議,準繩度逾八成,助中小學生學習寫作。系統現時是測試階段,未來將逐步開放予中小學使用。os.tvboxnow.com* o$ h" {3 u \, p. A
每年文憑試的《考試報告》,均指出考生常犯錯別字,如有考生將「一己私慾」寫為「一己私肉」。中大工程學院副院長(外務)黃錦輝稱,實施新高中學制後,部分學校反映港生中文水平下降,年輕人亦慣於在社交網站、使用通訊軟件時,以口語、中英夾雜文句溝通,或多或少影響寫作能力。學院團隊獲香港應用科技研究院邀請,兩年前展開今次項目「錯字和粵語檢測系統(ACT)」。
& Z1 L$ n1 A" r' s: C5 {) L, {公仔箱論壇現時坊間亦設有相類似測錯字系統,但準確度未如理想,很容易把「的」、「地」等錯判為錯字。中大系統工程與工程管理學系研究員馮沛璋稱,ACT以大數據(Big Data)及深求學習(Deep Learning)為基礎建立系統,準確度超過八成,且功能更廣,可識別簡體字、倒裝詞、粵語字。
% s* q$ j: ?% C9 j) M3 p) Q( V公仔箱論壇學生可將長達千字的作文放入ACT分析,識別到四種情況,旁邊有附注建議,包括錯別字部分,如將「梁瓜」更正為「涼瓜」,「端兒」更正為「端倪」,以及識別量詞錯誤如「一隻魚」(一條魚)等;亦可檢測粵語字「佢」、「鍾意」。此外,還可辨識倒裝詞,如「要緊」、「緊要」,不過,馮沛璋稱「倒裝詞」並非一定是錯誤,但會先篩選出來,提醒學生。
+ {$ M, M- J1 F) k8 b- _7 g! Ntvb now,tvbnow,bttvb馮沛璋表示,語言與文字會隨着時間、地域而不斷演變,因而難以制定永久、放諸四海皆準的軟件。團隊以中小學課本、習作、字典建立系統資料庫,字量有逾一百萬個,亦參考數千份文憑試歷屆試題習作,將常見錯誤納入資料庫。黃錦輝稱,須不斷豐富字庫量,讓系統不斷「練習」,「就如人工智能圍棋程式AlphaGo般,不斷『練習』後愈來愈聰明。」TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。9 p$ s1 K5 X+ H" u
系統現時在測試階段,於數所學校及補習社試用。黃錦輝稱,系統是輔助工具,而非取代教師工作,「寫作的語境、文句語意,都須由教師教授。」團隊又計畫改良系統,未來轉化成辦公室軟件的插件,編輯文檔時,可檢查錯字,並開放予公眾使用。 |