因為教授誤用 ChatGPT,全班學生的畢業差點成為一個大問題。
(資料圖)
整理 |?屠敏
出品 | CSDN(ID:CSDNnews)
曾幾何時,震懾無數學生的「學好數理化,走遍天下都不怕」Slogan 在 AI 互聯網時代,正在變得失效。現如今,儼然已變成 GPT 打遍天下無敵手。
在此趨勢下,無數學生群體借助 GPT 生成論文、完成計算、填補作業......這也讓很多學術界的教授們煩惱不已,稱很多學生喪失了自主學習、獨立思考的能力,只知道把問題拋給 GPT 工具來解答。
為了反向抵制這種情況,一名教授決定用“魔法”打敗“魔法”,萬萬沒想到的是,當他誤把生成式的聊天機器人 ChatGPT 用來檢測學生自己完成的學術論文時,所有學生的成績不僅都變為了“不及格”,甚至連獲得畢業證都成為了問題。
事情緣由
具體的事情起因,要從一位名為?DearKick?網友在 Reddit 社交平臺無奈發的帖子說起。
原來是德克薩斯 A&M 大學商業學院(Texas A&M University-Commerce)農業科學和自然資源系教農業課程教授 Jared Mumm 對所有學生發了一封郵件,稱他正在使用 AI 工具來評估學生提交的作業是由人類編寫的還是計算機生成的。
根據披露的截圖,郵件完整的內容如下:
下午好!
你們現在應該都能在 D2L(大學常用的在線課程管理系統)上看到你們的課程最終成績。在每個人單獨給我發電子郵件之前,請仔細閱讀這封郵件。
在給你們的最后三次作業評分時,我已經在 Chat GTP 上開通了自己的賬戶。我登錄這個賬戶后,復制并粘貼你們的回答,Chat GTP 會告訴我,這些內容是否是程序自動生成的內容。我把每個人的最后三次作業分別輸入兩次,如果它們都被 Chat GTP 認領是 AI 生成的,你就會得到 0 分。
我對這門課的最終成績提交將在今天下午 5 點截止。我將給這門課程的每個人打 "X"。如果你對今天下午 5 點前在 D2L 上看到的成績不滿意,你將完成另一項作業。如果你對你的成績感到滿意,就不要交下一份作業。
對于新提交的作業,你需要在周五下午 5 點前完成。它將通過電子郵件發送給你一個 word 文檔。如果你提交新作業的時間是在星期五下午 5 點之后,你將收到當前在電腦中已經顯示的成績。這項作業的價值為 200 分。
本作業的提示如下:你正在為一家農場主提供咨詢服務,他們要求你幫助他們決定是否應該在母豬生產小豬時候,匍匐喂它們吃東西。
你要列出 5 個理由。不過,當我通過 Chat GTP 程序來檢查的時候,如果有任何使用的跡象,不僅你現在的成績會維持現狀,而且我會在課堂成績之外判定你為學術不端,這將影響你未來參加任何一門我的課程或這所大學的任何其他課程。
一石激起千層浪,很多學生比較懵,不知教授到底是在干什么。
不難看出,這封郵件中包含了不少錯誤,譬如時下流行的 AIGC 工具是叫「ChatGPT」,而非“Chat GTP”。
而產生這種關鍵錯誤的背后,在于教授似乎并不懂 ChatGPT 這款工具以及工作原理,將這款生成式的 AI 聊天機器人 ChatGPT 誤當做檢測 AI 內容的工具。
毋庸置疑,工具都用錯了,結果肯定不會好到哪里去。
正如眾人所料,ChatGPT 最終將很多學生提交的作業標記為 AI 生成的。
據外媒 rollingstone 報道,學生不是沒有想過要向教授解釋,只是他們解釋了,教授不聽。甚至當有學生向教授提供沒有使用過 ChatGPT 的證據時,教授忽略的這一點,甚至“爆臟話”,在學校的評分軟件系統中評論說:
“我不給 AI Shit 評分。”
無奈之下,有學生“發郵件聯系了院長并抄送給大學校長”,但是沒有立即得到幫助。被卷入這場風波的學生說,明明他們的文章確實是他們自己寫的。更讓他們感到崩潰的是,一部分臨近畢業的學生被暫時扣留了畢業證書。還有網友表述,Mumm 教授以類似的方式讓“幾個”整個班級都不及格,而不是質疑他檢測作弊者方法的有效性。
來自學生的反擊
對于熟悉 ChatGPT 工具的人想必都知道,它是繼續大量數據訓練而成,根據各種提示,也極容易模仿人類書寫的內容,自然也會將人類編寫的內容識別為“AI 生成的”。
為了證明 ChatGPT 易錯性這一點,網友?Delicious_Village112?復制了一段?Mumm 教授發表過的論文摘要,并詢問 ChatGPT 這是人類編寫的還是 AI 生成的。
結果 ChatGPT 認為它可能是“AI 生成的”:「是的,如果得到正確的提示,你分享的段落確實可能是由像 ChatGPT 這樣的語言模型生成的。」
大學緊急發布聲明
面對越來越多的學生在網上開始爆料這一事件,德克薩斯 A&M 大學商業學院緊急發布聲明回應:已經解決了農業課堂中對 ChatGPT 的擔憂。
在聲明中,這所高校表示,他們注意到最近的幾篇新聞報道涉及到這樣的指控:德克薩斯A&M大學商業學院農業課的高年級學生由于對人工智能生成的作業有疑問而獲得了不及格的成績,并被暫時拒絕頒發文憑。
A&M-Commerce 證實,沒有學生因為這個問題而掛科或被禁止畢業。
當前,這班的班主任教授 Jared Mumm 博士正在與學生就最后一次的書面作業進行單獨溝通。一些學生獲得了“X”的臨時成績——表示“未完成”——以便讓教授和學生有時間確定是否使用了 AI 來寫作業,如果是的話,再做級別判定。
目前,已有幾名學生被免除嫌疑,他們的成績也已經公布,而一名學生已經站出來承認他在作業中使用了 ChatGPT。其他幾名學生選擇完成 Mumm 博士提供給他們的新作業。
公告稱,大學官員正在調查這一事件,并制定政策來解決在課堂上使用或濫用人工智能技術的問題。他們還在努力采用人工智能檢測工具和其他資源來管理人工智能技術和高等教育的交叉問題。在課業中使用人工智能是所有學習機構面臨的一個快速變化的問題。
與此同時,網友 DearKick 在最初的帖子下面更新道,迄今為止,教授已經向被冤枉的 1 名學生道歉:
情況(大部分)已解決。
在與教授和幾位行政官員的會面中,我們了解到幾個關鍵點:
最初人們認為整個班級的畢業證發放都被擱置了,但實際上只是班級的一半多一點人員被波及。
畢業證處于“保留”狀態,直到“對每個人的調查完成”。
學校表示,他們沒有禁止任何人畢業/離開學校,因為畢業證處于“保留”狀態,還沒有正式被拒絕。
DearKick 稱,到目前為止,他已經與幾名學生交談過,截至撰寫此評論時,已有 1 名學生通過在谷歌文檔中編輯的時間而被免除嫌疑,雖然他們的畢業證還沒有發放,但應該發布。
與此同時,DearKick 透露稱,「由于教授的粗言穢語和與學生的不專業溝通,他的工作可能會受到影響,不過,不是因為對 AI 工具的錯誤使用。」據悉,該教授向迄今為止被證明沒有作假的 1 名學生道歉。
什么樣的情況下才能使用 ChatGPT?
截至目前,這份聲明似乎解決了大部分學生的問題,但是這一次教育工作者對于 AI 工具錯誤使用而引發的混亂,也讓很多人擔憂不已。
高校里面是否應該使用 AI 工具?老師又是否應該使用軟件來檢測學生提交作業中 AI 生成的內容?
其實,在 ChatGPT 剛剛出現的時候,不少大學教授就呼吁不可以使用 ChatGPT。甚至一位來自弗曼大學哲學助理教授
Darren Hick
還曾發文分享,抓到了一位用 AI 寫論文的作弊者,并上報了上去。
在這一趨勢下,美國紐約市教育部
正式宣布
:紐約市的學生和教師,無法再在教育部設備或互聯網上訪問 ChatGPT。
事實上,ChatGPT 并不是用于對 AI 生成的文本進行識別的最佳工具,它甚至無法準確確定是否有人用它來寫一篇文章。
過去幾個月間,雖然 OpenAI 推出??
AI-Text-Classifier
、斯坦福大學帶來?
DetectGPT
,甚至連大學生都在研發
GPTZero
等 AI “打假”工具,用以區分人類寫的文本和來自各種供應商使用 AI 寫的文本,但是極高的失敗率,讓人望而卻步。
此前,來自美國馬里蘭大學的五位計算機科學家 Vinu Sankar Sadasivan、Aounon Kumar、Sriram Balasubramanian、Wenxiao Wang 和 Soheil Feizi 在研究了檢測大型語言模型生成的文本之后,發布了一篇《AI 生成的文本能否可靠地檢測?》論文,最終得出:任何以問號結尾的提問都可以用“不”來回答。
該論文的一作 Vinu Sankar Sadasivan 坦言,即使是使用最好的檢測器來檢測 AI 生成的文本,這種概率并不比扔硬幣進行判斷好到哪里去。
"生成性 AI 文本模型使用人類文本數據進行訓練,目的是使其輸出與人類相似。這些 AI 模型甚至記住了人類文本,并在某些情況下輸出它們,而不會引用實際的文本來源。隨著這些大型語言模型不斷迭代,最好的檢測器只能達到近 50% 的準確性“,Sadasivan 說道。
根據論文結果顯示,可靠的文本檢測任務在實踐中是不可能的。
我們可能永遠無法可靠地說出一篇文章是由人類還是人工智能寫的。
參考:
https://www.rollingstone.com/culture/culture-features/texas-am-chatgpt-ai-professor-flunks-students-false-claims-1234736601/
https://www.theregister.com/2023/05/17/university_chatgpt_grades/
https://www.reddit.com/r/ChatGPT/comments/13isibz/comment/jkeqnam/?context=3
https://arxiv.org/abs/2303.11156
關鍵詞: