精華熱點(diǎn) 編者按:本文是《AI寫詩評(píng)詩的能力水平比較和發(fā)展趨勢》的一部分。因原文長達(dá)15000字,故分為《AI寫詩的能力水平比較和發(fā)展趨勢》《AI評(píng)詩的能力水平比較和發(fā)展趨勢》兩篇文章推出。
AI評(píng)詩的能力水平比較和發(fā)展趨勢 郭友琴 一、AI評(píng)詩模型成長過程的簡要回顧 AI評(píng)詩的歷史可以追溯到20世紀(jì)70年代,當(dāng)時(shí)機(jī)器詩歌生成技術(shù)開始出現(xiàn),早期的詩歌生成模型主要依賴簡單的詞語隨機(jī)組合。AI真正開始在詩詞評(píng)價(jià)方面嶄露頭角,是在2018年以來自然語言處理(NLP)和深度學(xué)習(xí)技術(shù)的飛速發(fā)展之后,是隨著AI寫詩能力的提升而逐漸推進(jìn)的。如在2023年3月15日,《中華文化報(bào)》發(fā)表盧冷夫的《看了AI評(píng)詩,我有話說》一文,表明AI評(píng)詩模型已經(jīng)進(jìn)入試用階段。 目前,多個(gè)配置有自動(dòng)作詩評(píng)詩功能的AI App逐一出現(xiàn)在大眾視野中,AI不僅能夠生成具有一定藝術(shù)水準(zhǔn)的詩詞,還能夠在一定程度上對(duì)詩詞進(jìn)行評(píng)價(jià)和分析,盡管其評(píng)價(jià)能力仍存在局限性,但已經(jīng)展現(xiàn)出很大的潛力。 二、AI詩詞評(píng)論的特點(diǎn) AI評(píng)論詩詞具有以下特點(diǎn): 一是客觀性。AI評(píng)詩不受情感干擾,它沒有情感,它只會(huì)根據(jù)詩詞的文本內(nèi)容、創(chuàng)作背景等客觀信息進(jìn)行分析,不會(huì)因?yàn)樽约骸跋矚g”某種情感風(fēng)格熟悉某個(gè)詩人,就偏向性地評(píng)價(jià)詩詞。它的評(píng)論是基于大量的數(shù)據(jù)和預(yù)設(shè)的規(guī)則來生成的。它會(huì)根據(jù)這些規(guī)則來判斷詩詞在形式上的規(guī)范性,而不是憑借主觀感覺。 二是全面性。AI可以從多個(gè)維度對(duì)詩詞進(jìn)行分析和考慮詩詞的字詞運(yùn)用。同時(shí),它還會(huì)關(guān)注詩詞的結(jié)構(gòu),分析其情節(jié)的起承轉(zhuǎn)合。經(jīng)過大量的詩詞數(shù)據(jù)訓(xùn)練的AI,能夠識(shí)別和評(píng)論各種風(fēng)格和流派的詩詞。都能夠根據(jù)其風(fēng)格特點(diǎn)進(jìn)行評(píng)論。它能夠指出豪放派詩詞的氣勢磅礴、意境開闊,婉約派詩詞的細(xì)膩委婉、情感含蓄等特點(diǎn)。 三是高效性。AI可以在短時(shí)間內(nèi)對(duì)大量詩詞進(jìn)行評(píng)論。它憑借其強(qiáng)大的計(jì)算能力,能夠迅速提取詩詞的關(guān)鍵信息并生成評(píng)論。給出每首詩詞在主題、藝術(shù)手法等方面的特點(diǎn)。 三、不同AI評(píng)詩能力水平的比較 為比較不同AI評(píng)詩的能力和水平,筆者挑選了春節(jié)期間寫的三首詩,對(duì)Kimi、豆包、DeepSeek R1和百度AI+進(jìn)行了三輪測試。 第一輪測試測的詩是一首五律《喜雪》,主要測試AI對(duì)運(yùn)用表達(dá)技巧和對(duì)詩旨的識(shí)別分析能力。 喜 雪 歲暮天凝雨,飄揚(yáng)落玉塵。半含春氣息,皆帶水精神。 灑灑隨風(fēng)急,紛紛入野頻。深知麥田冷,覆被樂農(nóng)人。 測試情況和結(jié)果: Kimi在賞析中認(rèn)為描繪“生動(dòng)形象”。表現(xiàn)手法上“動(dòng)靜結(jié)合,富有層次;虛實(shí)相生,意境深遠(yuǎn)”,認(rèn)為表達(dá)上“富有深意”?!安粌H描繪了雪景,更關(guān)注到雪對(duì)農(nóng)人的益處。雪覆蓋麥田,為麥田保暖,預(yù)示著來年的豐收,體現(xiàn)了詩人對(duì)民生的關(guān)注和對(duì)自然的感恩。” 豆包在賞析中注意到了“生動(dòng)的比喻”“巧妙的擬人”“動(dòng)態(tài)描繪”。認(rèn)為這首詩“體現(xiàn)對(duì)民生的關(guān)懷”“表達(dá)了詩人對(duì)農(nóng)事的關(guān)注和對(duì)農(nóng)民的深切關(guān)懷,使全詩的情感得到升華,富有社會(huì)意義?!?/span> DeepSeek在賞析中提到詩人將雪花比作“玉塵”,“賦予其高貴的氣質(zhì),形象生動(dòng)”,“通過動(dòng)態(tài)的描寫,展現(xiàn)了雪花隨風(fēng)飛舞、紛紛揚(yáng)揚(yáng)的景象,增強(qiáng)了畫面的動(dòng)感與節(jié)奏感”,認(rèn)為“全詩通過對(duì)雪的描寫,表達(dá)了詩人對(duì)自然變化的敏銳觀察和對(duì)農(nóng)人生活的關(guān)懷”。 ?百度AI+在賞析中只是在對(duì)“詩句描繪”和“情感表達(dá)”的分析后,認(rèn)為“《喜雪》一詩通過生動(dòng)的描繪和真摯的情感表達(dá),展現(xiàn)了詩人對(duì)雪的喜愛和對(duì)自然、農(nóng)事的深切關(guān)懷?!?/span> 根據(jù)測試重點(diǎn)和四個(gè)AI給出的點(diǎn)評(píng)比較,第一輪測試結(jié)果Kimi優(yōu)秀;豆包、DeepSeek次之;百度AI+殿后。 第二輪測試的詩是七絕《上元望月》,主要測試AI對(duì)運(yùn)用“無中生有”表現(xiàn)手法后“銅鑼”意象的解釋,和特定詩境中“可憐”詞語意思的理解。 上元望月 一面銅鑼掛柳梢,東風(fēng)拂動(dòng)喜聲呶。 可憐三五團(tuán)欒夜,春韻如詩仰可敲。 測試情況和結(jié)果: Kimi在賞析中沒有分析出“銅鑼”比喻的是月亮,認(rèn)為“銅鑼是中國傳統(tǒng)節(jié)日中常見的樂器”,但明確指出“‘可憐’在這里是‘可愛’之意,表達(dá)了詩人對(duì)元宵夜的喜愛。” 豆包在賞析中認(rèn)為這首詩“意象生動(dòng)”“將月亮比作銅鑼,獨(dú)特又形象。‘掛柳梢’點(diǎn)明了月亮初升的位置,柳梢這一意象,既體現(xiàn)出春天的季節(jié)特征,又營造出一種清新、柔美的氛圍,與上元節(jié)的歡快氣氛相得益彰?!蓖瑫r(shí)也明確指出:“‘可憐’在這里是可愛、令人喜愛之意”“表達(dá)出作者對(duì)上元節(jié)美好夜晚的喜愛與贊美”。 DeepSeek在賞析中認(rèn)為“將圓月比作銅鑼,形象生動(dòng),同時(shí)“掛柳梢”又暗示了時(shí)間和場景,即元宵節(jié)夜晚的柳樹下”,但又認(rèn)為“‘可憐’二字表達(dá)了對(duì)美好時(shí)光易逝的感慨。” ?百度AI+在賞析中沒有提到“銅鑼”是月亮的比喻,也沒有單獨(dú)關(guān)注“可憐”,只是認(rèn)為“可憐三五團(tuán)欒夜”“表達(dá)了詩人對(duì)上元節(jié)夜晚月圓人聚的珍視與感慨”。 根據(jù)以上各AI的點(diǎn)評(píng),認(rèn)為第二輪測試豆包優(yōu)秀;DeepSeek和Kimi次之;百度AI+殿后。 第三輪測試的詩是五律《蛇》。主要測試AI對(duì)典故源流和詠物詩托寄的解析能力。 詠 蛇 發(fā)蜇聞雷后,輔龍騰霧時(shí)。蜿蜒行草野,勃郁類文螭。 閉口曾吞相,銜珠亦報(bào)隋。修鱗今作瑞,盼爾撫瘡痍。 測試情況和結(jié)果: Kimi在對(duì)《詠蛇》的評(píng)論中,先是提出“通過‘閉口曾吞相,銜珠亦報(bào)隋’等句,賦予蛇以深厚的文化象征意義?!闭J(rèn)為“‘閉口曾吞相’可能暗指蛇吞相的神話故事,體現(xiàn)了蛇的神秘與力量;而“銜珠亦報(bào)隋”則可能與隋侯之珠的傳說有關(guān),寓意感恩與回報(bào)。”認(rèn)為“將蛇視為吉祥的象征,希望它能夠帶來祥瑞,撫慰世間的傷痛。這種情感寄托體現(xiàn)了詩人對(duì)自然與生命的敬畏之情?!?/span> 豆包在對(duì)《詠蛇》的評(píng)論中寫道:“運(yùn)用兩個(gè)與蛇有關(guān)的典故?!]口曾吞相’說的是“蛇吞象”的故事,借此隱喻人心的貪婪;‘銜珠亦報(bào)隋’講的是隋侯救蛇得珠的傳說。體現(xiàn)蛇的知恩圖報(bào),一正一反,借蛇對(duì)人性的善惡進(jìn)行思考。”豆包認(rèn)為“詩人把蛇視為祥瑞象征,希望它能撫慰世間的創(chuàng)傷苦難,將對(duì)蛇的描寫從個(gè)體特性升華到對(duì)社會(huì)的關(guān)懷,表達(dá)出對(duì)美好生活的向往,全詩增添了深沉的情感力量?!?/span> DeepSeek在賞析時(shí)指明“ ‘閉口曾吞相’化用漢高祖斬白蛇起義的典故,暗指《史記·高祖本紀(jì)》中‘赤帝子殺白帝子。的讖緯敘事’;銜珠亦報(bào)隋‘則援引《搜神記》隋侯救蛇得珠的傳說?!闭J(rèn)為尾聯(lián)是詩眼,毫無根據(jù)地將詩境推到“明嘉靖二十九年(1550)俺答入侵的背景下,”認(rèn)為修鱗(蛇的別稱)“指蛇的鱗片”,認(rèn)為“詩人以‘瘡痍’喻指庚戌之變后的民生凋敝,借靈蛇祥瑞的意象,寄托對(duì)災(zāi)后重建的深切期盼,使詠物詩突破傳統(tǒng)比興框架,獲得深刻的現(xiàn)實(shí)指向?!?/span> 百度AI+賞析道:“閉口曾吞相,銜珠亦報(bào)隋?!边@里可能借用了古代關(guān)于蛇的典故?!啊咄滔唷赡馨抵改撤N深層的寓意或歷史事件,而‘銜珠報(bào)隋’則可能象征著感恩與回報(bào),展現(xiàn)了蛇在傳統(tǒng)文化中的豐富象征意義??!闭J(rèn)為“詩人以蛇為題材,寄托了自己的情感和愿望,使得這首詩既具有藝術(shù)美感,又富含哲理思考?!?/span> “人心不足蛇吞相”的歷史典故出自山東壽?縣。說的是壽州城內(nèi)窮秀才梅生救下蟒蛇喂養(yǎng),蟒蛇長大后以心肝報(bào)答梅生,梅生因此被封為宰相。但梅生貪心不足,再次要求蟒蛇割心肝,最終被蟒蛇吞食的故事。而“貪心不足蛇吞象”是俗語,非典故。銜珠典故源自《搜神記》卷二十。對(duì)于釋典,四個(gè)AI對(duì)“銜珠”都分析無誤。對(duì)“閉口曾吞相”,Kimi認(rèn)定是“暗指蛇吞相的神話故事?!倍拱m然指出是“與蛇有關(guān)的典故”,卻將其誤作為“蛇吞象”。DeepSeek誤作化用漢高祖斬白蛇起義的典故,百度AI+則是含糊說明是“可能借用了古代關(guān)于蛇的典故,”“‘蛇吞相’可能暗指某種深層的寓意或歷史事件?!痹诜治鲈姷募耐猩?,Kimi、豆包和百度AI+分析無誤,而DeepSeek無端把這首詩的寫作背景推到明代嘉靖年間,并將其譽(yù)為“堪稱明代中期詠物詩中的典范之作。”實(shí)屬無稽之談。 據(jù)此認(rèn)為第三輪測試Kimi第一名;豆包第二名;百度AI+第三名;DeepSeek完敗。 從以上三輪的測試結(jié)果可以得出:Kimi和豆包憑著長期學(xué)習(xí)訓(xùn)練積累的經(jīng)驗(yàn),目前在詩詞評(píng)論方面已經(jīng)具有較為高超的鑒賞水平和能力。DeepSeek作為新手,在詩詞評(píng)論的訓(xùn)練上還需下更大的功夫,付出更多的努力。 四、AI評(píng)詩與詩評(píng)家評(píng)詩的區(qū)別和不足 綜合目前可以找到看到的資料,AI評(píng)詩與人類評(píng)詩存在多方面區(qū)別,主要體現(xiàn)在以下幾點(diǎn): 一是在評(píng)價(jià)標(biāo)準(zhǔn)上。AI評(píng)詩通?;趯?duì)大量詩詞數(shù)據(jù)的學(xué)習(xí),分析詩詞的語言結(jié)構(gòu)、韻律規(guī)則、情感傾向等可量化的特征,并與預(yù)定義的模式或標(biāo)準(zhǔn)進(jìn)行匹配來評(píng)價(jià)。人類評(píng)詩的評(píng)價(jià)標(biāo)準(zhǔn)更為多元和主觀,除了考慮詩詞的形式要素外,還會(huì)融入個(gè)人的生活經(jīng)驗(yàn)、文化背景、審美情趣等因素,對(duì)詩詞所傳達(dá)的意境、情感深度、思想內(nèi)涵等進(jìn)行綜合考量。 二是在情感理解上。AI評(píng)詩雖能識(shí)別一些情感詞匯和情感傾向,但缺乏真正的情感體驗(yàn)和感知能力,無法像人類一樣感同身受地理解詩詞中蘊(yùn)含的復(fù)雜情感。人類評(píng)詩能憑借自身的情感感知能力,深入體會(huì)詩歌中的喜怒哀樂、愛恨情仇等各種情感,與詩人產(chǎn)生情感共鳴,從而更細(xì)膩地評(píng)價(jià)詩歌的情感表達(dá)。 三是在思維創(chuàng)新上。AI評(píng)詩依據(jù)已有的數(shù)據(jù)和算法進(jìn)行分析,難以具備人類那樣的創(chuàng)造力和敏銳的洞察力,很難發(fā)現(xiàn)詩詞中獨(dú)特的、超越常規(guī)的藝術(shù)價(jià)值和創(chuàng)新之處。人類評(píng)詩具有創(chuàng)造性思維和獨(dú)特的洞察力,能夠從不同角度解讀詩詞,發(fā)現(xiàn)詩詞中的新穎之處,挖掘出詩詞潛在的意義和價(jià)值,對(duì)詩詞的藝術(shù)創(chuàng)新給予恰當(dāng)評(píng)價(jià)。 四是在表達(dá)形式上。AI評(píng)詩往往以較為刻板、模式化的語言呈現(xiàn)評(píng)價(jià)結(jié)果,通常是對(duì)詩詞各項(xiàng)指標(biāo)的羅列和總結(jié)。人類評(píng)詩的評(píng)價(jià)語言豐富多樣,富有感染力和表現(xiàn)力,能夠運(yùn)用生動(dòng)形象的文字來傳達(dá)自己對(duì)詩詞的理解和感受,使評(píng)價(jià)本身也具有一定的文學(xué)性。 幾年前,AI對(duì)詩的”評(píng)論“大都堆砌名詞、解釋概念、含糊不清”“說的一般比較籠統(tǒng),大多數(shù)似是而非,誰都可以對(duì)號(hào)入座,但就是沒有確指,沒有細(xì)節(jié),沒有明晰的結(jié)論。”(盧冷夫·《看了AI評(píng)詩,我有話說》《中國文化報(bào)》2023年5月18日)。近幾年AI評(píng)詩經(jīng)過大量的詩詞鑒賞數(shù)據(jù)的學(xué)習(xí)訓(xùn)練,已經(jīng)取得了巨大的進(jìn)步。但是,在與人類詩評(píng)者相比,仍然有著明顯的局限性。主要表現(xiàn)在以下幾個(gè)方面。首先,理解深度不夠。它對(duì)于詩詞中蘊(yùn)含的深層文化內(nèi)涵、作者的情感世界等理解有限。其次,創(chuàng)造性見解不多。AI詩評(píng)通常會(huì)遵循已有的主流解讀模式。再次,缺乏人類評(píng)論者可能產(chǎn)生的獨(dú)特、創(chuàng)造性的見解。此外,還經(jīng)常出現(xiàn)?邏輯不通,甚至?xí)霈F(xiàn)“有句無篇”的情況。最后,?缺乏細(xì)節(jié)和明晰結(jié)論?。很多時(shí)候AI評(píng)詩往往堆砌名詞、解釋概念,缺乏對(duì)詩境詩意的開拓和解讀,評(píng)價(jià)較為籠統(tǒng)和模糊?。 五、AI評(píng)詩的發(fā)展趨勢 目前AI寫詩評(píng)詩正面臨一些挑戰(zhàn)和問題,其權(quán)威性和公信力也有待進(jìn)一步建立和提升。但是,隨著AI技術(shù)以一日千里的速度的加速迭代,AI寫詩評(píng)詩的能力水平也將不斷提升??梢灶A(yù)見的發(fā)展趨勢是: 1.量化分析將更精準(zhǔn)。在“創(chuàng)意指數(shù)”“意象密度”等量化指標(biāo)的分析上會(huì)更加精準(zhǔn),能快速對(duì)詩詞的格律、韻律、句式、意象運(yùn)用等形式方面進(jìn)行評(píng)判。 2.與人類批評(píng)融合得更為緊密。AI評(píng)詩會(huì)與人類基于情感、思想和生命體驗(yàn)的批評(píng)方式相互補(bǔ)充。人類批評(píng)家可借助AI的量化分析,更全面地評(píng)價(jià)詩詞,AI也會(huì)在一定程度上學(xué)習(xí)人類的批評(píng)標(biāo)準(zhǔn)和方法,使評(píng)價(jià)更合理。 3.將進(jìn)一步推動(dòng)詩詞的傳播與推廣。AI可通過分析詩詞的特點(diǎn)和受眾喜好,精準(zhǔn)地將詩詞推送給感興趣的人群,助力詩詞傳播。同時(shí),也能幫助出版社、文學(xué)平臺(tái)等更高效地篩選和推薦優(yōu)秀詩歌作品。 六、結(jié)語 AI評(píng)詩作為一種新興的科技與藝術(shù)結(jié)合的產(chǎn)物,在賞析中可以從技術(shù)、藝術(shù)、教育、文化等多個(gè)角度進(jìn)行探討。但是,從目前AI評(píng)詩的水平和能力來看,它寫出詩評(píng)尚不能與優(yōu)秀的人類詩評(píng)家寫出的詩評(píng)相媲美。詩人和詩評(píng)家憑借其情感理解和思維創(chuàng)新方面的優(yōu)勢,依然會(huì)在詩詞寫作評(píng)論中占據(jù)重要地位。在今后相當(dāng)一段時(shí)間內(nèi),AI評(píng)詩只是一種輔助工具,還不能成為詩詞評(píng)論的替代品。相信隨著人工智能技術(shù)的進(jìn)步,AI在詩詞評(píng)論方面的能力水平會(huì)不斷地提高,對(duì)推動(dòng)詩詞的傳播與推廣將會(huì)起到越來越大的作用 2025年2月23日于北京






