xxxxhd欧美|成人夜电影|成年人免费观看视频网站|久草免费看,a国产在线观看,速度与激情8在线观看完整版在线播放,修女也疯狂2电影高清完整版在线观看

用戶登錄投稿

中國作家協(xié)會主管

吉云飛:論人機協(xié)同推薦系統(tǒng)與中國網(wǎng)絡(luò)文學(xué)的大眾性
來源:《當(dāng)代作家評論》 | 吉云飛  2026年01月04日09:05

鏈接用戶與內(nèi)容的推薦系統(tǒng)是數(shù)字化信息世界的主要構(gòu)件之一。在將文學(xué)視為一種信息的整體視野之下,推薦系統(tǒng)同樣是中國網(wǎng)絡(luò)文學(xué)生產(chǎn)機制的基本組成部分。人類智能和人工智能相結(jié)合的人機協(xié)同正是推薦系統(tǒng)的新范式,深刻改變了網(wǎng)絡(luò)世界的信息傳播及其生成、接受方式,也再造了網(wǎng)絡(luò)文學(xué)的生態(tài),并提供了重新理解文學(xué)大眾性的契機。本文將回顧網(wǎng)絡(luò)文學(xué)推薦系統(tǒng)從人工推選到算法推薦再到人機協(xié)同的發(fā)展歷程,初探這一變化的原因和實質(zhì),并借助大眾性的概念試論其深遠意義,即人機協(xié)同推薦系統(tǒng)的普遍應(yīng)用很可能預(yù)示著大眾文藝時代的真正到來。

人工推選和算法推薦:鏈接用戶與內(nèi)容的兩種方式

在整個印刷文明中,信息的篩選幾乎都是由人工推選來完成的。到了互聯(lián)網(wǎng)時代,算法推薦何以逐漸成為不可或缺的基礎(chǔ)設(shè)施?在2017年抖音引入智能推薦算法后,中國各大社交平臺率先跟進,通過分析用戶的歷史行為、興趣偏好和個性特征等,精準(zhǔn)預(yù)測用戶喜好,構(gòu)建信息流式的內(nèi)容推薦體系。2019年,和抖音同屬字節(jié)跳動的番茄小說誕生,依靠免費閱讀和算法推薦,一年后就以2800萬的日活躍用戶超越所有同類平臺,更成長為月活躍用戶破兩億的超級平臺。此中的緣由并不復(fù)雜,關(guān)鍵就在算法推薦可以實現(xiàn)超大規(guī)模內(nèi)容的精準(zhǔn)分發(fā)。

內(nèi)容的超大規(guī)模既是互聯(lián)網(wǎng)時代信息流通的基本狀況,也是網(wǎng)絡(luò)文學(xué)的獨特境況。石岸書曾論及超大規(guī)模的文學(xué)人口是中國當(dāng)代文學(xué)的“舵”與“錨”(1),是造就其獨特性的重要因素。對于中國網(wǎng)絡(luò)文學(xué),具有超大規(guī)模的不僅是文學(xué)人口,還包括作家作品。中國作家協(xié)會發(fā)布的《2024中國網(wǎng)絡(luò)文學(xué)藍皮書》顯示,據(jù)全國50家重點網(wǎng)絡(luò)文學(xué)平臺數(shù)據(jù)統(tǒng)計,截至2024年底,網(wǎng)絡(luò)文學(xué)作品總量超3300萬部,年新增200萬部;同期新增注冊作者280萬人、簽約作者35萬人。中國社會科學(xué)院發(fā)布的《2024中國網(wǎng)絡(luò)文學(xué)發(fā)展研究報告》則顯示,若將數(shù)據(jù)從50家重點平臺擴展至整個領(lǐng)域,網(wǎng)絡(luò)文學(xué)作者總規(guī)模達3119.8萬人,年新增作者190.4萬人;作品總規(guī)模達4165.1萬部,年新增378.6萬部。

網(wǎng)絡(luò)文學(xué)的作品數(shù)量不但總體龐大也高度集中,頭部平臺每年的新增作品同樣屬于超大規(guī)模。據(jù)公開發(fā)布的數(shù)據(jù),閱文集團2024年新增約33萬名作家和65萬部小說,新增字?jǐn)?shù)超過420億;番茄小說2024年當(dāng)年簽約作者超60萬,實際獲得收入的作者約50萬。這一新增規(guī)模已保持多年,絕非偶然。以閱文集團為例,從2017年到2024年間,年新增字?jǐn)?shù)雖略有波動,但一直保持在360億至460億之間(2)。番茄小說雖未公開此項數(shù)據(jù),但哪怕保守估計,2020年之后也和閱文集團持平,幾乎每日都有上億字的更新。且不論歷年累積的作品,單就每年新增的六七十萬部小說、三四百億文字,文學(xué)平臺如何將之有效地推送到讀者面前?又怎樣從中挑選出優(yōu)秀作品,并保障讀者和作者都有良好的閱讀和創(chuàng)作體驗?

其實,人工推選雖然更擅長應(yīng)對中小規(guī)模的作品,但并非不能處理較大規(guī)模的內(nèi)容。以閱文集團旗下起點中文網(wǎng)為代表的老牌網(wǎng)站,就長期以用戶為中心來人工推選作品。相較紙質(zhì)文學(xué)的推薦系統(tǒng),變化首先在不以編輯、評論家等專家為中心,而向大多數(shù)普通用戶特別是全體付費用戶賦權(quán),通過用戶的收藏、訂閱、投票、打賞等主動行為來評判作品。這一向下賦權(quán)既與在線付費閱讀的商業(yè)模式有關(guān),更由用戶生產(chǎn)內(nèi)容的生產(chǎn)方式?jīng)Q定,是大規(guī)模內(nèi)容供給的必然要求。直白地說,小數(shù)量的專家根本沒有能力去閱讀和評價如此規(guī)模的作品。在網(wǎng)絡(luò)文學(xué)發(fā)展初期,榕樹下的編輯主導(dǎo)制就在相較期刊可稱海量的來稿(其實每天最高只有幾千份,且多為詩歌、散文和短篇小說)面前徹底失效,網(wǎng)站既無法承擔(dān)編輯部的成本(最多時擴張至兩百余人),疲于看稿的編輯也難以真正發(fā)揮引導(dǎo)作用。由此可知,要實現(xiàn)較大規(guī)模內(nèi)容的整合、分發(fā),就必須由用戶主導(dǎo),這實質(zhì)上是讓大規(guī)模用戶去處理本就由這群用戶產(chǎn)出的大規(guī)模內(nèi)容。

不同于以專家為中心,用戶中心的人工推選通常需要兼容標(biāo)簽、搜索和社交網(wǎng)絡(luò)這三種系統(tǒng)。對于網(wǎng)絡(luò)文學(xué)平臺,核心是標(biāo)簽系統(tǒng),呈現(xiàn)為門戶網(wǎng)站式的分類體系,即以各種標(biāo)簽來劃分作品,使讀者可以根據(jù)個人興趣在一個較小范圍中挑選。簡單說,就像圖書館的分類目錄,讀者按照目錄路徑查閱信息。以起點中文網(wǎng)為例,如今大的標(biāo)簽既有性別,聽書、漫畫等媒介,也有仙俠、玄幻、歷史、都市等小說類型;此外,還有“無限流”“日常流”“群像”“殺伐果斷”等與流派、情節(jié)、風(fēng)格、人設(shè)相關(guān)的小標(biāo)簽,讀者也可根據(jù)新書、連載、完本等作品狀態(tài)再次篩選。這些數(shù)以百計的標(biāo)簽在相互組合中將大規(guī)模作品分割成個人足以挑選和閱讀的小集合。當(dāng)下,若某位讀者偏愛以秦漢三國為背景的、注重考據(jù)與群像的、已經(jīng)完結(jié)且字?jǐn)?shù)在200萬字以上并獲得“精品”稱號的起點中文網(wǎng)男頻歷史文,那么大致就能把符合條件的小說數(shù)量控制在20部以內(nèi)。

在算法推薦廣泛應(yīng)用之前,標(biāo)簽系統(tǒng)對應(yīng)的門戶網(wǎng)站以及搜索和社交網(wǎng)絡(luò)對應(yīng)的搜索引擎與社交平臺,也正是互聯(lián)網(wǎng)信息傳播的三種主要模式。在文學(xué)平臺中,帶有明確指向性的搜索功能使用頻率相對較低,不過“熱搜”的關(guān)鍵詞或作品也常有一個醒目的位置。更重要的補充渠道是社交網(wǎng)絡(luò),常表現(xiàn)為作者在章節(jié)結(jié)束時的薦書,乃至單章發(fā)布的“章推”、資深讀者開列的“書單”和書友圈子中的相互“安利”。這些鏈接用戶和內(nèi)容的豐富渠道,使更多優(yōu)秀作品有被看到的機會。畢竟,只有極少數(shù)作品可以躋身能見度最高但也很有限的重要榜單、推薦位。盡管如此,由于搜索和社交都需要比較深度的主動參與,大部分用戶主要的挑書渠道還是位居標(biāo)簽系統(tǒng)最上層的月票榜等核心榜單和封面推薦等強力推薦位。

怎樣在大規(guī)模的作品,特別是新作中選出小量級的優(yōu)秀內(nèi)容并將之推上關(guān)鍵位置,始終是文學(xué)平臺推薦系統(tǒng)的核心任務(wù)。在人工推選的情況下,作品遴選普遍采取的是分級PK模式。仍以起點中文網(wǎng)為例,簽約作品在6萬字后只要保持穩(wěn)定更新,都有機會獲得帶啟動性質(zhì)的保底推薦位,但這一俗稱“蚊子推”(諧音“蚊子腿”)的展示位流量稀少,處于細分類型的頁面邊緣。對作者來說,要緊的不是通過它獲取讀者,而是在和同期同推薦位作品的數(shù)據(jù)比拼中獲勝并進入下一輪。在總共四到五輪的PK中,從第二輪“新書精選”開始就有一定流量,進入第三輪“本周強推”和第四輪“小編力薦”就超越了大部分同期新作。特別優(yōu)秀的少數(shù)作品能夠入選“三江閣”,乃至獲得全站“小喇叭”,可以算作第五輪??傊?,新書需要一直“打怪升級”,只有晉級下一輪才能獲得新的推薦位,資源也會隨著輪次上升越來越好。如果只是“一輪游”或“兩輪游”,那作者要么接受繼續(xù)下去大概率是無人問津的“單機”寫作,要么就可以考慮快速“切書”重開一部以爭取更好成績。新書期結(jié)束后,正式在起點中文網(wǎng)上架的作品也仍靠PK模式來獲取推薦位和上榜,只是核心指標(biāo)由點擊、收藏、推薦變?yōu)樵缕睌?shù)、訂閱量及更直接的銷售額。

在算法推薦應(yīng)用之前,用戶中心的人工推選也良好運轉(zhuǎn)了多年。本質(zhì)上,這一推薦系統(tǒng)仍屬于金字塔結(jié)構(gòu),以層層PK的方式篩選作品,只是由于基座的數(shù)量遠比印刷時代龐大,故而賦權(quán)給了用戶而不只是專家。其實,算法推薦也在人工推選的延長線上,還是以用戶為中心并通過PK來篩選作品,只是為了更好地分發(fā)超大規(guī)模內(nèi)容而采取了數(shù)學(xué)方法——這造就兩者在運作模式和底層邏輯上的根本不同。依靠機器的算法推薦,建立了用戶行為和內(nèi)容特征之間的數(shù)學(xué)關(guān)聯(lián),是以數(shù)學(xué)的純粹性來應(yīng)對人類選擇的復(fù)雜性和不確定性。依靠人類智能的人工推選,則保留了人的審美判斷和價值判斷。

最早也是最經(jīng)典、應(yīng)用最廣泛的智能推薦算法是協(xié)同過濾,其底層邏輯極其簡潔,即尋找相似性。這一算法分為基于用戶的協(xié)同過濾和基于內(nèi)容的協(xié)同過濾,分別假設(shè)如果兩個用戶在過去對多個內(nèi)容的評分或行為相似,那么他們在未來對新內(nèi)容的偏好也會相似;如果一個用戶喜歡某個內(nèi)容,那么他也很可能喜歡與此相似的其他內(nèi)容。落實在文學(xué)平臺中,就是不斷為用戶和作品打標(biāo)簽,然后計算相似度,標(biāo)簽越細致、越精準(zhǔn),推薦效果就越好。這一算法的好處在于實現(xiàn)簡單且可解釋性強,但也面對“數(shù)據(jù)稀疏”(data sparseness)(3)和“冷啟動”(cold boot)(4)的問題。其實,早在番茄小說的沖擊到來之前,起點中文網(wǎng)就嘗試過基于協(xié)同過濾的個性化推薦,但由于效果相當(dāng)一般而未獲大范圍推廣。

由字節(jié)跳動建立的番茄小說,其推薦算法就遠不止于協(xié)同過濾,主要是沿自抖音的“Wide&Deep模型”和“雙塔召回模型”。這些模型建立在人工神經(jīng)網(wǎng)絡(luò)激發(fā)機器深度學(xué)習(xí)能力的基礎(chǔ)上,不再簡單用標(biāo)簽框定用戶和內(nèi)容,而是通過深度學(xué)習(xí)來預(yù)估用戶行為的概率。番茄小說推薦系統(tǒng)的核心邏輯可以簡化為一個推薦優(yōu)先級公式:綜合預(yù)測用戶行為概率 × 行為價值權(quán)重= 內(nèi)容 推薦優(yōu)先級。用戶行為包括點擊、評論、觀看廣告、購買會員等,每一行為又有不同的價值權(quán)重,這些價值權(quán)重也在即時反饋中動態(tài)調(diào)整,反應(yīng)速度甚至可達“分鐘級”。相比人工推選,算法推薦有兩個重要變化。首先是不依賴用戶的主動參與(如評論、投票),也可觀測和利用用戶的被動行為(如停留時間、退出節(jié)點)。更本質(zhì)的是將用戶對內(nèi)容的具體偏好轉(zhuǎn)化為高維空間中的數(shù)學(xué)映射關(guān)系,不必理解內(nèi)容就能實現(xiàn)精準(zhǔn)匹配。具體到文學(xué)平臺的推薦系統(tǒng)中,主要應(yīng)用在以流量池分層取代固定推薦位,以及分不同階段周期性推薦。

如果說人工推選系統(tǒng)的結(jié)構(gòu)好似金字塔,算法推薦系統(tǒng)的形態(tài)就是流量池。金字塔的結(jié)構(gòu)簡單、穩(wěn)定,但也粗放、死板且相對缺乏流動性,典型問題就是越往上位置越有限、越固定,且往往是贏家通吃。此前提到的多輪PK模式就是集中體現(xiàn),從注冊到簽約的過程中已經(jīng)淘汰了絕大部分作者,但簽約之后仍只有一小部分作品有機會走完四輪PK。到了上架階段,就算是頭部作品也偶有“刷票”行為,作者會有很強的動力自行出資購買訂閱和月票以求在榜單上位居前列。番茄小說則幾乎沒有固定推薦位,各類榜單基本是“千人千面”的個性化推薦,也會隨著用戶的刷新而流變。這意味著每個用戶被推薦的作品都有所不同,且由于推薦位的數(shù)量幾乎沒有限制,每部作品都能獲得更均等的推薦機會。站在作者作品的角度,算法的每次推薦都是在一個匯聚全體讀者的流量池中抓取一批最有可能喜歡該內(nèi)容的用戶,然后直接將作品推送至讀者眼前,而非把作品放置在一個固定位置等待讀者發(fā)現(xiàn)。當(dāng)然,流量池還是會根據(jù)成績好壞,為不同等級作品分層“給量”(指在用戶頁面被展示的次數(shù)),但對新人作者來說,這已經(jīng)是一個最公平且更有效的推薦系統(tǒng)。

智能推薦算法采用的階段化、滾動式推薦機制,更是對多輪PK模式的極大優(yōu)化。番茄小說的新書會在10萬字前后進入“首秀”,開始成規(guī)?!敖o量”。新書“首秀”時先會有一個7天的驗證期,在此期間通常會為所有作品發(fā)放約5000量的測試用戶,按照“吸量”程度分為從D級到SSS級的7個等級。這一階段的核心指標(biāo)“吸量”,指向的是書名/封面/簡介吸引讀者點擊進入正文的能力。一般來說,300以上的點擊量便合格,可以評為A級,此后會按正常標(biāo)準(zhǔn)給量;500以上便可評為SS級,會有明顯的流量傾斜。同時,這一過程也會測試出與作品更適配的部分用戶群體,并持續(xù)推薦給同類型的用戶。在驗證期后進入大約14天的首秀期,核心指標(biāo)變?yōu)?0萬字完讀率和追更比。10萬字完讀率即點擊量與讀完10萬字的用戶之比,近年來平均保持在16%~17%,高于17%則為優(yōu)秀,有機會獲得流量扶持。追更比則是“在讀”數(shù)和追到最新章節(jié)的用戶之比,這里需要解釋的是,所謂“在讀”指的是過去14天內(nèi)閱讀過該作品的總?cè)藬?shù),而非總的閱讀人數(shù)。追更比的理想目標(biāo)為2∶1,但不要求作者達到,更重要的是保持穩(wěn)定并持續(xù)提升。無論吸量、在讀,還是完讀率、追更比,都是依靠算法才能觀察到的用戶行為,至少在新書階段,這些指標(biāo)的確遠比人工推選中的相關(guān)數(shù)據(jù)要更精準(zhǔn)、高效。

在“首秀”之后,完讀率和追更比仍是最重要的“北極星”指標(biāo)。更準(zhǔn)確地說,“首秀”就是番茄小說推薦規(guī)則具體而微的展演,此后成績優(yōu)異的作品會在不同階段(一般分為首秀期、書測期、新書池、老書池)迎來一輪又一輪的算法推薦,只是每個階段都會有各自的側(cè)重點。比如,書測期在20萬字后可申請開啟。所謂“書測”,關(guān)鍵就在作者可重新為作品再取多個書名,乃至寫多種簡介,以測試“吸量”和“留存”數(shù)據(jù)最好的書名和簡介,再將之固定下來。通常來說,每一輪的推薦周期仍大致持續(xù)14天,此后進入一段時間的靜默期。這一靜默期也是新的測試期,算法再次去圈定部分新用戶展示,并根據(jù)讀者的閱讀行為不斷調(diào)整,持續(xù)尋找與作品最有可能共振的用戶群體。隨著成績提升,算法在擴大推薦量的同時,也會突破原有的讀者圈層。因此,新讀者與作品不是特別適配的可能性會越來越高,這就會導(dǎo)致完讀率和追更比下降,算法隨之減少推薦量。此時,作品便常常會進入瓶頸期,“在讀”數(shù)不再增長甚至不斷下滑。盡管如此,算法已經(jīng)顯示出有能力把優(yōu)秀作品推薦到每一個有可能喜愛它的用戶面前,也使得原有的人工推選系統(tǒng)必須將之納入,由此走向人機協(xié)同的新模式。

人機協(xié)同:網(wǎng)絡(luò)文學(xué)推薦系統(tǒng)的新范式

人工推選和算法推薦有根本區(qū)別,也各有優(yōu)劣。人力的優(yōu)長和弱點早已暴露,而算法的內(nèi)在矛盾如今也有所顯現(xiàn)。當(dāng)下比較緊迫的是算法透明化的問題。平臺的算法不能太透明,否則不但泄露商業(yè)機密,而且會被針對性優(yōu)化數(shù)據(jù)以竊取流量;但算法若不夠透明,又會因其巨大影響而招致誤解、恐懼與敵意,既被視為“技術(shù)黑箱”,又被用戶乃至管理部門懷疑平臺在幕后操縱信息流動。長遠更為重要的是個性化程度的問題。算法推薦的根基就在可以實現(xiàn)個性化推薦,但又不得不控制個性化程度或者說針對特定行為策略的復(fù)雜度。一方面是出于成本考慮,多指標(biāo)及其價值分的動態(tài)調(diào)整對算力要求很高,太精細反而得不償失;另一方面,推薦系統(tǒng)必須控制自身復(fù)雜度,增強算法“魯棒性”(robustness)(5),讓系統(tǒng)在面臨各種干擾和bug(故障)時還能穩(wěn)定運轉(zhuǎn)。

好在人工推選和算法推薦不僅互相競爭,更因?qū)α⒍嗷パa足。比如,前者適合中小規(guī)模的內(nèi)容,后者更適用于超大規(guī)模的內(nèi)容;前者雖依賴用戶主動參與,但規(guī)則可解釋性強,后者允許用戶被動接受,但算法透明性較弱。近兩三年來,在網(wǎng)絡(luò)文學(xué)的推薦系統(tǒng)中,人機協(xié)同已被普遍應(yīng)用并成為新趨勢和新范式。依靠算法推薦立身的番茄小說和以人工推選為根基的起點中文網(wǎng)都在彼此接近、學(xué)習(xí),同時借助人類智能和人工智能,并以此搭建一個更為強大的推薦系統(tǒng)。

番茄小說的評分機制、書荒廣場和巔峰榜都是人機協(xié)同的重要實踐。番茄小說的作品評分不只是由讀者打出來的,而是讀者評分和數(shù)據(jù)指標(biāo)的共同結(jié)果。首先,并非所有番茄作品都有評分,只有當(dāng)有效書評(閱讀本書30分鐘以上的讀者打出的評分才算有效)達到50個后才會開啟基礎(chǔ)分。此后,比有效書評更重要的指標(biāo)是書籍留存,包括完讀率、追更比,但核心是“三日留存”(新增讀者中在第三天仍閱讀該作品的)。目前來看,1%的三日留存約等于7.7~7.8的評分,而50%及以上的三日留存就等于9.9~10.0的評分。總的來說,在讀和評分人數(shù)較少時,作品評分主要由讀者實際打分決定,當(dāng)小說的在讀人數(shù)越多,評分就受三日留存率影響越大。評分機制體現(xiàn)的是在規(guī)模較小時依賴人工推選,在規(guī)模較大時轉(zhuǎn)向算法為主——評分最終不再決定于讀者主觀的因而必然帶有審美偏好、情緒波動和價值分歧的判斷,而是更加明確也更加冰冷的關(guān)于用戶有沒有讀下去的“留存率”。

作為一個純?nèi)斯さ淖x者論壇,書荒廣場是番茄小說專為解決讀者的“書荒”或者說彌補算法推薦的不足而創(chuàng)立的核心社區(qū)。雖然番茄小說以算法推薦為主,但書荒廣場在總流量中的占比卻長期保持在驚人的三四成。換言之,超三分之一的閱讀行為是在社區(qū)中實現(xiàn)的。廣場分為話題和書單兩個部分,每個話題的左下角會顯示總發(fā)帖數(shù)量,右下角則顯示該話題拯救了多少讀者的書荒,而累積了上萬帖子或拯救了數(shù)百萬人書荒的話題所在多有。書荒廣場之所以如此熱鬧、活躍,在于它以一身兼具了讀者找書、推書變現(xiàn)和作者自救這三種功能。

首先,書荒廣場是讀者的找書神器。它有海量書單推薦和實時互動推書,也兼容標(biāo)簽和熱搜系統(tǒng),支持按照標(biāo)簽精準(zhǔn)篩選、快速匹配,更為用戶搜索行動背后的問題和需求提供答案。質(zhì)言之,書荒廣場熔鑄了標(biāo)簽、搜索和社交網(wǎng)絡(luò)這三種信息匹配系統(tǒng),吸納了傳統(tǒng)文學(xué)網(wǎng)站的大多數(shù)推薦功能,絕不能僅僅被視為一個論壇。其次,它也是書蟲推書變現(xiàn)的渠道。番茄小說除了可以看書掙錢(實質(zhì)上是讀者同作品、平臺一起分享廣告收入),還可以推書變現(xiàn),薦書人能從每一個被自己解決了書荒的讀者那里獲利。雖然每人次的收益大約只有0.3~1元,但疊加平臺的獎勵,每月獲得上萬元推書收入的用戶并不罕見。由此,薦書人的生產(chǎn)積極性得以維系,廣場中總有源源不斷的好話題、好帖子、好書單。再次,這還是作者自救的法寶。在新書首秀流量低迷或者小說進入瓶頸期時,到書荒廣場以自薦的方式推廣作品已經(jīng)成為作者主要的自救方式。作者往往選擇到相關(guān)的話題下,以40字左右的文案自賣自夸,借此起死回生的幾率雖不高,但絕對數(shù)量并不少。

相較書荒廣場,巔峰榜雖在影響力上有所不如,但卻是最有意味和最具深度的。2023年10月,番茄小說推出了首個統(tǒng)一性榜單“巔峰榜”,這一每月1日更新的榜單不再是“千人千面”,而是回歸了“千人一面”,在此前以個性化為最高準(zhǔn)則的算法邏輯中明確引入“公共性”的維度,試圖確立一種具有普遍性的評價體系。巔峰榜的特殊性正在于,算法不僅被用來實現(xiàn)個性化推薦,更被用來遴選具有典范性的小說——這本是人類智能的最后堡壘和最大驕傲。推薦算法如何在不理解內(nèi)容的前提下,嘗試推選出公認(rèn)的位于“巔峰”的文學(xué)作品?目前來說,主要方法是專家提前介入和多維度綜合評價。

算法怎樣辨認(rèn)優(yōu)質(zhì)內(nèi)容,乃至“巔峰”之作?答案很明確:先人工定調(diào),再機器放大,并動態(tài)調(diào)整。推薦算法絕非萬能,更看不出內(nèi)容的好壞,必須要先由平臺員工,特別是資深編輯及優(yōu)秀內(nèi)容創(chuàng)作者、外部專家(筆者也曾參與番茄小說的相關(guān)調(diào)研)確定評判標(biāo)準(zhǔn)后,算法才能批量執(zhí)行。就巔峰榜的創(chuàng)建流程而言,前期是人工篩選出平臺中的最佳作品,然后提煉這些小說的特質(zhì),再形成可以被文字闡述的標(biāo)準(zhǔn),最后轉(zhuǎn)換為能被機器理解的數(shù)學(xué)語言。這些評價標(biāo)準(zhǔn)不但包括多個維度,而且始終在動態(tài)調(diào)整之中——因為巔峰榜的上榜作品只有30部,納入備選名單的數(shù)量也相當(dāng)有限,所以不必太考慮人力、算力成本和算法復(fù)雜度的問題,可以將智能算法的能力發(fā)揮到極致。當(dāng)下,巔峰榜主要考量的6個維度為作品人氣、內(nèi)容質(zhì)量、口碑評分、讀者互動、傳播價值、IP潛力,由此以人機協(xié)同的方式全面評估作品的綜合表現(xiàn),嘗試篩選出當(dāng)月代表番茄小說平臺最高水平的TOP30作品,為讀者提供權(quán)威的閱讀推薦。

在6個維度中,表面上雖有人氣、質(zhì)量和口碑等區(qū)別,但實際上指標(biāo)是相近的,說法不同更多是為了便于人類的理解,而非機器真就照此分類執(zhí)行。具體來說,算法主要綜合考量在讀人數(shù)、閱讀時長、章節(jié)完讀率和單日新增用戶量,核心指標(biāo)大致包括首秀期10萬字完讀率>23%,新書池三日留存率≥50%等。此外值得一提的是,口碑評分雖以站內(nèi)評分為主,但也兼顧第三方平臺(如豆瓣)的評價,并且設(shè)定讀者真實評價差評率<10%為入圍門檻。而讀者互動的量化指標(biāo)包括段評/章評密度(每萬字互動≥500條為S級)、書友圈日活躍用戶占比等。傳播價值則包括社交平臺“二創(chuàng)”數(shù)量(如截至2025年9月,抖音#十日終焉話題播放量超60億)、跨圈層滲透率(如在不同代際用戶中的傳播度),乃至權(quán)威媒體引用次數(shù)和各類文學(xué)獎項/榜單入選次數(shù)??傮w而言,編輯基本不直接參與榜單評選,唯一干涉方式是調(diào)整相關(guān)指標(biāo)及其權(quán)重。

相比在算法中創(chuàng)生的番茄小說,作為匯聚了中國網(wǎng)絡(luò)文學(xué)最多精英讀者的老牌平臺,起點中文網(wǎng)擁有審美力最強和參與度最深的網(wǎng)文用戶,因此對智能算法推薦的接納經(jīng)歷了一個頗為漫長的過程。早在2015年,被騰訊集團收購后,起點便借助騰訊的技術(shù)力量開始了個性化推薦的嘗試,但僅僅作為一個新的推薦欄目。2020年后,面對番茄小說的崛起和沖擊,起點才逐步開啟從人工篩選到算法驅(qū)動的基礎(chǔ)性變革。最初,只是引入個別關(guān)鍵指標(biāo)如追更率,以此替代收藏量、推薦票等延續(xù)十幾年的新書考核標(biāo)準(zhǔn)。在ChatGPT3.5橫空出世后,方才整合AI大模型以實現(xiàn)讀者偏好與作品標(biāo)簽的精準(zhǔn)匹配,用內(nèi)容信息流逐步替代大部分固定欄目推薦位,使流量利用率大為提升。直到2025年7月,新書推薦從PK模式全面轉(zhuǎn)為流量包模式,完成建站以來最大的推薦模式改革,起點中文網(wǎng)終于確立自身獨特的人機協(xié)同之路。

流量包模式把PK模式的“生死PK”變?yōu)椤皠討B(tài)培育”,體現(xiàn)出算法推薦在超大規(guī)模內(nèi)容分發(fā)時的明顯優(yōu)勢。如今,起點的簽約作品若穩(wěn)定日更4000字以上,在6萬字時將獲得7天等額流量包,相當(dāng)于此前第一輪的“試水推”。之后進入上架前21~42天的培育期,優(yōu)秀作品會根據(jù)追更率、留存率、轉(zhuǎn)化率等指標(biāo)獲得三檔放量流量包,即放量包、放量包+、放量包++,覆蓋了原2~4輪的推薦資源。但不同的是,前期表現(xiàn)欠佳的作品也可持續(xù)獲得扶持流量包,避免作者因“一輪游”而“切書”。更重要的是,流量包的刷新周期是1~2天,每一天的更新或者說每一次流量包的刷新,都有可能讓作品續(xù)命,甚至改命,一旦成績轉(zhuǎn)好,立刻可獲得更大的放量包。在流量包模式中,絕大多數(shù)作品的推薦都由智能算法完成,不但編輯只保留了對極少數(shù)優(yōu)秀作品的人工推薦權(quán),也幾乎不再需要用戶的任何主動參與。這一流量包模式與番茄小說的首秀類似,但流量包刷新頻率和動態(tài)程度更高,有利于“慢熱文”“創(chuàng)新文”的成長。

待到作品上架“入V”(進入VIP付費階段),推薦位雖主要還以信息流的方式出現(xiàn)并以流量包的形式分配,但核心指標(biāo)則回歸到小說的訂閱量(包括“均訂”和“追訂”),最重要的榜單月票榜更是繼續(xù)以作品的月票數(shù)排行。換言之,在上架后,起點中文網(wǎng)還是以付費用戶的人工推選為主導(dǎo)。就此而言,起點的人機協(xié)同系統(tǒng)是人類智能負責(zé)小規(guī)模VIP作品,人工智能負責(zé)大規(guī)模新進作品,可謂人機各司其職,有涇渭分明之感。這與起點的商業(yè)模式和閱讀生態(tài)有關(guān)。2024年,起點的月付費用戶數(shù)達910萬,雖未恢復(fù)到受番茄小說等免費平臺沖擊前的巔峰狀態(tài),但也創(chuàng)出三年新高。這背后是起點在2023年開展了極其嚴(yán)厲的反盜版行動,通過技術(shù)升級和法務(wù)維權(quán)打擊盜版,帶動日活躍用戶同比增長80%,連載作品的均訂也有普長。不過,消滅盜版帶來的付費讀者增長是一次性的,也讓用戶總體付費意愿有所下降,月均付費從2021年的39.7元降至2024年的32元。與此同時,閱文集團2024年在線閱讀業(yè)務(wù)收入40.31億元,同比微增2.1%,占總收入比重降至49.6%,而IP運營收入達39.91億元,同比增34.2%,成為新的增長引擎。在此情況下,起點的未來方向也越發(fā)明朗,就是堅定地走向精品化付費閱讀,特別是以培育具IP全產(chǎn)業(yè)鏈價值的“大作”為戰(zhàn)略重心。到2025年上半年,閱文更主動優(yōu)化分發(fā)機制,將免費閱讀流量導(dǎo)向付費核心產(chǎn)品,以全渠道月活躍用戶從1.76億降至1.4億為代價,支撐付費讀者增長至920萬。

起點中文網(wǎng)的人機協(xié)同推薦系統(tǒng),目標(biāo)便是在保證付費閱讀基本盤長期穩(wěn)定的前提下,盡可能地培養(yǎng)和選拔出更多具IP價值的作品。IP價值雖然不能等同于作品質(zhì)量,但其內(nèi)在要求的“破圈”“黏性”,指向的正是要長久地打動不同代際、性別和身份的讀者。而文學(xué)經(jīng)典的根本特質(zhì)就是可以穿越時空,打動不同時代、不同地域的人們,IP價值其實是相當(dāng)接近這一偉大目標(biāo)的商業(yè)指標(biāo)。在這樣的導(dǎo)向之下,起點中文網(wǎng)將最大最核心的推薦權(quán)力繼續(xù)賦予VIP讀者,信賴這群早就可以免費讀小說但為了高質(zhì)量作品而主動付費的讀者。相比番茄小說以算法為主導(dǎo)的人機協(xié)同推薦系統(tǒng),起點中文網(wǎng)盡管在不斷擴大算法推薦的應(yīng)用范圍,也取得了很好的效果,但最終仍以人工智能輔助人類智能。起點中文網(wǎng)選擇相信這近千萬的VIP讀者,保障他們的主導(dǎo)權(quán)利,也激發(fā)他們的參與熱情,通過這群深度用戶的訂閱、投票等最具主動性的參與行為來培育并挑選出最優(yōu)秀的作品。在人機協(xié)同的基礎(chǔ)上,究竟是以人類智能為主導(dǎo)還是以人工智能為核心會造就更好的推薦系統(tǒng)?這并非目前能回答的問題,但我們可以拭目以待。

可量化、破圈與自然生長

很少有一個概念會像“大眾文化/文藝”那樣,如此至關(guān)重要(可謂現(xiàn)代社會區(qū)別于古典世界的標(biāo)志之一),又如此錯綜復(fù)雜。雷蒙?威廉斯就認(rèn)為,“大眾”(popular)一詞在歷史中形成了四種含義:“屬于民眾”“低下的”“廣受歡迎”與“刻意討人歡心”(6)。這些相互關(guān)聯(lián)也有所對立的內(nèi)涵已經(jīng)讓“大眾”的概念足夠曖昧了,何況,因理解的分歧在如何看待它的問題上又至少有三種不同取向。第一種是否定性的,無論是把“大眾文化”視為天才個體創(chuàng)造性活動的反面,還是直接看作迎合庸眾而生產(chǎn)的商業(yè)文本,這種否定性的態(tài)度都將“大眾文化”約等于“低等文化”。第二種是肯定性的,認(rèn)為“大眾文藝”因出自“人民”而具有本真性,就算降格以求,也是民間自發(fā)形成的文化或群眾被組織起來創(chuàng)造的文藝,總之是人民群眾首創(chuàng)、共有、同享的。第三種則將之視為一個斗爭性的場所,既不是自上而下灌輸給“群氓”的,也不是自下而上由“群眾”創(chuàng)造的,而是兩者交流協(xié)商的場域,同時包括了“抵抗”與“收編”。

大眾文化內(nèi)部總是存在各種混雜的元素,這些元素各自把文本帶往不同的方向。面對這一紛亂擾攘,我們不妨先回到最具共識的定義上——大眾文化是有很多人喜歡的文化。這一定義應(yīng)當(dāng)是最能被廣泛接受的,不管是認(rèn)為大眾文化低劣、媚俗,還是充滿創(chuàng)造性、可能性,關(guān)注的前提和焦點始終是它在被許多人喜愛著。然而,這一偏向“定量”的定義方式也有很大缺憾,究竟要多少人才稱得上“大眾”?如何知曉這是一群什么樣的人?怎么判斷他們的喜愛程度?在印刷時代,我們可以進行相關(guān)的數(shù)據(jù)統(tǒng)計,但價值有限,因為指標(biāo)太單一,數(shù)據(jù)太稀疏。可是,在用戶中心的人工推選,特別是智能推薦算法普及后,“大眾”已然成為可量化的大數(shù)據(jù)——“量化”的本質(zhì)正在于將抽象的、模糊的概念轉(zhuǎn)化為可測量、可分析的數(shù)學(xué)模型。

頗有意味的是,最終為“大眾”賦形的算法推薦卻是一種基于個性化的推薦系統(tǒng)。要言之,在以量化方法觀察世界時,事實上并沒有什么“大眾”,有的只是被抽象為數(shù)學(xué)表達的一個個單獨的個體及其各種組合方式。在這里,“大眾”甚至不只被裂解為“分眾”——用戶中心的人工推選已經(jīng)借助分層化、多樣化的標(biāo)簽系統(tǒng)基本實現(xiàn)這一目標(biāo)——而是再次提升精細度、顆粒度,把仍有一定規(guī)模的“分眾”打碎、還原成具體的點,但這些點又絕非原子化的,隨時可以被召回用于構(gòu)成一個新的矩陣,并以流量包、流量池的形式出現(xiàn)。在2025年3月,抖音的月活躍用戶突破了10億,且每天的人均使用時長接近兩個小時。番茄小說的“月活”雖遠不如抖音,但在全部的文學(xué)平臺中也遙遙領(lǐng)先。正是以個性化為基礎(chǔ),充分尊重每個用戶的喜好,算法推薦才最能“集眾”,也最能“得眾”。

必須強調(diào)的是,并不能簡單地以“繭房”來描繪和批評這類由算法圍繞個人喜好營造的專屬信息空間。在工業(yè)文明和印刷時代中,我們的社會空間和閱讀空間整體而言都是越來越規(guī)范、越來越統(tǒng)一的,以至于對個人的真實感受、表達和自我發(fā)現(xiàn)、完成造成了不小的威脅。而沒有真正的個人,就不會有真正的集體。如果只有一種帶強制性的“一體化”,那就很容易產(chǎn)生虛假的集體和虛偽的“公共性”。就此,盡管“信息繭房”的說法有其合理性,卻忽視了它作為一個私人的、安心的和歡樂的空間,既是個性的體現(xiàn)和保障,也是公共性的起點和根基——這在番茄小說的巔峰榜中頗有體現(xiàn)。

在巔峰榜之前,番茄小說沒有任何一個統(tǒng)一性的榜單,所有推薦位都是個性化的,也就意味著平臺不追求、更不提供任何具普遍性的評價標(biāo)準(zhǔn)。換言之,只承認(rèn)有個體及由相似度極高的個體匯聚而來的“小眾”,并不認(rèn)為有某種能代表一般意志(common sense)的“大眾”——“大眾”只是一種被想象出來的觀察和理解世界的方式。但為什么在成為規(guī)模最大的文學(xué)平臺后,番茄小說還是于2023年推出了巔峰榜?這里當(dāng)然有商業(yè)上的考量,IP的打造和作者的明星化都內(nèi)在要求“破圈”,以及讀者對內(nèi)容多樣化的需求:讀者不僅需要現(xiàn)在可能會喜歡的,也需要將來可能會喜歡的;不但需要自己喜歡的,也需要公認(rèn)有價值的。說到底,巔峰榜的商業(yè)價值背后仍是人對公共性本能且強烈的需求,以及真正的公共性的極度稀缺。而有了作為一般意志和普遍認(rèn)同的公共性(雖不一定能實現(xiàn),但至少愿意去追求),才稱得上有“大眾”。

這一公共性的凝聚,此前主要靠深度用戶的主動參與。在付費平臺的人工推選中,讀者參與是有門檻的,投票的權(quán)力甚至評論的資格都要付費獲取。由于盜版難以禁絕,長期還俯拾皆是,且免費平臺崛起后又提供了新的閱讀渠道,中國網(wǎng)絡(luò)文學(xué)的VIP讀者大多是在可以免費的情況下選擇為喜愛的小說付費??梢悦赓M卻付費,此誠可謂“有愛”。這批對網(wǎng)文更有愛欲的讀者,往往也是更有審美能力和文學(xué)品位的“老白”。因此,這群讀者深度參與并主導(dǎo)的榜單才會一直頗有權(quán)威,才得以為網(wǎng)文作者頒發(fā)象征資本而非只帶來經(jīng)濟利益。用圈內(nèi)的話來說,能夠為作者“封神”。這本質(zhì)上就是挑選部分精英代表全體讀者來協(xié)商決策,可以說是一種文學(xué)上的精英民主。

如果說人工推選依靠的是VIP讀者的深度參與,算法推薦需要的只是全體用戶的閱讀行為。盡管在2024年,番茄小說讀者全年累計發(fā)布的評論總數(shù)超10億條(1009572268條),單部作品(《十日終焉》)最多評論數(shù)超千萬條(10186232條),但平臺并不依賴于讀者的主動參與,沒有評論、沒有投票也能很好運轉(zhuǎn)。推薦算法的巨大突破就在于通過對用戶行為的記錄、分析,前所未有地把“沉默的大多數(shù)”變成“不動的施動者”。算法的核心指標(biāo)“吸量”“留存”都集中體現(xiàn)在點擊、追讀等被動行為上,只要發(fā)生閱讀這一動作,那么必然可以獲得這些數(shù)據(jù)。這就意味著大多數(shù)沒有能力或缺乏意愿去深度參與的讀者,實際上也在被動且頗為精細地主導(dǎo)著文學(xué)的生產(chǎn),同時更是在以行動表達自身的意志。在算法推薦,特別是人機協(xié)同推薦系統(tǒng)的加持下,中國網(wǎng)絡(luò)文學(xué)的“大眾性”同時容納了“個性化”和“公共性”這相對也相成的兩面,既以極致的個性化為底色,又在此基礎(chǔ)上追求一種普遍認(rèn)可的好,并視此公共性為“巔峰”。由此,在當(dāng)下這個高度分化的世界中,或許可以給“大眾”做一個更加立足于當(dāng)下的定義:能同時為許多壁壘森嚴(yán)乃至相互對立的群體所喜愛。極言之,大眾就是“破圈”,就是“破壁”。

這其實仍連通了“文藝大眾化”和“群眾文藝”的傳統(tǒng),盡管是以相對(不同但有關(guān))的方式來實現(xiàn)繼承。作為啟蒙的未竟事業(yè),20世紀(jì)30年代的“文藝大眾化”在結(jié)構(gòu)上與啟蒙相仿,是自上而下的。這在教育不平等的社會中是知識分子的責(zé)任,但也決定了“文藝大眾化”的限度。魯迅在1930年發(fā)表的《文藝的大眾化》一文中,就將他所身處的時代判定為“現(xiàn)在是使大眾能鑒賞文藝的時代的準(zhǔn)備”,因為當(dāng)民眾缺乏鑒賞文藝的能力時,即便有不少為大眾設(shè)想的作家“竭力來作淺顯易解的作品……但那文字的程度,恐怕也只能到唱本那樣。”魯迅對當(dāng)時文藝的大眾化運動最終能取得的效果是比較悲觀的,與此同時,他非常警惕文藝在這一口號下走向媚俗,明確警告:“若文藝設(shè)法俯就,就很容易流為迎合大眾,媚悅大眾。迎合和媚悅,是不會于大眾有益的?!保?)或許,對“文藝大眾化”的有意追求,不但出自真正的大眾文藝的匱乏,也潛藏著既傷害文藝又傷害大眾的危險。

20世紀(jì)40年代,特別是新中國成立之后,中國共產(chǎn)黨曾借助政治力量大規(guī)模推動“群眾文藝”的發(fā)展,希望通過發(fā)動廣大群眾并以一套“群眾文化體制”將之組織起來,以此實現(xiàn)上下的溝通與結(jié)合。政黨的動員、組織、領(lǐng)導(dǎo)和群眾的參與、跟隨、創(chuàng)造,是“群眾文藝”也是其背后的“群眾路線”不可或缺的兩面。但歸根到底,“群眾文藝”不是民間的自發(fā)行為,而是政治力量的有組織行動,決定性因素是黨的領(lǐng)導(dǎo),并始終是為了更大的政治目標(biāo)服務(wù)。因此,“群眾文藝”不但自身會隨著黨的文藝政策和基本任務(wù)的變動而興廢,更艱難的是,其運作內(nèi)在要求具備大規(guī)模的、有組織的且可以長期、深度參與文藝生產(chǎn)的“群眾”——就生產(chǎn)力和生產(chǎn)方式的角度來看,“群眾文藝”實質(zhì)上是在印刷時代跨越生產(chǎn)力水平,建立用戶生產(chǎn)內(nèi)容,乃至用戶主導(dǎo)內(nèi)容生產(chǎn)的文藝體制的一次重要嘗試。

“文藝大眾化”和“群眾文藝”的出發(fā)點都在于這樣一個根本矛盾:大眾應(yīng)當(dāng)享有文藝生活并且文藝的活力和根基本來就在大多數(shù)人,但文學(xué)藝術(shù)又自有其門檻、深度與復(fù)雜性,也正因其對人類經(jīng)驗的反映既深且廣,才有獨特而重要的價值。如何既讓大眾共建、共享文化生活,又使之不但不與精英文化對立起來,而且成為文藝攀登高峰,乃至成就經(jīng)典的不竭動力?盡管中國網(wǎng)絡(luò)文學(xué)的大眾性不在于大眾化,是自下而上的,同時在新技術(shù)條件下也主要依靠商業(yè)力量組織起來,但這仍始終是包括網(wǎng)絡(luò)文學(xué)在內(nèi)的新媒介文藝、新大眾文藝要面對的核心問題。對此,中國網(wǎng)絡(luò)文學(xué)給出的一個答案是:在自我滿足中自然生長。這里部分借用了雷蒙·威廉斯對文化的定義:自然生長。他通過追溯“文化”(culture)的拉丁詞源colere(培育),強調(diào)其原初含義是“對自然生長的扶持”(8)(the tending of natural growth),后延伸為對人類精神與社會關(guān)系的培育。這一培育的起點當(dāng)然仍是低的、尋常的,不過如今提高的主要途徑不再是寓教于樂,而是更純粹的自我滿足,也就是“爽”?!八痹诳陀^上是一種殘缺的可被指摘的幸福,但主觀上是每一個不完滿的個體在自己當(dāng)下能力范圍之內(nèi)(既是認(rèn)知能力也是行動能力)所能獲得的最大的幸福。每一次“爽”的實現(xiàn),帶來的不僅有滿足也必然有空虛,這種欲望滿足后的虛無也是人類精神自然生長的重要動力。其實,在自我滿足中自然生長,換個說法就是在個性化的前提下追求公共性。所謂個性化實質(zhì)上就是“猜你喜歡”,是把個體最有可能喜歡的東西“投喂”到面前。在算法推薦廣泛應(yīng)用之后,這已然是當(dāng)下文藝狀況的一個既成事實和基本特點——用戶已經(jīng)習(xí)慣泡在“蜜罐子”里了,不可能再拉出來投進“苦水”“血水”里。何況,并不是只有挫折和苦難才能讓人成長,“爽”本身也具有強大的生長能量。公共性事實上也就成為某種普遍、恒常價值的體現(xiàn),尤其是在充分個性化的基礎(chǔ)上,能夠“破圈”的作品至少是對時代情緒的快速反應(yīng),甚至是對時代精神的敏銳捕捉。

結(jié) 語

總之,中國網(wǎng)絡(luò)文學(xué)的大眾性既來自科技對文學(xué)生產(chǎn)、傳播的賦能,也展現(xiàn)出對中國新文學(xué)和社會主義文藝傳統(tǒng)的回響。特別是人機協(xié)同推薦系統(tǒng)的興起標(biāo)志著網(wǎng)絡(luò)文學(xué)進入了一個新的發(fā)展階段,它通過結(jié)合人類智能的審美判斷與人工智能的數(shù)學(xué)運算,不僅解決了超大規(guī)模內(nèi)容精準(zhǔn)匹配的難題,更通過量化用戶行為激活“沉默的大多數(shù)”,并在“破圈”的商業(yè)需求中推動公共評價標(biāo)準(zhǔn)的形成。從人工推選的金字塔結(jié)構(gòu)到算法推薦的流量池模式,再到如今人機協(xié)同的深度融合,推薦系統(tǒng)的演進既是對技術(shù)局限性的突破,也是對文學(xué)大眾性的重新定義——它使得個性化與公共性得以相輔相成,讓每一部作品都有機會找到自己的讀者,讓每一個用戶都能共建、共享文學(xué)生活,也讓真正優(yōu)秀的作品能夠突破圈層,最終以多元群體的共同喜愛為標(biāo)志逼近新的文學(xué)高峰。就此而言,人類智能與人工智能的協(xié)同共生不僅進一步推動了網(wǎng)絡(luò)文學(xué)的繁榮,或許更預(yù)示著新的大眾文藝時代的真正到來。

注釋:

(1)石岸書:《試論超大規(guī)模的文學(xué)人口與中國當(dāng)代文學(xué)的獨特性》,《中國現(xiàn)代文學(xué)研究叢刊》2024年第2期。

(2)2017年為430億,2018年為443億,2019年為380億,2020年為460億,2021年為360億,2022年為390億,2023年為390億。數(shù)據(jù)來源于閱文集團歷年財報。

(3)指在自然語言處理的統(tǒng)計方法中,訓(xùn)練數(shù)據(jù)(語料)有限導(dǎo)致訓(xùn)練得到的統(tǒng)計模型不可靠的現(xiàn)象。如在用戶和內(nèi)容同屬于超大規(guī)模的情況下,具體的單個用戶和內(nèi)容之間普遍缺乏交互,也就使得有效數(shù)據(jù)非常有限。

(4)指數(shù)據(jù)挖掘需要數(shù)據(jù)的積累,而產(chǎn)品初期數(shù)據(jù)為空或者數(shù)據(jù)量太少導(dǎo)致所需的數(shù)據(jù)量達不到要求。如新用戶和新內(nèi)容因缺乏歷史行為而無法精準(zhǔn)畫像。

(5)也被表達為健壯性,可以用于反映一個系統(tǒng)在面臨著內(nèi)部結(jié)構(gòu)或外部環(huán)境的改變時維持其功能穩(wěn)定運行的能力。

(6)〔英〕雷蒙?威廉斯:《關(guān)鍵詞:文化與社會的詞匯》,第355-356頁,劉建基譯,北京,生活·讀書·新知三聯(lián)書店,2005。

(7)魯迅:《文藝的大眾化》,《魯迅全集》第7卷,第367頁,北京,人民文學(xué)出版社,2005。

(8)〔英〕雷蒙·威廉斯:《文化與社會:1780-1950》,第19頁,高曉玲譯,北京,商務(wù)印書館,2018。