以優(yōu)質語言數據滋養(yǎng)清朗網絡空間
近日,中央網信辦印發(fā)通知,在全國范圍內部署開展“清朗·整治惡意挑動負面情緒問題”專項行動,聚焦社交、短視頻、直播等平臺,全面排查話題、榜單、推薦、彈幕、評論等重點環(huán)節(jié),營造更加文明理性的網絡環(huán)境。治理焦點從側重語言文字的規(guī)范使用,轉向關注凈化語言數據環(huán)境,從根本上重塑網絡空間的價值觀生態(tài)。
網絡空間是公眾尤其是青少年獲取信息、形成認知的重要場域,其語言環(huán)境會直接影響社會精神風貌。在當前的輿論場中,不乏一些惡意挑動對立、宣揚暴力戾氣的負面信息。這類內容往往借助標簽化的敘事框架,將復雜的社會現實簡化為非黑即白的二元對立,以情緒宣泄擠壓理性對話的空間。以一度流行的“努力無用論”為例,其話語體系通過系統(tǒng)性解構奮斗價值,將復雜的個體發(fā)展問題,簡單歸因于外部環(huán)境,再借助熱搜詞、網絡熱梗、表情包和語錄段子等易傳播的形式迅速擴散,讓消極化論調引起跟風效仿,不斷消磨公眾的積極心態(tài)。更需警惕的是,這類低質量語言數據正成為訓練新一代人工智能的“原料”,若充斥負面情緒、偏見對立的語言數據被人工智能大量學習,會扭曲其認知模型,使技術發(fā)展偏離服務人類的初衷。
因此,我們需著力增強網民對網絡信息的獲取能力、辨別能力和分析能力,避免被群體非理性的情緒所裹挾。同時要意識到治理網絡負面情緒絕非簡單的堵住問題漏洞,而是一場對人工智能進行“價值對齊”的關鍵訓練。凈化網絡環(huán)境、積累優(yōu)質語言數據,本質上是為未來人工智能的健康發(fā)展提供優(yōu)質養(yǎng)分,是構建文明理性網絡環(huán)境的基礎性工作。
網絡平臺應讓算法推薦機制承載更多社會責任,讓正能量話語表達成為流量主體。在人工智能時代,語言作為一種關鍵的數據資源,其承載的內容深刻影響著國家形象塑造與社會共識凝聚。它不僅傳遞信息,更在無形中定義著我們認知世界的范式與邊界。正因如此,算法作為信息分發(fā)的核心機制,其內嵌的文化立場與價值傾向便不容忽視。將主流價值導向前置性地融入算法設計,已不僅是技術優(yōu)化,更是一種必要的社會責任。這要求算法推薦機制承載更多人文關懷,實現從“流量向導”向“價值向導”的根本性轉變,優(yōu)先推薦理性、深度、充滿正能量的內容,提升權威信息與優(yōu)質內容傳播能見度,并主動打破可能造成認知局限的“信息繭房”。同時,平臺也需加強內容審核,提升對隱蔽性偏見、價值觀誘導等內容的識別能力,從源頭降低言語操縱和輿論失控的風險。唯有讓主流價值成為流量分配的尺度,才能為清朗網絡空間提供持續(xù)而豐沛的價值滋養(yǎng)。
努力推動優(yōu)質語言數據與人工智能技術形成良性循環(huán),是構筑健康網絡生態(tài)的長遠之策。當前,大語言模型正悄然成為塑造網民價值觀、培育文化自信的重要力量。語言是思想的載體,優(yōu)質的語言數據是人工智能學習的精神食糧。大語言模型汲取了富含正能量的優(yōu)質語言數據,便能在交互中持續(xù)輸出理性、建設性觀點,潛移默化地引導公眾思維。網民在搜索信息、獲取知識時,大語言模型生成的積極內容會自然融入其認知體系,在人機互動中促進理性思考。為此,我們應有意識地系統(tǒng)梳理和整合承載中華優(yōu)秀傳統(tǒng)文化、時代精神與科學知識的優(yōu)質內容,形成開放、合規(guī)的高質量數據集,訓練更具包容性、更可靠的大語言模型。內嵌健康價值觀的人工智能模型將不僅僅是信息的提供站,更可成為“正能量的放大器”和“極端情緒的化解者”,其輸出的理性內容會持續(xù)生成新的優(yōu)質語言數據,反過來進一步優(yōu)化大語言模型,形成遞歸效應,使技術進步與人文精神深度融合,讓人工智能成為清朗網絡空間的建設者。
網絡空間是億萬網民的共同精神家園,也是社會理性對話、凝聚廣泛共識的重要平臺。營造清朗健康的網絡生態(tài),離不開優(yōu)質語言數據資源的滋養(yǎng),更有賴于每一位網民的理性參與、網絡平臺的主體責任落實以及政府部門的有效引導與監(jiān)管。當網民以文明表達守護對話底線,平臺以技術創(chuàng)新夯實內容根基,政府以精準治理規(guī)劃發(fā)展軌道,我們定能匯聚起更強大的合力,將互聯網建設成為匯聚共識、激發(fā)共鳴的清朗空間。
(作者:陳麗湘,系教育部語言文字應用研究所副研究員)


