【資料圖】
本報記者 李喬宇
3月9日,中文在線在投資者互動平臺上表示,在AI領域3大核心是數據、算力、算法,數據對于如ChatGPT等AI模型的意義重大,高質量的數據資源可讓數據變成資產、變成核心生產力,AI模型的生產內容高度依賴源頭數據。
中文在線方面稱,公司深耕文化數字產業20余年,擁有海量的正版中文數據資源,公司在數據的優勢有4個:第1個是海量,公司擁有的中文文字字數超萬億字,內容品類包含小說類、科普類、社會類、經管類、法律類,教育教材類等等;第2個是高質量,公司擁有的數字內容經過市場長期校驗,已形成高質量的數據內容庫,而高質量的數據可大幅提升模型訓練效果,縮短學習時間和提升學習質量,讓AI模型產出內容穩定;第3個是正版版權,公司自成立之初一直秉承“先授權、后傳播”的原則,高度重視知識產權保護工作,擁有旗下數字內容從數字版權到全部版權的權利,可為AI模型公司提供擁有版權的數據集用于訓練;第4個是完整的各類型商業生態鏈,如公司擁有網絡原創駐站作者440余萬名,可實時反饋最新數據,提供最貼近市場和用戶的最新數據,讓AI模型持續更新學習。未來,公司也將充分發揮公司的數據優勢,持續為行業賦能。
(編輯 張偉)
關鍵詞: