在花
返回时间线
· 17:53 · 已编辑 · 42 条回复 ·

中文互联网基础语料 3.0 正式发布,数据量达 120GB 助力 AI 发展

9 月 18 日,在昆明举行的 2025 年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料 3.0 正式向社会发布。该语料库由中国网络空间安全协会会同国家互联网应急中心等单位协同建设,数据量达到 120GB,进一步扩大了优质中文网站信源范围,并加强了违法不良信息的过滤。用户可通过中国网络空间安全协会网站注册认证后下载相关语料。该语料库将为大模型训练和人工智能技术创新提供有力的数据支持。

新浪科技中国网络空间安全协会

🍀在花频道 🍵茶馆 📮投稿

Telegram 评论区

42 条回复,可以前往 Telegram 继续讨论。

去评论区