logo
0
1
Login

About

中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.

基础语料2.0
Language
JSONL100%
Shell0%
Markdown0%
gitignore0%