logo
Login
db30
db30
db30_中文互联网基础语料2.0
在中央网信办指导下,中国网络空间安全协会人工智能安全治理专业委员会会同国家互联网应急中心(CNCERT),协调人工智能产、学、研、用单位,共同建设中文互联网语料资源平台,搭建中文互联网语料汇聚、共享语料.
Recent updates
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
Markdown
1200
中文互联网基础语料2.0是中文互联网基础语料系列的第二批语料,主要用于大模型预训练。在中央网信办相关业务部门指导下,中国网络空间安全协会人工智能安全治理专委会会同国家权威机构,持续发挥企业、高校和科研单位协同优势,依托“共建-共享”机制,汇聚一批新的高质量可信数据.
JSONL
1000