公海710

最新发布!查看 MagicData 成品数据集

语种

粤语

数量

866,204条

数据内容

日常用语

数据特点

平行语料

文件格式

TXT

适用领域

自然语言处理

数据敏感项

版权所有者

样例

你漫画看多了吧
你漫画睇多咗啊

没问道怎么说
冇问到哦点讲啊

你能容忍我的一切吗
你能够容忍我嘅一切咩

开源条数

100条

没有找到想要的数据?

联系我们

数据集推荐

MDT-NLP-B003 中英平行语料库

MDT-NLP-F016 中文口语化日常聊天语料库

MDT-NLP-A005 菲律宾口语化日常聊天语料库

MDT-NLP-A035 土耳其语智能家居命令控制语料库

MDT-NLP-F027 中文金融客服话术文本语料库

MDT-NLP-A024 中文儿童读物文本语料库

数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们
Sitemap