电话:56353072
邮箱:zgcafe@163.com
地址:北京市海淀区巨山路188号院1号楼B116-1
2021年第18期 2021.3.3
好未来开源近600小时中英文混合语音数据集 填补教育AI研究空白
北京世纪好未来教育科技有限公司近日开放了一批长达587小时教学场景中的中英文混合语音数据集。此数据集是迄今教育行业最大的语音开源数据集之一,也是目前已知全球较大的中英文混合场景开源数据集,有效填补了中英文混合语音识别研究的数据稀缺空白。
由于行业的天然壁垒,智能教育领域目前开放的数据资源非常有限,而经过清理、标注、注释、结构化的数据,更为少见。作为教育行业内人工智能技术领域的代表企业,好未来很早就开始布局人工智能技术的教育场景落地,也在多年的实践中沉淀了大量优质教育资源和海量教学数据,并推动了多项智慧教育解决方案的落地。同时,作为智慧教育国家新一代人工智能开放创新平台的承建者,好未来肩负着为智慧教育行业关键技术创新提供支撑和服务的使命,将通过开源开放的形式,加速资源共享与技术融合创新。通过建立数据标准和数据服务机制,吸引更多的教育机构和科技企业,开放共享更丰富多元的教育数据,共同构建智慧教育行业生态体系。